ویکیمدیا با پایگاه داده هوش مصنوعی ویکیداده، به استارتاپها کمک میکند تا از اطلاعات ساختاریافته برای مدلهای هوش مصنوعی استفاده کنند.
به گزارش تکناک، بنیاد ویکیمدیا در اقدامی مهم برای عمومیکردن دسترسی به اطلاعات، از راهاندازی پایگاه داده جدید و سازگار با هوش مصنوعی برای پروژه «ویکیداده» (Wikidata) خبر داد. این ابتکار را شاخه آلمانی ویکیمدیا هدایت میکند و به توسعهدهندگان، بهویژه استارتاپها و تیمهای کوچک، اجازه میدهد تا از گنجینه عظیم دادههای ساختاریافته این پلتفرم برای ساخت مدلهای هوش مصنوعی هوشمندتر و منصفانهتر بهرهبرداری کنند.
برخلاف ویکیپدیا که متنی روایی ارائه میدهد، ویکیداده پایگاه دانش ساختاریافتهای است که اطلاعات را در قالبهای مفهوم برای ماشین ذخیره میکند. برای مثال، درحالیکه صفحه ویکیپدیای داگلاس آدامز، نویسنده شهیر، زندگینامه او را شرح میدهد، مدخل ویکیداده او جزئیاتی مانند نشان تولد (حوت) یا کد شناسایی کتابهایش در کتابخانههای جهان را دربر میگیرد؛ اطلاعاتی که اکنون برای هوش مصنوعی هضمکردنیتر شده است.
ورج مینویسد که این تحول حاصل «پروژه امبدینگ ویکیپدیا» است. تیم مستقر در برلین با استفاده از مدلی زبان بزرگ، ۱۹ میلیون مدخل ویکیداده را به «بردار» (Vectors) تبدیل کرده است. به گفته لیدیا پینتشر، مدیر محصول ویکیداده، این بردارها را میتوان مانند نموداری عظیم تصور کرد که در آن نقاط داده به یکدیگر متصل هستند. برای مثال، داگلاس آدامز هم به مفهوم «انسان» و هم به عناوین کتابهایش متصل میشود. این ساختار به مدلهای هوش مصنوعی اجازه میدهد تا زمینه و روابط معنایی بین اطلاعات را عمیقتر درک کنند.

هدف اصلی پایگاه داده هوش مصنوعی ویکیداده، ایجاد میدان رقابت برابر برای توسعهدهندگان خارج از حلقه ثروتمند غولهای فناوری است. شرکتهایی مانند OpenAI و آنتروپیک منابع کافی برای پردازش و برداری کردن کل ویکیداده را در اختیار دارند؛ اما استارتاپها و تیمهای کوچک از این امکان بیبهرهاند. پینتشر میگوید: «این اقدام درواقع برای دادن مزیت و حداقل یک شانس به آنهاست.»
علاوهبر این، پروژه مذکور به مقابله با سوگیری موجود در مدلهای هوش مصنوعی کمک میکند. اکثر چتباتها موضوعات محبوب و پرتکرار در اینترنت را در اولویت قرار میدهند. دسترسی آسان به دادههای ساختاریافته ویکیداده به سیستمهای هوش مصنوعی کمک میکند تا موضوعات خاص و کمترشناختهشده که در فضای وب نمایندگی گستردهای ندارند، بهتر منعکس کنند.
مدیران پروژه تأکید کردهاند که این تغییرات صرفاً در بخش بکاند اعمال شده است و تجربه کاربری ویکیپدیا برای عموم مردم تغییری نخواهد کرد و این وبسایت به چتبات تبدیل نمیشود. پایگاه داده هوش مصنوعی ویکیداده با همکاری شرکت هوش مصنوعی Jina AI برای تبدیل دادهها و شرکت IBM DataStax برای تأمین زیرساخت ذخیرهسازی رایگان ایجاد شده است. نسخه فعلی شامل دادههای جمعآوریشده تا ۱۸ سپتامبر ۲۰۲۴ است و تیم ویکیمدیا منتظر بازخورد توسعهدهندگان برای بهروزرسانیهای آینده است.