اکنون OpenAI به شما اجازه میدهد تا ربات وب این شرکت را مسدود کنید تا از اسکریپ کردن سایت شما برای آموزش مدلهای GPT جلوگیری شود.
به گزارش تکناک، OpenAI اعلام کرده است که اپراتورهای وب سایت میتوانند به طور خاص از ربات GPTBot در فایل Robots.txt سایت خود جلوگیری کنند یا آدرس IP آن را مسدود کنند.
OpenAI در بلاگ پست خود گفته است: “صفحات وبی که با عامل کاربر GPTBot کرال میشوند، ممکن است برای بهبود مدلهای آینده استفاده شوند و فیلتر شدهاند تا منابعی که نیازمند دسترسی به paywall هستند، اطلاعات شناسایی شخصی را جمعآوری میکنند یا متنی را که با سیاستهای ما در تضاد است، حذف شوند.
برای منابعی که به معیارهای مستثنی شده نمیخورند، اجازه دادن به GPTBot برای دسترسی به سایت شما میتواند به مدلهای هوش مصنوعی کمک کند تا دقت بیشتری پیدا کنند و قابلیتها و امنیت عمومی خود را بهبود بخشند.”
مسدود کردن GPTBot ممکن است اولین قدم در آینده باشد که OpenAI به کاربران اینترنت اجازه دهد از استفاده از دادههایشان برای آموزش مدلهای زبانی بزرگ خود صرفنظر کنند. این اقدام در پی تلاشهای اولیه برای ایجاد یک پرچمی است که محتوا را از آموزش حذف کند، مانند برچسب “NoAI” که توسط DeviantArt در سال گذشته ابداع شد. این اقدام به طور پیشگیرانه محتوایی که قبلاً از یک سایت دریافت شده بود را از دادههای آموزش ChatGPT پاک نمیکند.
اینترنت بخش قابل توجهی از دادههای آموزشی مدلهای زبانی بزرگ مانند مدلهای GPT شرکت OpenAI و بارد شرکت گوگل را فراهم کرده است. با این حال، OpenAI تأیید نمیکند که دادههای خود را از ارسالهای رسانههای اجتماعی، آثار محفوظ شده یا چه قسمتی از اینترنت برای جمعآوری اطلاعات استفاده کرده است. همچنین تامین داده برای آموزش هوش مصنوعی به مرور زمان به شدت مورد بحث و اختلاف نظر قرار گرفته است. سایتهایی از جمله Reddit و Twitter سعی کردهاند محدودیتی بر استفاده آزاد از ارسالهای کاربران خود توسط شرکتهای هوش مصنوعی اعمال کنند، در حالی که نویسندگان و خلاقان دیگر به دلیل استفاده غیرمجاز از آثار خود اقدامات قضایی را آغاز کردهاند. قانونگذاران نیز در جلسات سنا آمریکا درباره تنظیمات مربوط به هوش مصنوعی در ماه گذشته به سؤالات حریم خصوصی و رضایت مردم از استفاده از دادهها پرداختند.
همانطور که گزارش شده است، شرکتهایی مانند Adobe ایده نشانهگذاری دادهها به عنوان غیرقابل استفاده برای آموزش را از طریق یک قانون ضدتقلید ارائه دادهاند. شرکتهای هوش مصنوعی، از جمله OpenAI، یک توافقنامه با کاخ سفید امضا کردهاند تا یک سیستم واترمارکینگ را توسعه دهند که به مردم اعلام کند آیا چیزی توسط هوش مصنوعی تولید شده است یا خیر، اما هیچگونه تعهدی برای قطع استفاده از دادههای اینترنتی برای آموزش ندادهاند.