مسدود کردن ربات وب OpenAI امکانپذیر شد

اکنون OpenAI به شما اجازه می‌دهد تا ربات وب این شرکت را مسدود کنید تا از اسکریپ کردن سایت شما برای آموزش مدل‌های GPT جلوگیری شود.

به گزارش تکناک، OpenAI اعلام کرده است که اپراتورهای وب سایت می‌توانند به طور خاص از ربات GPTBot در فایل Robots.txt سایت خود جلوگیری کنند یا آدرس IP آن را مسدود کنند.

OpenAI در بلاگ پست خود گفته است: “صفحات وبی که با عامل کاربر GPTBot کرال می‌شوند، ممکن است برای بهبود مدل‌های آینده استفاده شوند و فیلتر شده‌اند تا منابعی که نیازمند دسترسی به paywall هستند، اطلاعات شناسایی شخصی را جمع‌آوری می‌کنند یا متنی را که با سیاست‌های ما در تضاد است، حذف شوند.

برای منابعی که به معیارهای مستثنی شده نمی‌خورند، اجازه دادن به GPTBot برای دسترسی به سایت شما می‌تواند به مدل‌های هوش مصنوعی کمک کند تا دقت بیشتری پیدا کنند و قابلیت‌ها و امنیت عمومی خود را بهبود بخشند.”

مسدود کردن GPTBot ممکن است اولین قدم در آینده باشد که OpenAI به کاربران اینترنت اجازه دهد از استفاده از داده‌هایشان برای آموزش مدل‌های زبانی بزرگ خود صرف‌نظر کنند. این اقدام در پی تلاش‌های اولیه برای ایجاد یک پرچمی است که محتوا را از آموزش حذف کند، مانند برچسب “NoAI” که توسط DeviantArt در سال گذشته ابداع شد. این اقدام به طور پیشگیرانه محتوایی که قبلاً از یک سایت دریافت شده بود را از داده‌های آموزش ChatGPT پاک نمی‌کند.

اینترنت بخش قابل توجهی از داده‌های آموزشی مدل‌های زبانی بزرگ مانند مدل‌های GPT شرکت OpenAI و بارد شرکت گوگل را فراهم کرده است. با این حال، OpenAI تأیید نمی‌کند که داده‌های خود را از ارسال‌های رسانه‌های اجتماعی، آثار محفوظ شده یا چه قسمتی از اینترنت برای جمع‌آوری اطلاعات استفاده کرده است. همچنین تامین داده برای آموزش هوش مصنوعی به مرور زمان به شدت مورد بحث و اختلاف نظر قرار گرفته است. سایت‌هایی از جمله Reddit و Twitter سعی کرده‌اند محدودیتی بر استفاده آزاد از ارسال‌های کاربران خود توسط شرکت‌های هوش مصنوعی اعمال کنند، در حالی که نویسندگان و خلاقان دیگر به دلیل استفاده غیرمجاز از آثار خود اقدامات قضایی را آغاز کرده‌اند. قانونگذاران نیز در جلسات سنا آمریکا درباره تنظیمات مربوط به هوش مصنوعی در ماه گذشته به سؤالات حریم خصوصی و رضایت مردم از استفاده از داده‌ها پرداختند.

همانطور که گزارش شده است، شرکت‌هایی مانند Adobe ایده نشانه‌گذاری داده‌ها به عنوان غیرقابل استفاده برای آموزش را از طریق یک قانون ضدتقلید ارائه داده‌اند. شرکت‌های هوش مصنوعی، از جمله OpenAI، یک توافقنامه با کاخ سفید امضا کرده‌اند تا یک سیستم واترمارکینگ را توسعه دهند که به مردم اعلام کند آیا چیزی توسط هوش مصنوعی تولید شده است یا خیر، اما هیچگونه تعهدی برای قطع استفاده از داده‌های اینترنتی برای آموزش نداده‌اند.