کلودفلر به جنگ ربات‌های هوش مصنوعی می رود

شرکت کلودفلر، ارائه‌دهندۀ خدمات ابری عمومی، یک ابزار رایگان جدید راه‌اندازی کرده است که از جمع‌آوری داده‌های مشتریان خود برای آموزش هوش مصنوعی جلوگیری می‌کند.

به گزارش تک‌ناک، برخی از ارائه‌دهندگان هوش مصنوعی، از جمله گوگل، OpenAI و اپل، به صاحبان وب‌سایت اجازه می‌دهند تا با اصلاح فایل robots.txt وب‌سایت خود، بات‌هایی را که برای جمع‌آوری داده‌ها و آموزش مدل‌ها استفاده می‌کنند، مسدود سازند. این فایل متنی به بات‌ها می‌گوید که به کدام صفحات وب‌سایت می‌توانند دسترسی داشته باشند. امّا همان‌گونه که کلودفلر در پستی برای اعلام ابزار مبارزه با بات‌های خود اشاره می‌کند، تمام وب‌ربایان هوش مصنوعی به این قوانین احترام نمی‌گذارند.

به نقل از رسانۀ TechCrunch، این شرکت در وبلاگ رسمی خود می‌نویسد:

«مشتریان نمی‌خواهند بات‌های هوش مصنوعی از وب‌سایت‌هایشان بازدید کنند، به‌ویژه آنهایی که این کار را به طور غیرقانونی انجام می‌دهند.» «ما نگرانیم که برخی از شرکت‌های هوش مصنوعی که قصد دور زدن قوانین برای دسترسی به محتوا را دارند، به‌طور مداوم برای فرار از تشخیص بات‌ها سازگار شوند.»

بنابراین، کلودفلر برای رفع این مشکل، ترافیک بات‌های هوش مصنوعی و خزنده‌ها را برای تنظیم دقیق مدل‌های تشخیص خودکار بات‌ها تجزیه و تحلیل کرد. این مدل‌ها علاوه بر عوامل دیگر، در نظر می‌گیرند که آیا یک بات هوش مصنوعی ممکن است با تقلید ظاهر و رفتار شخصی که از یک مرورگر وب استفاده می‌کند، سعی در فرار از تشخیص داشته باشد. شرکت کلودفلر در این باره می‌نویسد:

«هنگامی که عوامل مخرب در مقیاس وسیع اقدام به خزیدن وب‌سایت‌ها می‌کنند، اغلب از ابزارها و چارچوب‌هایی استفاده می‌کنند که ما قادر به ردیابی اثر انگشت آنها هستیم.» «بر اساس این سیگنال‌ها، مدل‌های ما می‌توانند ترافیک ناشی از بات‌های هوش مصنوعی فرارکننده را به عنوان بات‌ها پرچم‌گذاری کنند.»

کلودفلر فرمی را برای میزبانان در راستای گزارش مشکوک شدن به بات‌های هوش مصنوعی و خزنده‌ها ایجاد کرده است و می‌گوید که به مرور زمان به لیست سیاه دستی بات‌های هوش مصنوعی ادامه خواهد داد.

با رونق هوش مصنوعی تولیدکننده و افزایش تقاضا برای داده‌های آموزش مدل، مشکل بات‌های هوش مصنوعی به شدت مورد توجه قرار گرفته است.

بسیاری از وب‌سایت‌ها که از آموزش مدل‌ها بر روی محتوای خود توسط ارائه‌دهندگان هوش مصنوعی بدون اطلاع یا جبران خسارت به آنها بیم دارند، تصمیم به مسدود کردن وب‌ربایان و خزنده‌های هوش مصنوعی گرفته‌اند. بر اساس یک مطالعه، حدود 26 درصد از 1000 وب‌سایت برتر وب، بات OpenAI را مسدود کرده‌اند و مطالعۀ دیگری مسدودسازی این بات توسط بیش از 600 ناشر اخبار را نشان داد.

با وجود این، مسدود کردن یک راه‌حل قطعی نیست. همان‌طور که قبلاً اشاره شد، به نظر می‌رسد برخی از ارائه‌دهندگان برای به دست آوردن مزیت رقابتی در هوش مصنوعی، از قوانین استاندارد حذف بات‌ها چشم‌پوشی می‌کنند. به تازگی موتور جستجوی هوش مصنوعی Perplexity متهم به جعل هویت بازدیدکنندگان مشروع برای وب‌ربایی محتوا از وب‌سایت‌ها شده است و گفته می‌شود OpenAI و Anthropic گاهی اوقات قوانین robots.txt را نادیده گرفته‌اند.

شرکت نوپای صدور مجوز محتوا، TollBit، در ماه گذشته در نامه‌ای به ناشران اعلام کرد که در واقع «بسیاری از عوامل هوش مصنوعی» استاندارد robots.txt را نادیده می‌گیرند.

ابزارهایی مانند ابزار کلودفلر می‌توانند مفید باشند، امّا تنها در صورتی که در تشخیص بات‌های هوش مصنوعی پنهانی دقیق عمل کنند. هر چند آنها مشکل پیچیده‌تر ناشران را که ریسک به خطر افتادن ترافیک ارجاعی از ابزارهای هوش مصنوعی مانند Google AI Overviews را دارند، حل نمی‌کنند. این ابزارها وب‌سایت‌هایی را که خزنده‌های خاص هوش مصنوعی را مسدود می‌سازند، از فهرست خود حذف می‌کنند.