به گفته آیدن گومز مدیرعامل شرکت هوش مصنوعی Cohere، ، دادههای مصنوعی در حال حاضر برای آموزش مدلهای هوش مصنوعی استفاده میشود.
به گزارش تکناک، با شرکتهایی مانند ردیت و توییتر که مبالغ بسیار بالا برای جمعآوری دادههای خود از شرکتها دریافت میکنند، شرکتهای هوش مصنوعی مانند مایکروسافت، OpenAI و Cohere به دادههای مصنوعی روی میآورند.
گومز اعلام کرد که آموزش مدل های هوش مصنوعی با دادههای مصنوعی در حال حاضر بسیار زیاد است، اما به طور گسترده اعلام نمیشود. یکی از مثالهایی که او ذکر کرد، این بود که اگر آنها میخواستند یک مدل در ریاضیات پیشرفته آموزش دهند، میتوانند دو مدل هوش مصنوعی را به عنوان معلم و دانشآموز تنظیم کنند که در آن یک موضوع مانند مثلثات را بررسی کنند و سپس انسانی که در حال مشاهده است، در صورتی که چیزی اشتباه گفته شده باشد، گفتگو را اصلاح میکند.
اگرچه آموزش مدل های هوش مصنوعی با دادههای مصنوعی اتفاق افتاده است و موضوع چندین مقاله پژوهشی بوده است، اما روش اصلی آموزش مدلها با جمعآوری دادهها از اینترنت است که شامل کتابهای دیجیتالی، مقالات خبری، وبلاگها، رسانههای اجتماعی، فلیکر و موارد دیگر است. سپس انسانها بازخورد میدهند و با استفاده از یادگیری تقویتی با بازخورد انسانی، اطلاعات را تکمیل میکنند.
بعضی از مشکلات این روش شامل نقض حق تکثیر و نقض حریم خصوصی هستند که ممکن است باعث بروز مشکلاتی برای شرکتها شوند.
روزنامه Financial Times به مقاله جالبی از شرکت مایکروسافت به نام “کتابهای درسی همه چیزی است که نیاز دارید” اشاره کرد که توضیح میدهد با آموزش یک مدل برای کدنویسی با استفاده از دادههای کیفیت کتابهای درسی، این مدل می تواند به خوبی وظایف کدنویسی را انجام دهد. چیزهای مشابهی با استفاده از زبان نیز میتوان انجام داد که در آن مدل بر روی کلمات و جملات ساده آموزش داده میشود و سپس میتواند داستانهای روان و گرامری صحیحی ایجاد کند.
البته، در حالی که ایجاد دادههای مصنوعی برای آموزش مدلها میتواند منجر به پیشرفت هایی شود، شرکتها همچنین باید مراقب باشند که از دادههای مصنوعی ضعیف استفاده نکنند که ممکن است به مرور زمان منجر به پسرفت شود.
همراه با تکنیک های زنجیره ای فکری که توسط شرکت هایی مانند OpenAI و Anthropic برای کاهش توهمات هوش مصنوعی توسعه داده شده است، داده های مصنوعی احتمالاً می توانند به هوش مصنوعی کمک کنند تا چالش های بیشتری را حل کنیم.