رونمایی از GPT-4 با قابلیت های باور نکردنی

شرکت OpenAI مدل زبانی هوش مصنوعی چندوجهی بزرگ خود به نام GPT-4 را با قابلیت های ویژه و باور نکردنی رونمایی کرد.

به گزارش تکناک، این مدل قادر است همزمان ورودی‌های متنی و تصویری را قبول کند و خروجی متنی با کیفیتی ارائه دهد که در معیارهای مختلف حرفه‌ای و دانشگاهی به عملکرد سطح انسانی می‌رسد.همچنین مایکروسافت اعلام کرد که سرویس چت بینگ همیشه با استفاده از مدل GPT-4 فعال بوده است.

اگر GPT-4 به شکلی که OpenAI مدعی است عمل کند، ممکن است نشان‌دهنده آغاز یک دوره جدید و پیشرفته در عرصه هوش مصنوعی باشد. در اطلاعیه‌ای که OpenAI منتشر کرده است، آمده است که GPT-4 در یک آزمون شبیه‌سازی شده وکالت نمره‌ای به دست آورده که در 10 درصد بالای شرکت‌کنندگان قرار می‌گیرد. این در حالی است که نمره GPT-3.5 در 10 درصد پایین شرکت‌کنندگان بود.

🤯🤯Well this is something else.
GPT-4 passes basically every exam. And doesn't just pass…
The Bar Exam: 90%
LSAT: 88%
GRE Quantitative: 80%, Verbal: 99%
Every AP, the SAT… pic.twitter.com/zQW3k6uM6Z
— Ethan Mollick (@emollick) March 14, 2023

OpenAI در نظر دارد توانایی متنی GPT-4 را از طریق ChatGPT و API تجاری خود عرضه کند. اما در ابتدا، علاقه‌مندان باید در لیست انتظار ثبت‌نام کنند. در حال حاضر، GPT-4 برای اعضای ChatGPT Plus قابل دسترسی است. علاوه بر این، OpenAI در حال همکاری با سازنده برنامه Be My Eyes است تا قابلیت پردازش تصویری GPT-4 را آزمایش کند. Be My Eyes یک اپلیکیشن هوشمند است که می‌تواند صحنه‌ها را شناسایی و توصیف کند.

OpenAI به همراه وب سایت معرفی ، یک مقاله فنی را نیز منتشر کرد که در آن قابلیت های GPT-4 و یک کارت مدل سیستمی که محدودیت های آن را به تفصیل توضیح می داد، ارائه کرد.

GPT-4، مخفف “Generative Pre-trained Transformer 4″، نسل جدیدی از مدل‌های هوش مصنوعی زبانی توسعه‌یافته‌ای است که توسط شرکت OpenAI ساخته شده است. این مدل بر پایه‌ معماری ترانسفورمر پیش‌آموزش‌دیده عمل می‌کند و قدرت قابل توجهی در تولید متن و پاسخ‌دهی به سوالات دارد.

مدل‌های هوش مصنوعی در سری GPT آموزش دیده‌اند تا با استفاده از متون بزرگی که عمدتاً از اینترنت برداشت شده است، توکن بعدی (یک قطعه از یک کلمه) را در یک دنباله از توکن‌ها پیش‌بینی کنند. در طول آموزش شبکه عصبی یک مدل آماری ساخته می‌شود که نماینده‌ ارتباطات بین کلمات و مفاهیم است. به مرور زمان، OpenAI اندازه و پیچیدگی هر مدل GPT را افزایش داده است که در نتیجه منجر به بهبود عملکرد کلی مدل‌ها نسبت به روش انسان در تکمیل متن در یک سناریو مشابه شده است. با این حال، این پیشرفت‌ها بسته به نوع وظیفه محوله به مدل هوش مصنوعی متغیر است.

تا آنجا که به انجام وظایف مربوط می شود، عملکرد GPT-4 بسیار قابل توجه است. GPT-4 مانند نسخه‌های قبلی خود، قادر است دستورالعمل‌های پیچیده را در زبان طبیعی دنبال کند و آثار فنی یا خلاقانه‌ای تولید کند، اما با عمق بیشتری این کار را انجام می‌دهد: این مدل تا 32768 توکن (حدوداً 25000 کلمه متن) را در تولید و پردازش پشتیبانی می‌کند. این توانایی امکان ایجاد محتوایی یا تجزیه و تحلیل اسنادی طولانی‌تر را در مقایسه با مدل‌های قبلی فراهم می‌آورد.

مدل زبانی هوش مصنوعی GPT-4 نسبت به نسل قبلی خود (GPT-3.5)، عملکرد بهتری در درک متن‌ها و سوالات ارائه می‌دهد و توانایی پردازش تصاویر را نیز دارد. این ویژگی‌ها باعث شده GPT-4 بتواند در موارد متنوعی مانند ترجمه، خلاصه‌سازی متن، تولید مقالات، پاسخ‌گویی به سوالات، و توصیف تصاویر به کار برده شود. برخی از بهبودهای GPT-4 نیز شامل تشخیص بهتر نیازهای زبانی و اصطلاحات پیچیده می‌شود.

Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023

GPT-4 با توجه به توانایی‌های چندوجهی خود، می‌تواند در بسیاری از زمینه‌ها و کاربردهای مختلف کارآمد باشد.قابلیت‌های چندوجهی GPT-4 شامل توانایی‌های گوناگونی است که به مدل اجازه می‌دهد با انواع ورودی‌ها کار کند و در موضوعات مختلف عملکرد خوبی از خود نشان دهد. در مورد قابلیت‌های چندوجهی آن (که هنوز به یک پیش‌نمایش تحقیقاتی محدود می‌شود)، GPT-4 می‌تواند محتوای چندین تصویر را تجزیه و تحلیل کند و آنها را معنا کند، مانند درک یک جوک از چند تصویر متوالی یا استخراج اطلاعات از یک نمودار. در مورد قابلیت‌های چندوجهی آن (که هنوز به یک پیش‌نمایش تحقیقاتی محدود می‌شود)، GPT-4 می‌تواند محتوای چندین تصویر را تجزیه و تحلیل کند و آنها را معنا کند، مانند درک یک جوک چند تصویری یا استخراج اطلاعات از یک نمودار.

برخی از قابلیت‌های چند وجهی GPT-4 عبارت‌اند از:

درک زبان طبیعی (NLP): GPT-4 می‌تواند متون مختلف را درک کرده و به سوالات پاسخ دهد، خلاصه‌سازی کند، متون را بازنویسی کرده و ترجمه کند.

تولید محتوا: این مدل می‌تواند مقالات، داستان‌ها، شعر و متون خلاقانه‌ی دیگر را با کیفیت بالا تولید کند.

حل مسائل منطقی و ریاضی: GPT-4 می‌تواند سوالات منطقی و ریاضی را حل کرده و توضیحات مربوط به آن‌ها را ارائه دهد.

توانایی درک تصویری: GPT-4 نسبت به نسخه‌های قبلی خود، توانایی پردازش تصاویر و ارائه توضیحات مرتبط با آن‌ها را دارد.

همکاری با سایر سیستم‌ها: GPT-4 می‌تواند با سیستم‌های دیگر همکاری کرده و در محیط‌های متنوعی به‌عنوان یک رابط کاربری زبان طبیعی عمل کند.

برنامه‌نویسی: این مدل می‌تواند کدنویسی را در زبان‌های برنامه‌نویسی مختلف انجام دهد و به سوالات مربوط به برنامه‌نویسی پاسخ دهد.

تفاوت‌های میان GPT-4 و GPT-3.5 عبارتند از:

عملکرد بهتر: GPT-4 نسبت به GPT-3.5 توانایی بهتری در درک و پاسخ به متن‌ها و سوالات دارد. به عنوان مثال، GPT-4 در آزمون‌های شبیه‌سازی شده وکالت نمره‌ای کسب کرده که در 10 درصد بالای شرکت‌کنندگان قرار می‌گیرد، در حالی که نمره GPT-3.5 در 10 درصد پایین شرکت‌کنندگان بود.

پردازش تصویری: در حالی که GPT-3.5 تنها به متن‌ها واکنش نشان می‌دهد، GPT-4 قابلیت درک و پردازش تصاویر را نیز دارد. این امکان به GPT-4 اجازه می‌دهد تا براساس تصاویر ورودی نیز پاسخ‌های مرتبط و مناسبی ارائه کند.

بهبود جنبه‌های زبانی: GPT-4 نسبت به GPT-3.5 توانایی پیشرفته‌تری در تشخیص نیازهای زبانی، اصطلاحات و مفاهیم پیچیده دارد. این بهبودها موجب شده است که GPT-4 بهتر بتواند جملات و پاراگراف‌های متن را بازنویسی کند و خلاصه‌های مناسب‌تری از متن‌ها ارائه دهد.

کارایی و بهینگی: با وجود افزایش قابلیت‌ها و عملکرد GPT-4، این مدل نیز بهینه‌سازی‌هایی در زمینه کارایی و مصرف منابع انجام داده است. این بهبودها موجب می‌شود که GPT-4 سریع‌تر و با کمترین مصرف انرژی به نتایج دست پیدا کند.

توجه داشته باشید که این تفاوت‌ها براساس اطلاعات منتشر شده توسط OpenAI است و ممکن است در عمل به موارد دیگری نیز بپردازد.

رایلی گودساید، مهندس ارشد prompt در شرکت Scale AI، در حین بررسی قابلیت‌های چندوجهی GPT-4 به “AGI” (هوش مصنوعی کلی) اشاره کرد و اندریج کارپاتی، کارمند OpenAI، از توانایی GPT-4 در حل یک آزمون که او در سال 2012 در مورد مدل هوش مصنوعی درک عکس‌های خنده‌دار پیشنهاد کرده بود، شگفت‌زده شد.

OpenAI اعلام کرده است که هدف آن توسعه هوش مصنوعی کلی (AGI) است که بتواند در هر کار ذهنی جایگزین انسان‌ها شود، اگرچه GPT-4 هنوز در این سطح نیست. بلافاصله پس از اعلام GPT-4، مدیر عامل OpenAI، سام آلتمن، در توییتی نوشت: این مدل هنوز نقاط ضعفی دارد، هنوز محدود است و هنگامی که بیشتر با آن کار می‌کنید، نسبت به اولین استفاده‌اش کمتر تاثیرگذار به نظر می‌رسد.

GPT-4 بسیار عالی است. اما هنوز هم سوگیری‌های موجود در مجموعه داده آموزشی خود را در خروجی هایش منعکس می‌کند، توهم ایجاد می‌کند (دروغ‌های قابل قبولی را می‌سازد)، و به طور بالقوه می‌تواند اطلاعات نادرست یا توصیه‌های مضر ایجاد کند.

دیدگاه‌ها 2

ayube says:
3 سال پیش
اکثر شرکتهای آمریکایی در حال ورشکسته شدن هستند .
در حال تعدیل نیرو می باشند .
این کارها تنفس مصنوعی هم حساب نمی شود .
حتی بانکهای آمریکایی و انگلیسی در حال فروپاشی هستند .
رکود سال 2008 دوباره بر آمریکا حاکم شد .
آمریکا باید دنبال حنگ جدیدی باشد تا بتواند از فروپاشی ایالات خود ، جلوگیری نماید .
پاسخ
- حسین رئیسی says:
  3 سال پیش
  اوکی فقط من کارت ملی هوشمند هنوز نگرفتم
  پاسخ