شرکت OpenAI مدل زبانی هوش مصنوعی چندوجهی بزرگ خود به نام GPT-4 را با قابلیت های ویژه و باور نکردنی رونمایی کرد.
به گزارش تکناک، این مدل قادر است همزمان ورودیهای متنی و تصویری را قبول کند و خروجی متنی با کیفیتی ارائه دهد که در معیارهای مختلف حرفهای و دانشگاهی به عملکرد سطح انسانی میرسد.همچنین مایکروسافت اعلام کرد که سرویس چت بینگ همیشه با استفاده از مدل GPT-4 فعال بوده است.
اگر GPT-4 به شکلی که OpenAI مدعی است عمل کند، ممکن است نشاندهنده آغاز یک دوره جدید و پیشرفته در عرصه هوش مصنوعی باشد. در اطلاعیهای که OpenAI منتشر کرده است، آمده است که GPT-4 در یک آزمون شبیهسازی شده وکالت نمرهای به دست آورده که در 10 درصد بالای شرکتکنندگان قرار میگیرد. این در حالی است که نمره GPT-3.5 در 10 درصد پایین شرکتکنندگان بود.
🤯🤯Well this is something else.
GPT-4 passes basically every exam. And doesn't just pass…
The Bar Exam: 90%
LSAT: 88%
GRE Quantitative: 80%, Verbal: 99%
Every AP, the SAT… pic.twitter.com/zQW3k6uM6Z— Ethan Mollick (@emollick) March 14, 2023
OpenAI در نظر دارد توانایی متنی GPT-4 را از طریق ChatGPT و API تجاری خود عرضه کند. اما در ابتدا، علاقهمندان باید در لیست انتظار ثبتنام کنند. در حال حاضر، GPT-4 برای اعضای ChatGPT Plus قابل دسترسی است. علاوه بر این، OpenAI در حال همکاری با سازنده برنامه Be My Eyes است تا قابلیت پردازش تصویری GPT-4 را آزمایش کند. Be My Eyes یک اپلیکیشن هوشمند است که میتواند صحنهها را شناسایی و توصیف کند.
OpenAI به همراه وب سایت معرفی ، یک مقاله فنی را نیز منتشر کرد که در آن قابلیت های GPT-4 و یک کارت مدل سیستمی که محدودیت های آن را به تفصیل توضیح می داد، ارائه کرد.
GPT-4، مخفف “Generative Pre-trained Transformer 4″، نسل جدیدی از مدلهای هوش مصنوعی زبانی توسعهیافتهای است که توسط شرکت OpenAI ساخته شده است. این مدل بر پایه معماری ترانسفورمر پیشآموزشدیده عمل میکند و قدرت قابل توجهی در تولید متن و پاسخدهی به سوالات دارد.
مدلهای هوش مصنوعی در سری GPT آموزش دیدهاند تا با استفاده از متون بزرگی که عمدتاً از اینترنت برداشت شده است، توکن بعدی (یک قطعه از یک کلمه) را در یک دنباله از توکنها پیشبینی کنند. در طول آموزش شبکه عصبی یک مدل آماری ساخته میشود که نماینده ارتباطات بین کلمات و مفاهیم است. به مرور زمان، OpenAI اندازه و پیچیدگی هر مدل GPT را افزایش داده است که در نتیجه منجر به بهبود عملکرد کلی مدلها نسبت به روش انسان در تکمیل متن در یک سناریو مشابه شده است. با این حال، این پیشرفتها بسته به نوع وظیفه محوله به مدل هوش مصنوعی متغیر است.
تا آنجا که به انجام وظایف مربوط می شود، عملکرد GPT-4 بسیار قابل توجه است. GPT-4 مانند نسخههای قبلی خود، قادر است دستورالعملهای پیچیده را در زبان طبیعی دنبال کند و آثار فنی یا خلاقانهای تولید کند، اما با عمق بیشتری این کار را انجام میدهد: این مدل تا 32768 توکن (حدوداً 25000 کلمه متن) را در تولید و پردازش پشتیبانی میکند. این توانایی امکان ایجاد محتوایی یا تجزیه و تحلیل اسنادی طولانیتر را در مقایسه با مدلهای قبلی فراهم میآورد.
مدل زبانی هوش مصنوعی GPT-4 نسبت به نسل قبلی خود (GPT-3.5)، عملکرد بهتری در درک متنها و سوالات ارائه میدهد و توانایی پردازش تصاویر را نیز دارد. این ویژگیها باعث شده GPT-4 بتواند در موارد متنوعی مانند ترجمه، خلاصهسازی متن، تولید مقالات، پاسخگویی به سوالات، و توصیف تصاویر به کار برده شود. برخی از بهبودهای GPT-4 نیز شامل تشخیص بهتر نیازهای زبانی و اصطلاحات پیچیده میشود.
Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023
GPT-4 با توجه به تواناییهای چندوجهی خود، میتواند در بسیاری از زمینهها و کاربردهای مختلف کارآمد باشد.قابلیتهای چندوجهی GPT-4 شامل تواناییهای گوناگونی است که به مدل اجازه میدهد با انواع ورودیها کار کند و در موضوعات مختلف عملکرد خوبی از خود نشان دهد. در مورد قابلیتهای چندوجهی آن (که هنوز به یک پیشنمایش تحقیقاتی محدود میشود)، GPT-4 میتواند محتوای چندین تصویر را تجزیه و تحلیل کند و آنها را معنا کند، مانند درک یک جوک از چند تصویر متوالی یا استخراج اطلاعات از یک نمودار. در مورد قابلیتهای چندوجهی آن (که هنوز به یک پیشنمایش تحقیقاتی محدود میشود)، GPT-4 میتواند محتوای چندین تصویر را تجزیه و تحلیل کند و آنها را معنا کند، مانند درک یک جوک چند تصویری یا استخراج اطلاعات از یک نمودار.
برخی از قابلیتهای چند وجهی GPT-4 عبارتاند از:
درک زبان طبیعی (NLP): GPT-4 میتواند متون مختلف را درک کرده و به سوالات پاسخ دهد، خلاصهسازی کند، متون را بازنویسی کرده و ترجمه کند.
تولید محتوا: این مدل میتواند مقالات، داستانها، شعر و متون خلاقانهی دیگر را با کیفیت بالا تولید کند.
حل مسائل منطقی و ریاضی: GPT-4 میتواند سوالات منطقی و ریاضی را حل کرده و توضیحات مربوط به آنها را ارائه دهد.
توانایی درک تصویری: GPT-4 نسبت به نسخههای قبلی خود، توانایی پردازش تصاویر و ارائه توضیحات مرتبط با آنها را دارد.
همکاری با سایر سیستمها: GPT-4 میتواند با سیستمهای دیگر همکاری کرده و در محیطهای متنوعی بهعنوان یک رابط کاربری زبان طبیعی عمل کند.
برنامهنویسی: این مدل میتواند کدنویسی را در زبانهای برنامهنویسی مختلف انجام دهد و به سوالات مربوط به برنامهنویسی پاسخ دهد.
تفاوتهای میان GPT-4 و GPT-3.5 عبارتند از:
عملکرد بهتر: GPT-4 نسبت به GPT-3.5 توانایی بهتری در درک و پاسخ به متنها و سوالات دارد. به عنوان مثال، GPT-4 در آزمونهای شبیهسازی شده وکالت نمرهای کسب کرده که در 10 درصد بالای شرکتکنندگان قرار میگیرد، در حالی که نمره GPT-3.5 در 10 درصد پایین شرکتکنندگان بود.
پردازش تصویری: در حالی که GPT-3.5 تنها به متنها واکنش نشان میدهد، GPT-4 قابلیت درک و پردازش تصاویر را نیز دارد. این امکان به GPT-4 اجازه میدهد تا براساس تصاویر ورودی نیز پاسخهای مرتبط و مناسبی ارائه کند.
بهبود جنبههای زبانی: GPT-4 نسبت به GPT-3.5 توانایی پیشرفتهتری در تشخیص نیازهای زبانی، اصطلاحات و مفاهیم پیچیده دارد. این بهبودها موجب شده است که GPT-4 بهتر بتواند جملات و پاراگرافهای متن را بازنویسی کند و خلاصههای مناسبتری از متنها ارائه دهد.
کارایی و بهینگی: با وجود افزایش قابلیتها و عملکرد GPT-4، این مدل نیز بهینهسازیهایی در زمینه کارایی و مصرف منابع انجام داده است. این بهبودها موجب میشود که GPT-4 سریعتر و با کمترین مصرف انرژی به نتایج دست پیدا کند.
توجه داشته باشید که این تفاوتها براساس اطلاعات منتشر شده توسط OpenAI است و ممکن است در عمل به موارد دیگری نیز بپردازد.
رایلی گودساید، مهندس ارشد prompt در شرکت Scale AI، در حین بررسی قابلیتهای چندوجهی GPT-4 به “AGI” (هوش مصنوعی کلی) اشاره کرد و اندریج کارپاتی، کارمند OpenAI، از توانایی GPT-4 در حل یک آزمون که او در سال 2012 در مورد مدل هوش مصنوعی درک عکسهای خندهدار پیشنهاد کرده بود، شگفتزده شد.
OpenAI اعلام کرده است که هدف آن توسعه هوش مصنوعی کلی (AGI) است که بتواند در هر کار ذهنی جایگزین انسانها شود، اگرچه GPT-4 هنوز در این سطح نیست. بلافاصله پس از اعلام GPT-4، مدیر عامل OpenAI، سام آلتمن، در توییتی نوشت: این مدل هنوز نقاط ضعفی دارد، هنوز محدود است و هنگامی که بیشتر با آن کار میکنید، نسبت به اولین استفادهاش کمتر تاثیرگذار به نظر میرسد.
GPT-4 بسیار عالی است. اما هنوز هم سوگیریهای موجود در مجموعه داده آموزشی خود را در خروجی هایش منعکس میکند، توهم ایجاد میکند (دروغهای قابل قبولی را میسازد)، و به طور بالقوه میتواند اطلاعات نادرست یا توصیههای مضر ایجاد کند.
اکثر شرکتهای آمریکایی در حال ورشکسته شدن هستند .
در حال تعدیل نیرو می باشند .
این کارها تنفس مصنوعی هم حساب نمی شود .
حتی بانکهای آمریکایی و انگلیسی در حال فروپاشی هستند .
رکود سال 2008 دوباره بر آمریکا حاکم شد .
آمریکا باید دنبال حنگ جدیدی باشد تا بتواند از فروپاشی ایالات خود ، جلوگیری نماید .
اوکی فقط من کارت ملی هوشمند هنوز نگرفتم