شرکت هوش مصنوعی آنتروپیک خانواده جدید مدلهای هوش مصنوعی Claude 3 را رونمایی کرد. این شرکت را چند تن از کارمندان سابق OpenAI تأسیس کردهاند.
بهگزارش تکناک، آنتروپیک مدلهای هوش مصنوعی Claude 3 را رونمایی کرد. بر خلاف نسخههای قبلی، Claude 3 ابزاری چندرسانهای است و ورودیهای متن و عکس را میتواند درک کند. Anthropic میگوید Claude 3 به سؤالات بیشتری جواب میدهد و دستورالعملهای طولانیتری را درک میکند و دقیقتر است.
Claude 3 میتواند زمینه بیشتری را درک کند. این یعنی میتواند اطلاعات بیشتری را پردازش کند. سه مدل Claude 3 Haiku و Claude 3 Sonnet و Claude 3 Opus وجود دارند که Opus بزرگترین و «باهوشترین مدل» است.
Anthropic میگوید که Opus و Sonnet اکنون در claude.ai و API آن دردسترس هستند و Haiku نیز بهزودی منتشر خواهد شد. هر سه مدل را میتوان در چتباتها و تکمیل خودکار و کارهای استخراج داده مستقر کرد.
بهنقل از بلومبرگ، نسخههای قبلی Claude از پاسخدادن به برخی پرسشهای بیخطر خودداری میکردند که بهزعم این شرکت نشاندهنده فقدان درک زمینهای است. مدلهای جدید به احتمال کمتری از پاسخدادن به پرسشهای ناقض خطوط ایمنی خودداری میکنند؛ مشابه شایعاتی درباره برنامههای متا برای Llama 3 در زمان انتشار.
Anthropic ادعا میکند که مدلهای Claude 3 حتی در حین تجزیه مطالب متراکم مانند مقاله تحقیقاتی میتوانند نتایج تقریباً لحظهای ارائه دهند. علاوهبراین، Haiku، کوچکترین نسخه Claude 3، سریعترین و بهصرفهترین مدل موجود در بازار است که مقاله تحقیقاتی حاوی نمودارها و جداول را میتواند در کمتر از سه ثانیه بخواند.
Anthropic میگوید Opus در چندین آزمون بنچمارک از اکثر مدلها عملکرد بهتری داشته است. این مدل استدلال سطح تحصیلات تکمیلی بهتری از GPT-4 شرکت OpenAI نشان داد و در این آزمون با 50/4 درصد نتایج بهتری از GPT-4 (با 35/7 درصد) کسب کرد. همچنین، به سؤالات ریاضی جواب داد و کد نوشت و استدلال را بهتر درک کرد.
نکته مهم دیگر اینکه مدلهای جدید درمقایسهبا مدل قبلی Claude 2.1 بهبود چشمگیری پیدا کردهاند. Sonnet، مدل میانی، دو برابر سریعتر از Claude 2 و Claude 2.1 بود. Anthropic گفت: «این مدل در کارهایی که به پاسخهای سریع نیاز دارند؛ مانند بازیابی دانش یا اتوماسیون فروش، عالی عمل میکند.»
Anthropic مدلهای Claude 3 را روی ترکیبی از مجموعه دادههای داخلی و شخص ثالث غیرعمومی و دادههای دردسترس عموم تا آگوست 2023 آموزش داده است. این شرکت در مقاله معرفی این سه مدل میگوید که آنها با استفاده از سختافزار از سرویس ابری AWS آمازون و گوگل کلود آموزش داده شدهاند.
گوگل و آمازون از سرمایهگذاران Anthropic هستند؛ بهطوریکه آمازون 4 میلیارد دلار در این شرکت سرمایهگذاری کرده است. Claude 3 در کتابخانه مدل Bedrock آمازون و در Vertex AI گوگل دردسترس خواهد بود.