شرکت میسترال مدلی با نام Pixtral 12B را توسعه داده است که میتواند با انواع مختلف دادهها کار کند. این قابلیت کاربردهای متنوعی در زمینههای مختلف مانند پردازش تصویر و تولید محتوا و ترجمه ماشینی خواهد داشت.
شرکت فرانسوی میسترال (Mistral)، پیشگام در حوزهی هوش مصنوعی، مدل چندوجهی Pixtral 12B را رونمایی کرد. این مدل با بهرهگیری از ۱۲ میلیارد پارامتر و حجم تقریبی ۲۴ گیگابایت، همزمان میتواند تصاویر و متون را پردازش کند. افزایش تعداد پارامترها بهطور مستقیم با بهبود عملکرد مدل در حل مسائل پیچیده مرتبط است.
تککرانچ مینویسد که این مدل جدید برپایهی یکی از مدلهای متنی قدرتمند میسترال، یعنی Nemo 12B، ساخته شده است. Pixtral 12B میتواند به طیف گستردهای از پرسشها دربارهی تصاویر پاسخ دهد. صرفنظر از اینکه آدرس اینترنتی تصویری را ارائه یا تصویر را بهصورت رمزگذاریشدهی Base64 ارسال کنید، این مدل میتواند تعداد دلخواه تصاویر را در اندازههای مختلف پردازش کند.
مشابه مدلهای چندوجهی پیشرفتهای مانند Claude از Anthropic و GPT-4o از OpenAI، مدل Pixtral 12B نیز ازلحاظ تئوری توانایی انجام وظایفی همچون توصیف تصاویر (زیرنویسگذاری) و شمارش اشیاء را دارد.
برای دسترسی به Pixtral 12B، میتوانید ازطریق پلتفرمهای محبوب توسعهی هوش مصنوعی مانند GitHub و Hugging Face اقدام کنید و این مدل را دانلود و تنظیم و در پروژههایتان بهکار ببرید. این مدل با مجوز توسعهی استاندارد میسترال منتشر شده است که استفاده از آن در پژوهشها و کاربردهای دانشگاهی رایگان است. بااینحال، برای کاربردهای تجاری اخذ مجوز پولی الزامی است.
بااینحال، میسترال هنوز جزئیات دقیقی از مجوز استفادهشده برای Pixtral 12B را ارائه نکرده است. این شرکت برخی از مدلهای خود را با مجوز آزاد Apache 2.0 منتشر میکند؛ اما مشخص نیست که Pixtral 12B نیز از همین مجوز پیروی میکند یا خیر.
متأسفانه در زمان نگارش این مطلب، امکان آزمایش مستقیم Pixtral 12B فراهم نبود. افزونبراین، هیچ دمو یا نسخهی آزمایشی کارآمدی از این مدل دردسترس نبود. بااینحال، سوفیا یانگ، رئیس روابط توسعهدهندگان میسترال، با انتشار پستی در شبکهی اجتماعی X (توییتر سابق) اعلام کرده است که Pixtral 12B بهزودی ازطریق پلتفرمهای چتبات و APIهای میسترال (Le Chat و Le Platforme) دردسترس خواهد بود. بنابراین، علاقهمندان میتوانند در آیندهی نزدیک بهصورت عملی با این مدل کار کنند.
اکثر مدلهای مولد هوش مصنوعی، ازجمله مدلهای پیشرفتهی میسترال، برای آموزش خود به حجم عظیمی از دادههای عمومی موجود در وب متکی هستند. این دادهها که اغلب مشمول حق کپیرایت هستند، از منابع مختلفی جمعآوری میشوند.
برخی از شرکتهای توسعهدهندهی این مدلها استفاده از اصل «استفادهی منصفانه» را برای توجیه این عمل بهکار میبرند. باوجوداین، بسیاری از دارندگان حق کپیرایت با این رویکرد مخالفاند و علیه شرکتهای بزرگی مانند OpenAI و میدجرنی اقدامات قانونی را آغاز کردهاند.
Pixtral 12B پس از جذب سرمایهای معادل ۶۴۵ میلیون دلار بهرهبری General Catalyst و رسیدن به ارزش بازار ۶ میلیارد دلاری، وارد بازار شد. میسترال که از حمایت مالی مایکروسافت نیز بهره میبرد، شرکتی جوان و نوپا است که در جامعهی هوش مصنوعی بهعنوان رقیب اروپایی OpenAI شناخته میشود. استراتژی میسترال تاکنون بر انتشار مدلهای منبعباز و ارائهی نسخههای تجاری با قابلیت مدیریت بیشتر و خدمات مشاورهای به شرکتها متمرکز بوده است.