متا مدل جدیدی از هوش مصنوعی منتشر کرده است که در صورت درخواست، می تواند هر شی را در یک تصویر شناسایی کند. همچنین می تواند آنها را بر اساس متن وارد شده در مدل انتخاب کند.
به گزارش تکناک، این ابزار با نام Segment Anything، بر روی اصول شناسایی پیکسل های تصویر متعلق به یک شی کار می کند. به عنوان یک پروژه راه اندازی شده است. این ابزار تنها شامل مدل نمی شود، بلکه شامل یک وظیفه و مجموعه داده به عنوان بخشی از مقاله تحقیقاتی خود میشود.
خود مدل، Segment Anything Model (SAM)، و مجموعه داده، Segment Anything 1-Billion mask dataset (SA-1B) نامیده میشود و متا آن را به عنوان بزرگترین مجموعه دادههای تقسیمبندی تا کنون تا مجموعه وسیعی از برنامه های کاربردی معرفی میکند. مجموعه داده برای اهداف تحقیقاتی و تحت یک گواهی مجاز باز (Apache 2.0) در دسترس خواهد بود.
متا فراتر رفته و می گوید SAM می تواند برای تقویت برنامه های نیازمند جستجو و تقسیم بندی هر شی در هر تصویر در دامنه های متعدد استفاده شود. خود این مدل نیز میتواند در آینده به جزئی از هوش مصنوعی با قابلیت دسترسی گستردهتر تبدیل شود و برای تقویت برنامههای واقعیت افزوده و واقعیت مجازی، انتخاب اشیا بر اساس مسیر نگاه کاربر، مورد استفاده قرار گیرد.
از فناوری مبتنی بر SAM در حال حاضر در متا، بهویژه در فیسبوک و اینستاگرام برای تعدیل محتوای ممنوعه عکسهای برچسبگذاری شده کاربران و همچنین تغذیه الگوریتمهای تعیین کننده نمایش پستها به کاربران استفاده میشود.
متا یک نسخه نمایشی از این مدل را به منظور بررسی شخصی تواناییهای این هوش مصنوعی توسط افراد مختلف راه اندازی کرده است.