نگاهی به دستاوردهای هوش مصنوعی گوگل در سال 2023

سال ۲۰۲۳ با تمام فرازونشیب‌هایش برای شرکت‌های فعال در حوزه هوش مصنوعی رو به پایان است. در این مطلب، دستاوردهای هوش مصنوعی گوگل در سال ۲۰۲۳ را مرور می‌کنیم.

به‌گزارش تک‌ناک، سال 2023 به‌عنوان دوره‌ای مهم و تحول‌آفرین در تاریخ فناوری هوش مصنوعی شناخته شده است. ChatGPT که در اواخر سال 2022 رونمایی شد، تأثیر شگرفی بر جهان گذاشت و انگیزه‌ای شد تا شرکت‌های فناوری بزرگ در سال 2023 تمرکز خود را بر هوش مصنوعی قرار دهند. گوگل نیز از این قاعده مستثنا نبود و مجموعه‌ای از پروژه‌های هوش مصنوعی را برای اندروید و سری پیکسل و گوگل ورک‌اسپیس معرفی کرد.

در ماه می و طی کنفرانس Google I/O، نگاهی اجمالی به این پروژه‌ها انداختیم. باوجوداین حالا که سال 2023 رو به‌ پایان است، با نگاهی به گذشته، این ایده‌ها را مرور و دستاوردها و پیشرفت‌های گوگل درزمینه هوش مصنوعی را بررسی می‌کنیم.

01
از 09
گوگل بارد (Google Bard)

درست پس از اینکه ChatGPT توانست خود را به‌عنوان ابزاری مناسب برای دردسترس قراردادن قابلیت‌های نامحدود هوش مصنوعی به مصرف‌کنندگان معرفی کند، گوگل در مارس امسال Bard را معرفی کرد. Bard مانند ChatGPT چت‌باتی گفت‌گومحور است که از مدل زبان گفت‌وگویی گوگل، یعنی LaMDA بهره می‌برد. با اینکه بارد ممکن است پاسخی سریع به پیشرفت‌های OpenAI به‌نظر برسد و باتوجه‌به زمان‌بندی رونمایی Gemini در همین سال، این فرضیه ممکن است درست باشد، واقعیت این است که سال‌ها در دست توسعه بوده است.

توانایی‌های Bard شامل درک و تفسیر زبان طبیعی انسان‌ها و انجام گفت‌وگو و نمایش درک موقعیتی می‌شود. علاوه‌براین، بارد با دسترسی به اطلاعات به‌روز، برتری‌هایی بر نسخه رایگان ChatGPT دارد. گوگل با بهبود Bard ازطریق LaMDA2، آن را به ابزاری حتی قدرتمندتر برای پاسخ به کنجکاوی‌های گسترده کاربران درباره موضوعاتی نظیر حسابداری تا اندروید و از Prometheus تا پلانکتون تبدیل کرده است. تازه در همین ماه، گوگل با به‌روزرسانی بارد به جمینای، آن را برای رقابت با ChatGPT نسخه 4، راه‌اندازی کرده است.

02
از 09
Search Generative Experience

فراتر از کنجکاوی صرف، جست‌وجوی گوگل پیشرو در ارائه‌های این شرکت است و تعجبی ندارد که در سال 2023، هوش مصنوعی نقش عمده‌ای در تجربه کاربری جست‌وجو ایفا کرد. اگرچه Bard می‌تواند به‌خوبی ازپس پاسخ به پرسش‌ها بربیاید، هنوز به پیشرفت‌هایی در دقت و استدلال منطقی نیاز دارد. علاوه‌براین، جست‌وجوی گوگل با ارائه مستقیم نتایج وب، مزیت اضافی درمقایسه‌با بارد دارد که تنها درصورت درخواست به چنین اطلاعاتی دسترسی پیدا می‌کند.

با ادغام قابلیت‌های هوش مصنوعی تولیدی مانند Bard در جست‌وجو، گوگل تجربه‌ای نوین از جست‌وجوی تولیدی را ازطریق برنامه Search Labs معرفی کرده است. این تجربه که طبق نامش کاملاً آزمایشی است، به‌طور گسترده‌ای به زبان انگلیسی دسترسی دارد.

قابلیت SGE قبل از پیوندهای وب در صفحه نتایج جست‌وجو قرار می‌گیرد و تکه‌هایی از اطلاعات را ارائه می‌دهد که به‌طور خلاصه به پرسش‌ها پاسخ می‌دهند. این خلاصه‌ها ممکن است همیشه دقیق نباشند؛ اما گوگل نیز ردیفی از سؤالات پیگیری را برای ارائه جواب سریع اضافه کرده است؛ درست مشابه کاری که می‌توان با Bard انجام داد. اگر به مطالعه خلاصه‌های تولیدی علاقه ندارید، از آن‌ها به‌سادگی می‌توانید عبور کنید و به مرور پیوندهای وب ادامه دهید.

03
از 09
جمینای (Gemini)

در تلاش برای پیداکردن جایگزین‌هایی قدرتمند برای LaMDA2 و رقابت با مدل زبان GPT-4 از OpenAI، گوگل مدل Gemini را توسعه داد. این مدل عمدتاً بر کسب‌وکارها متمرکز است؛ اما دو ویژگی منحصربه‌فردش انتظارات را برای امکانات چندمنظوره آن در آستانه‌ی ورود به سال 2024 افزایش داده است؛ حتی اگر نمایش ویدئویی که هنگام راه‌اندازی ارائه شد، کاملاً شفاف نبود.

اولین ویژگی بارز جمینای چندحالته‌بودن آن است. این یعنی ترکیبی از درخواست‌های متن و صدا و رسانه‌های تصویری را می‌تواند پردازش کند. این قابلیت گویی قدرت فراوانی را به هوش مصنوعی اعطا و امکان درک اطلاعات را شبیه به انسانی فراهم می‌کند که از تمامی حواس خود بهره می‌برد. دومین ویژگی اندازه‌های متنوعی است که Gemini در آن‌ها موجود است؛ به‌اصطلاح نانو و حرفه‌ای و فوق‌العاده. کوچک‌ترین مدل، جمینای نانو، روی پیکسل ۸ پرو دردسترس است و ویژگی‌هایی مانند پاسخ‌های هوشمند در برنامه پیام‌ها و خلاصه‌ها در برنامه ضبط را فعال می‌کند. مدل میان‌رده‌ی آن، Gemini حرفه‌ای، از دسامبر در بارد موجود بوده و این چت‌بات را از مدل قبلی LaMDA2 به این مدل جدیدتر ارتقا داده است.

04
از 09
ویژگی‌های هوش مصنوعی برای گوشی‌های پیکسل

Gemini که در واتساپ برای کاربران پیکسل پرو ۸ به‌کار گرفته شده است، پاسخ‌های پیش‌بینی‌شده بهبودیافته‌ای را ارائه می‌دهد و حتی امکان تولید خلاصه برای متن‌های ضبط‌شده را فراهم می‌آورد. اگرچه این ویژگی‌ها ممکن است همه را در AP (Android Police یا مشابه) تحت‌تأثیر قرار ندهند، کمتر پیش می‌آید که گوگل فناوری‌ای را عرضه کند که از همان آغاز بدون نقص باشد. علاوه‌براین، اندروید 14 چندین بهبود و ویژگی جدید مبتنی‌بر هوش مصنوعی را ارائه می‌دهد که ممکن است برای دستگاه‌های قدیمی‌تر پیکسل که از این به‌روزرسانی پشتیبانی می‌کنند، مفید باشد. درادامه، نگاهی اجمالی به دو نمونه از این ویژگی‌ها خواهیم انداخت.

Magic Compose در پیام‌ها

اندروید 14 قابلیت‌های هوش مصنوعی تولیدی را به برنامه پیام‌های گوگل می‌آورد. با استفاده از این ویژگی جدید، کاربران می‌توانند به متن‌هایی که دریافت می‌کنند، به شیوه‌ای خلاقانه و منحصربه‌فرد پاسخ دهند. برای شروع، تنها به ارائه درخواستی کوتاه نیاز است که پاسخ مطلوب را همراه با انتخابی سریع برای تعیین لحن پاسخ خلاصه می‌کند تا آن حس خلاقانه ایجاد شود.

سپس، هوش مصنوعی بقیه کار را انجام و این امکان را به شما می‌دهد تا پاسخ‌هایی به سبک شکسپیری یا هر سبک دیگری را بدون نیاز به صرف وقت و تلاش برای انتخاب و استفاده از واژگان پیچیده به‌سرعت ارائه دهید. این ویژگی تجربه ارتباطات روزمره را با افزودن بُعدی تازه و خلاق به آن تغییر می‌دهد.

ساخت تصاویر پس‌زمینه با هوش مصنوعی مولد

به‌روزرسانی اندروید 14 شامل چندین بهبود در بخش شخصی‌سازی است که به کاربران امکان می‌دهد تا تجربه‌ای بیشتر مطابق با سلیقه‌شان داشته باشند. یکی از این نوآوری‌ها شامل ساخت تصاویر پس‌زمینه با ایموجی است که به کاربران اجازه می‌دهد تا با استفاده از شخصیت‌های ایموجی دلخواهشان، پس‌زمینه‌ای شاد و منحصربه‌فرد ایجاد کنند.

همچنین، تصاویر پس‌زمینه سینمایی شبیه به آنچه در آیفون‌ها موجود است، ارائه شده‌اند که از داده‌های عمقی عکس‌های حالت پرتره برای ایجاد اثر پارالاکس استفاده می‌کنند. این اثر با استفاده از حسگرهای جایرو دستگاه، حس حرکت و عمق را به تصویر می‌افزاید و تجربه‌ای غنی‌تر از مشاهده عکس‌ها را فراهم می‌آورد.

علاوه‌براین، گوگل تصاویر پس‌زمینه هوش مصنوعی تولیدی را نیز در این نسخه ارائه می‌دهد. این ویژگی از مدل پخش تصویر به متن استفاده می‌کند؛ یعنی شما می‌توانید با انتخاب موضوع و سبک هنری و پالت رنگ، تصاویر پس‌زمینه‌ای ایجاد کنید که کاملاً با تنظیمات صفحه خانگی و سلیقه شخصی شما مطابقت داشته باشد. این بهبودها نه‌تنها به شما اجازه می‌دهند که دستگاه خود را بیشتر شخصی‌سازی کنید؛ بلکه تجربه‌ی کاربری را با افزودن لایه خلاقیت و انعطاف‌پذیری بیشتر غنی‌تر می‌سازند.

05
از 09
ویژگی‌های هوش مصنوعی گوگل ورک‌اسپیس (Google Workspace)

تلاش‌های گوگل درزمینه هوش مصنوعی درمقایسه‌با افزودن قابلیت‌های جدید به مجموعه محصولات Workspace خود کمتر به‌چشم می‌آید. در سال ۲۰۲۳، گوگل اپلیکیشن‌هایی نظیر داکز و شیتز و اسلایدز را با ترکیب‌های گوناگونی از ویژگی‌های پیشرفته هوش مصنوعی به‌روزرسانی کرد. این به‌روزرسانی‌ها به‌صورت بسته‌ای به نام Duet AI در گوگل ورک‌اسپیس منتشر شده‌اند که با هزینه ۳۰ دلار در ماه دردسترس قرار می‌گیرد.

Help me Write در جمیل (Gmail) و گوگل داکز (Google Docs)

گوگل با ارائه ویژگی Help Me Write در جیمیل، تجربه کاربری را بهبود بخشیده است. این ویژگی به کاربران امکان می‌دهد تا پاسخ‌های پیچیده به ایمیل‌ها را به‌سرعت و بدون نیاز به صرف وقت زیاد بنویسند. کافی است با درخواستی کوتاه شروع کنید تا هوش مصنوعی متن پیش‌نویس را برای هماهنگی بهتر با نیازهای شما تنظیم کند.

این فناوری در گوگل داکز نیز موجود است و به‌طور مشابهی عمل می‌کند. باوجوداین، کاربرد آن به نوشتن پاسخ‌های ایمیل محدود نمی‌شود؛ بلکه می‌توانید از آن برای تولید متن درباره هر موضوعی استفاده کنید. بااین‌حال، برخی ممکن است احساس کنند که گوگل در هم‌زمانی فعال‌سازی چندین دستیار ترکیب متن شاید کمی پیش رفته است.

Help me Visualize در گوگل اسلایدز (Google Slides)

گوگل در پاسخ به نیاز بیشتر به ویژگی‌های بصری هنگام ساخت ارائه‌ها در Slides، دستیار هوش مصنوعی Help Me Visualize را معرفی کرده است. این دستیار از مدل‌های پیشرفته تولید تصویر مانند Dall-E و MidJourney بهره می‌برد تا درخواست‌های متنی را به تصاویر جذاب تبدیل کند که می‌توانند مستقیماً به ارائه‌ها اضافه شوند. این فناوری به کاربران امکان می‌دهد که ارائه‌های خود را بدون نیاز به مهارت‌های تخصصی در طراحی گرافیک، به‌طور بصری غنی‌تر و جذاب‌تری تهیه کنند.

Help Me Organize در گوگل شیتز (Google Sheets)

گوگل شیتز اغلب برای مدیریت و تحلیل حجم زیادی از داده‌های عددی به‌کار می‌رود و با استفاده از قدرت هوش مصنوعی، پردازش و تحلیل این اعداد راحت‌تر و کارآمدتر می‌شود. برای بهره‌گیری هرچه بیشتر از این مزیت، گوگل ویژگی Help Me Organize را در Duet AI خود ارائه داده است که به کاربران امکان می‌دهد تا به‌طور خودکار داده‌ها را در ستون‌ها و ردیف‌ها سازمان‌دهی و امتیازهای عددی را از نقدهای متنی مشتریان استخراج کنند. این ابزارها می‌توانند برای کسانی که به‌طور مداوم با داده‌های زیادی سروکار دارند، موجب صرفه‌جویی در زمان و افزایش بهره‌وری باشند.

هوش مصنوعی در گوگل میت (Google Meet)

اگر برنامه رکوردر در تلفن‌های پیکسل از قابلیت‌های خلاصه‌سازی بهره‌مند است، گوگل میت نیز با پشتیبانی Duet AI از این ویژگی عقب نمانده است. این سیستم هوش مصنوعی قابلیت خلاصه‌سازی جلسات را به امکانات گوگل میت افزوده و افکت‌های نور و صدایی را نیز به این برنامه می‌افزاید. این خلاصه‌ها در بازبینی یادداشت‌های جلسه یا برای صرفه‌جویی در زمانی که به شرکت در جلسات اختصاص داده می‌شود، بسیار مفید هستند.

به‌طور هم‌زمان، Duet AI می‌تواند داده‌ها را از چندین برنامه مختلف ورک‌اسپیس مرتبط با یک حساب گوگل استخراج کند. به‌عنوان مثال، این سیستم می‌تواند اعداد را از Sheets و نکات مهم را از Docs و یادداشت‌های جلسه را از Meet استخراج و همه این‌ها را در ارائه Slides جذاب و مؤثر گردآوری کند که قطعا توجه هر مدیری را به خود جلب خواهد کرد. Duet AI برای کاربران Google Cloud نیز دردسترس است و امکانات گسترده‌تری را به آن‌ها ارائه می‌دهد.

06
از 09
یادداشت‌های قابل‌توجه

درحالی‌که اکثر محصولات هوش مصنوعی مصرفی که گوگل عرضه کرده است، در یکی از دسته‌های قبلی قرار دارند، امسال شاهد چند محصول نوآورانه و غیرمنتظره بوده‌ایم که می‌توانند آینده‌ای روشن داشته باشند؛ مخصوصاً اگر گوگل تصمیم بگیرد آن‌ها را توسعه دهد و بهبود ببخشد. یکی از این محصولات نمای فراگیر در گوگل مپز است.

آنچه به‌عنوان رقیبی برای نمای ۳D در اپل مپز شروع شد، اکنون به‌عنوان نمای فراگیر در گوگل مپز شناخته می‌شود. این ویژگی با استفاده از هوش مصنوعی و تصاویر صاف مکان‌ها و نمایش‌های ۳D فراگیر و باورپذیر از مکان‌هایی را ایجاد می‌کند که شاید تنها تصور بازدید از آن‌ها را داشته‌ایم. درحال‌حاضر، دسترسی به این ویژگی ممکن است به تعداد معدودی از شهرها محدود شود؛ اما به‌عنوان یکی از کاربردهای هوش مصنوعی که می‌تواند تجربه واقع‌گرایانه و جذاب از محیط را ارائه دهد، بسیار جالب است.

07
از 09
مولد تصویر Imagen Editor

هوش مصنوعی اکنون نقش مهمی در فرایند ویرایش تصویر در گوگل فوتوز ایفا می‌کند؛ اما مجموعه ویرایش Imagen AI که اخیراً معرفی شده، سطح جدیدی از سهولت و دقت را به ویرایش تصاویر می‌آورد. تصور کنید که این ویرایشگر مانند ترکیبی از Bard و دقت ویژگی Content-Aware Fill از Adobe Photoshop عمل می‌کند. Imagen AI تخصص خاصی در ویرایش‌های محلی دارد؛ یعنی تنها بر مناطق تعیین‌شده از تصویر تأثیر می‌گذارد.

فرایند کار بدین‌شکل است که پس از تعیین ماسک روی ناحیه مدنظر، کاربر فقط به ارائه درخواست متنی نیاز دارد و هوش مصنوعی اطمینان می‌دهد که ویرایش به‌صورت تمیز و دقیق انجام شود. این امر کاربران را از زحمت بررسی‌های وقت‌گیر و پیچیده نجات می‌دهد. بااین‌حال، باید توجه کرد که این ویرایشگر فوراً برای عموم دردسترس نیست و قبل از اینکه به‌طور گسترده‌ای منتشر شود، ممکن است به زمان یا توسعه بیشتری نیاز داشته باشد.

08
از 09
NotebookLM

با رونمایی جمینای، گوگل ابزار هوش مصنوعی جدیدی به نام NotebookLM را معرفی کرد که پیش‌تر با نام پروژه Tailwind شناخته می‌شد و به‌واسطه مدل پیشرفته Gemini Pro به قدرت رسیده است. هدف اصلی NotebookLM ساده‌سازی فرایند یادداشت‌برداری و قالب‌بندی محتوا در یادداشت‌ها است. این هوش مصنوعی با درک موقعیتی و توانایی‌های پیشرفته در پردازش اطلاعات، به کاربران کمک می‌کند تا یادداشت‌های نامنظم و پراکنده خود را سازمان‌دهی کنند.

در ابتدا گوگل اعلام کرده بود که این ابزار عمدتاً برای دانشجویان طراحی شده؛ اما واضح است هر فردی که به برنامه‌ریزی و سازمان‌دهی و یادداشت‌برداری نیاز دارد، می‌تواند از آن بهره‌مند شود. اگر NotebookLM به‌طور گسترده استفاده شود، با ارائه راه‌حل‌های هوشمند برای مدیریت و سازمان‌دهی اطلاعات، می‌تواند تأثیر چشمگیری بر میلیون‌ها نفر بگذارد.

09
از 09
سال ۲۰۲۴؛ سال امیدها و نگرانی‌ها

درحالی‌که هوش مصنوعی جذابیت‌های بسیاری دارد و همگان برای دیدن قابلیت‌های آن هیجان‌زده هستند، مشکلات و مرزهای تعریف‌نشده‌ای وجود دارند که باید مدنظر قرار گیرند. ازجمله این مشکلات، نگرانی‌های مربوط به حریم خصوصی است که به‌دلیل استفاده گسترده هوش مصنوعی از داده‌های کاربران برای یادگیری و بهبود برانگیخته می‌شود. جمع‌آوری و استفاده از این داده‌ها می‌تواند مسائل حریم خصوصی جدی را به‌وجود آورد.

همچنین، خطرهای مربوط به کپی‌برداری و تولید محتوای جعلی ازطریق هوش مصنوعی وجود دارد که ممکن است شبیه به کارهایی باشد که از روی آن‌ها آموزش دیده است. گوگل تا جایی پیش رفته است که قول داده کاربران خود را از دعواهای قانونی محافظت کند؛ اما این موضوع همچنان دغدغه بزرگی است. علاوه‌براین، افراد می‌توانند محتوای تولیدشده با هوش مصنوعی را به‌عنوان اثر خود ارائه دهند که این خود نگرانی‌های اخلاقی عمیق‌تری ایجاد می‌کند.

یکی از راه‌حل‌های پیشنهادی برای این مسائل، واترمارک‌کردن تصاویر و متون ایجادشده با هوش مصنوعی است تا منشأ آن‌ها شناخته شود. امید است که شرکت‌های بزرگ مانند گوگل از چنین ابتکاراتی حمایت کنند و راه‌حل‌هایی را توسعه دهند که هم امنیت و حریم خصوصی کاربران را تأمین و هم به حفظ اخلاق و اصالت در عرصه دیجیتال کمک کنند.