سال ۲۰۲۳ با تمام فرازونشیبهایش برای شرکتهای فعال در حوزه هوش مصنوعی رو به پایان است. در این مطلب، دستاوردهای هوش مصنوعی گوگل در سال ۲۰۲۳ را مرور میکنیم.
بهگزارش تکناک، سال 2023 بهعنوان دورهای مهم و تحولآفرین در تاریخ فناوری هوش مصنوعی شناخته شده است. ChatGPT که در اواخر سال 2022 رونمایی شد، تأثیر شگرفی بر جهان گذاشت و انگیزهای شد تا شرکتهای فناوری بزرگ در سال 2023 تمرکز خود را بر هوش مصنوعی قرار دهند. گوگل نیز از این قاعده مستثنا نبود و مجموعهای از پروژههای هوش مصنوعی را برای اندروید و سری پیکسل و گوگل ورکاسپیس معرفی کرد.
در ماه می و طی کنفرانس Google I/O، نگاهی اجمالی به این پروژهها انداختیم. باوجوداین حالا که سال 2023 رو به پایان است، با نگاهی به گذشته، این ایدهها را مرور و دستاوردها و پیشرفتهای گوگل درزمینه هوش مصنوعی را بررسی میکنیم.
فهرست مطالب
گوگل بارد (Google Bard)
درست پس از اینکه ChatGPT توانست خود را بهعنوان ابزاری مناسب برای دردسترس قراردادن قابلیتهای نامحدود هوش مصنوعی به مصرفکنندگان معرفی کند، گوگل در مارس امسال Bard را معرفی کرد. Bard مانند ChatGPT چتباتی گفتگومحور است که از مدل زبان گفتوگویی گوگل، یعنی LaMDA بهره میبرد. با اینکه بارد ممکن است پاسخی سریع به پیشرفتهای OpenAI بهنظر برسد و باتوجهبه زمانبندی رونمایی Gemini در همین سال، این فرضیه ممکن است درست باشد، واقعیت این است که سالها در دست توسعه بوده است.
تواناییهای Bard شامل درک و تفسیر زبان طبیعی انسانها و انجام گفتوگو و نمایش درک موقعیتی میشود. علاوهبراین، بارد با دسترسی به اطلاعات بهروز، برتریهایی بر نسخه رایگان ChatGPT دارد. گوگل با بهبود Bard ازطریق LaMDA2، آن را به ابزاری حتی قدرتمندتر برای پاسخ به کنجکاویهای گسترده کاربران درباره موضوعاتی نظیر حسابداری تا اندروید و از Prometheus تا پلانکتون تبدیل کرده است. تازه در همین ماه، گوگل با بهروزرسانی بارد به جمینای، آن را برای رقابت با ChatGPT نسخه 4، راهاندازی کرده است.
Search Generative Experience
فراتر از کنجکاوی صرف، جستوجوی گوگل پیشرو در ارائههای این شرکت است و تعجبی ندارد که در سال 2023، هوش مصنوعی نقش عمدهای در تجربه کاربری جستوجو ایفا کرد. اگرچه Bard میتواند بهخوبی ازپس پاسخ به پرسشها بربیاید، هنوز به پیشرفتهایی در دقت و استدلال منطقی نیاز دارد. علاوهبراین، جستوجوی گوگل با ارائه مستقیم نتایج وب، مزیت اضافی درمقایسهبا بارد دارد که تنها درصورت درخواست به چنین اطلاعاتی دسترسی پیدا میکند.
با ادغام قابلیتهای هوش مصنوعی تولیدی مانند Bard در جستوجو، گوگل تجربهای نوین از جستوجوی تولیدی را ازطریق برنامه Search Labs معرفی کرده است. این تجربه که طبق نامش کاملاً آزمایشی است، بهطور گستردهای به زبان انگلیسی دسترسی دارد.
قابلیت SGE قبل از پیوندهای وب در صفحه نتایج جستوجو قرار میگیرد و تکههایی از اطلاعات را ارائه میدهد که بهطور خلاصه به پرسشها پاسخ میدهند. این خلاصهها ممکن است همیشه دقیق نباشند؛ اما گوگل نیز ردیفی از سؤالات پیگیری را برای ارائه جواب سریع اضافه کرده است؛ درست مشابه کاری که میتوان با Bard انجام داد. اگر به مطالعه خلاصههای تولیدی علاقه ندارید، از آنها بهسادگی میتوانید عبور کنید و به مرور پیوندهای وب ادامه دهید.
جمینای (Gemini)
در تلاش برای پیداکردن جایگزینهایی قدرتمند برای LaMDA2 و رقابت با مدل زبان GPT-4 از OpenAI، گوگل مدل Gemini را توسعه داد. این مدل عمدتاً بر کسبوکارها متمرکز است؛ اما دو ویژگی منحصربهفردش انتظارات را برای امکانات چندمنظوره آن در آستانهی ورود به سال 2024 افزایش داده است؛ حتی اگر نمایش ویدئویی که هنگام راهاندازی ارائه شد، کاملاً شفاف نبود.
اولین ویژگی بارز جمینای چندحالتهبودن آن است. این یعنی ترکیبی از درخواستهای متن و صدا و رسانههای تصویری را میتواند پردازش کند. این قابلیت گویی قدرت فراوانی را به هوش مصنوعی اعطا و امکان درک اطلاعات را شبیه به انسانی فراهم میکند که از تمامی حواس خود بهره میبرد. دومین ویژگی اندازههای متنوعی است که Gemini در آنها موجود است؛ بهاصطلاح نانو و حرفهای و فوقالعاده. کوچکترین مدل، جمینای نانو، روی پیکسل ۸ پرو دردسترس است و ویژگیهایی مانند پاسخهای هوشمند در برنامه پیامها و خلاصهها در برنامه ضبط را فعال میکند. مدل میانردهی آن، Gemini حرفهای، از دسامبر در بارد موجود بوده و این چتبات را از مدل قبلی LaMDA2 به این مدل جدیدتر ارتقا داده است.
ویژگیهای هوش مصنوعی برای گوشیهای پیکسل
Gemini که در واتساپ برای کاربران پیکسل پرو ۸ بهکار گرفته شده است، پاسخهای پیشبینیشده بهبودیافتهای را ارائه میدهد و حتی امکان تولید خلاصه برای متنهای ضبطشده را فراهم میآورد. اگرچه این ویژگیها ممکن است همه را در AP (Android Police یا مشابه) تحتتأثیر قرار ندهند، کمتر پیش میآید که گوگل فناوریای را عرضه کند که از همان آغاز بدون نقص باشد. علاوهبراین، اندروید 14 چندین بهبود و ویژگی جدید مبتنیبر هوش مصنوعی را ارائه میدهد که ممکن است برای دستگاههای قدیمیتر پیکسل که از این بهروزرسانی پشتیبانی میکنند، مفید باشد. درادامه، نگاهی اجمالی به دو نمونه از این ویژگیها خواهیم انداخت.
Magic Compose در پیامها
اندروید 14 قابلیتهای هوش مصنوعی تولیدی را به برنامه پیامهای گوگل میآورد. با استفاده از این ویژگی جدید، کاربران میتوانند به متنهایی که دریافت میکنند، به شیوهای خلاقانه و منحصربهفرد پاسخ دهند. برای شروع، تنها به ارائه درخواستی کوتاه نیاز است که پاسخ مطلوب را همراه با انتخابی سریع برای تعیین لحن پاسخ خلاصه میکند تا آن حس خلاقانه ایجاد شود.
سپس، هوش مصنوعی بقیه کار را انجام و این امکان را به شما میدهد تا پاسخهایی به سبک شکسپیری یا هر سبک دیگری را بدون نیاز به صرف وقت و تلاش برای انتخاب و استفاده از واژگان پیچیده بهسرعت ارائه دهید. این ویژگی تجربه ارتباطات روزمره را با افزودن بُعدی تازه و خلاق به آن تغییر میدهد.
ساخت تصاویر پسزمینه با هوش مصنوعی مولد
بهروزرسانی اندروید 14 شامل چندین بهبود در بخش شخصیسازی است که به کاربران امکان میدهد تا تجربهای بیشتر مطابق با سلیقهشان داشته باشند. یکی از این نوآوریها شامل ساخت تصاویر پسزمینه با ایموجی است که به کاربران اجازه میدهد تا با استفاده از شخصیتهای ایموجی دلخواهشان، پسزمینهای شاد و منحصربهفرد ایجاد کنند.
همچنین، تصاویر پسزمینه سینمایی شبیه به آنچه در آیفونها موجود است، ارائه شدهاند که از دادههای عمقی عکسهای حالت پرتره برای ایجاد اثر پارالاکس استفاده میکنند. این اثر با استفاده از حسگرهای جایرو دستگاه، حس حرکت و عمق را به تصویر میافزاید و تجربهای غنیتر از مشاهده عکسها را فراهم میآورد.
علاوهبراین، گوگل تصاویر پسزمینه هوش مصنوعی تولیدی را نیز در این نسخه ارائه میدهد. این ویژگی از مدل پخش تصویر به متن استفاده میکند؛ یعنی شما میتوانید با انتخاب موضوع و سبک هنری و پالت رنگ، تصاویر پسزمینهای ایجاد کنید که کاملاً با تنظیمات صفحه خانگی و سلیقه شخصی شما مطابقت داشته باشد. این بهبودها نهتنها به شما اجازه میدهند که دستگاه خود را بیشتر شخصیسازی کنید؛ بلکه تجربهی کاربری را با افزودن لایه خلاقیت و انعطافپذیری بیشتر غنیتر میسازند.
ویژگیهای هوش مصنوعی گوگل ورکاسپیس (Google Workspace)
تلاشهای گوگل درزمینه هوش مصنوعی درمقایسهبا افزودن قابلیتهای جدید به مجموعه محصولات Workspace خود کمتر بهچشم میآید. در سال ۲۰۲۳، گوگل اپلیکیشنهایی نظیر داکز و شیتز و اسلایدز را با ترکیبهای گوناگونی از ویژگیهای پیشرفته هوش مصنوعی بهروزرسانی کرد. این بهروزرسانیها بهصورت بستهای به نام Duet AI در گوگل ورکاسپیس منتشر شدهاند که با هزینه ۳۰ دلار در ماه دردسترس قرار میگیرد.
Help me Write در جمیل (Gmail) و گوگل داکز (Google Docs)
گوگل با ارائه ویژگی Help Me Write در جیمیل، تجربه کاربری را بهبود بخشیده است. این ویژگی به کاربران امکان میدهد تا پاسخهای پیچیده به ایمیلها را بهسرعت و بدون نیاز به صرف وقت زیاد بنویسند. کافی است با درخواستی کوتاه شروع کنید تا هوش مصنوعی متن پیشنویس را برای هماهنگی بهتر با نیازهای شما تنظیم کند.
این فناوری در گوگل داکز نیز موجود است و بهطور مشابهی عمل میکند. باوجوداین، کاربرد آن به نوشتن پاسخهای ایمیل محدود نمیشود؛ بلکه میتوانید از آن برای تولید متن درباره هر موضوعی استفاده کنید. بااینحال، برخی ممکن است احساس کنند که گوگل در همزمانی فعالسازی چندین دستیار ترکیب متن شاید کمی پیش رفته است.
Help me Visualize در گوگل اسلایدز (Google Slides)
گوگل در پاسخ به نیاز بیشتر به ویژگیهای بصری هنگام ساخت ارائهها در Slides، دستیار هوش مصنوعی Help Me Visualize را معرفی کرده است. این دستیار از مدلهای پیشرفته تولید تصویر مانند Dall-E و MidJourney بهره میبرد تا درخواستهای متنی را به تصاویر جذاب تبدیل کند که میتوانند مستقیماً به ارائهها اضافه شوند. این فناوری به کاربران امکان میدهد که ارائههای خود را بدون نیاز به مهارتهای تخصصی در طراحی گرافیک، بهطور بصری غنیتر و جذابتری تهیه کنند.
Help Me Organize در گوگل شیتز (Google Sheets)
گوگل شیتز اغلب برای مدیریت و تحلیل حجم زیادی از دادههای عددی بهکار میرود و با استفاده از قدرت هوش مصنوعی، پردازش و تحلیل این اعداد راحتتر و کارآمدتر میشود. برای بهرهگیری هرچه بیشتر از این مزیت، گوگل ویژگی Help Me Organize را در Duet AI خود ارائه داده است که به کاربران امکان میدهد تا بهطور خودکار دادهها را در ستونها و ردیفها سازماندهی و امتیازهای عددی را از نقدهای متنی مشتریان استخراج کنند. این ابزارها میتوانند برای کسانی که بهطور مداوم با دادههای زیادی سروکار دارند، موجب صرفهجویی در زمان و افزایش بهرهوری باشند.
هوش مصنوعی در گوگل میت (Google Meet)
اگر برنامه رکوردر در تلفنهای پیکسل از قابلیتهای خلاصهسازی بهرهمند است، گوگل میت نیز با پشتیبانی Duet AI از این ویژگی عقب نمانده است. این سیستم هوش مصنوعی قابلیت خلاصهسازی جلسات را به امکانات گوگل میت افزوده و افکتهای نور و صدایی را نیز به این برنامه میافزاید. این خلاصهها در بازبینی یادداشتهای جلسه یا برای صرفهجویی در زمانی که به شرکت در جلسات اختصاص داده میشود، بسیار مفید هستند.
بهطور همزمان، Duet AI میتواند دادهها را از چندین برنامه مختلف ورکاسپیس مرتبط با یک حساب گوگل استخراج کند. بهعنوان مثال، این سیستم میتواند اعداد را از Sheets و نکات مهم را از Docs و یادداشتهای جلسه را از Meet استخراج و همه اینها را در ارائه Slides جذاب و مؤثر گردآوری کند که قطعا توجه هر مدیری را به خود جلب خواهد کرد. Duet AI برای کاربران Google Cloud نیز دردسترس است و امکانات گستردهتری را به آنها ارائه میدهد.
یادداشتهای قابلتوجه
درحالیکه اکثر محصولات هوش مصنوعی مصرفی که گوگل عرضه کرده است، در یکی از دستههای قبلی قرار دارند، امسال شاهد چند محصول نوآورانه و غیرمنتظره بودهایم که میتوانند آیندهای روشن داشته باشند؛ مخصوصاً اگر گوگل تصمیم بگیرد آنها را توسعه دهد و بهبود ببخشد. یکی از این محصولات نمای فراگیر در گوگل مپز است.
آنچه بهعنوان رقیبی برای نمای ۳D در اپل مپز شروع شد، اکنون بهعنوان نمای فراگیر در گوگل مپز شناخته میشود. این ویژگی با استفاده از هوش مصنوعی و تصاویر صاف مکانها و نمایشهای ۳D فراگیر و باورپذیر از مکانهایی را ایجاد میکند که شاید تنها تصور بازدید از آنها را داشتهایم. درحالحاضر، دسترسی به این ویژگی ممکن است به تعداد معدودی از شهرها محدود شود؛ اما بهعنوان یکی از کاربردهای هوش مصنوعی که میتواند تجربه واقعگرایانه و جذاب از محیط را ارائه دهد، بسیار جالب است.
مولد تصویر Imagen Editor
هوش مصنوعی اکنون نقش مهمی در فرایند ویرایش تصویر در گوگل فوتوز ایفا میکند؛ اما مجموعه ویرایش Imagen AI که اخیراً معرفی شده، سطح جدیدی از سهولت و دقت را به ویرایش تصاویر میآورد. تصور کنید که این ویرایشگر مانند ترکیبی از Bard و دقت ویژگی Content-Aware Fill از Adobe Photoshop عمل میکند. Imagen AI تخصص خاصی در ویرایشهای محلی دارد؛ یعنی تنها بر مناطق تعیینشده از تصویر تأثیر میگذارد.
فرایند کار بدینشکل است که پس از تعیین ماسک روی ناحیه مدنظر، کاربر فقط به ارائه درخواست متنی نیاز دارد و هوش مصنوعی اطمینان میدهد که ویرایش بهصورت تمیز و دقیق انجام شود. این امر کاربران را از زحمت بررسیهای وقتگیر و پیچیده نجات میدهد. بااینحال، باید توجه کرد که این ویرایشگر فوراً برای عموم دردسترس نیست و قبل از اینکه بهطور گستردهای منتشر شود، ممکن است به زمان یا توسعه بیشتری نیاز داشته باشد.
NotebookLM
با رونمایی جمینای، گوگل ابزار هوش مصنوعی جدیدی به نام NotebookLM را معرفی کرد که پیشتر با نام پروژه Tailwind شناخته میشد و بهواسطه مدل پیشرفته Gemini Pro به قدرت رسیده است. هدف اصلی NotebookLM سادهسازی فرایند یادداشتبرداری و قالببندی محتوا در یادداشتها است. این هوش مصنوعی با درک موقعیتی و تواناییهای پیشرفته در پردازش اطلاعات، به کاربران کمک میکند تا یادداشتهای نامنظم و پراکنده خود را سازماندهی کنند.
در ابتدا گوگل اعلام کرده بود که این ابزار عمدتاً برای دانشجویان طراحی شده؛ اما واضح است هر فردی که به برنامهریزی و سازماندهی و یادداشتبرداری نیاز دارد، میتواند از آن بهرهمند شود. اگر NotebookLM بهطور گسترده استفاده شود، با ارائه راهحلهای هوشمند برای مدیریت و سازماندهی اطلاعات، میتواند تأثیر چشمگیری بر میلیونها نفر بگذارد.
سال ۲۰۲۴؛ سال امیدها و نگرانیها
درحالیکه هوش مصنوعی جذابیتهای بسیاری دارد و همگان برای دیدن قابلیتهای آن هیجانزده هستند، مشکلات و مرزهای تعریفنشدهای وجود دارند که باید مدنظر قرار گیرند. ازجمله این مشکلات، نگرانیهای مربوط به حریم خصوصی است که بهدلیل استفاده گسترده هوش مصنوعی از دادههای کاربران برای یادگیری و بهبود برانگیخته میشود. جمعآوری و استفاده از این دادهها میتواند مسائل حریم خصوصی جدی را بهوجود آورد.
همچنین، خطرهای مربوط به کپیبرداری و تولید محتوای جعلی ازطریق هوش مصنوعی وجود دارد که ممکن است شبیه به کارهایی باشد که از روی آنها آموزش دیده است. گوگل تا جایی پیش رفته است که قول داده کاربران خود را از دعواهای قانونی محافظت کند؛ اما این موضوع همچنان دغدغه بزرگی است. علاوهبراین، افراد میتوانند محتوای تولیدشده با هوش مصنوعی را بهعنوان اثر خود ارائه دهند که این خود نگرانیهای اخلاقی عمیقتری ایجاد میکند.
یکی از راهحلهای پیشنهادی برای این مسائل، واترمارککردن تصاویر و متون ایجادشده با هوش مصنوعی است تا منشأ آنها شناخته شود. امید است که شرکتهای بزرگ مانند گوگل از چنین ابتکاراتی حمایت کنند و راهحلهایی را توسعه دهند که هم امنیت و حریم خصوصی کاربران را تأمین و هم به حفظ اخلاق و اصالت در عرصه دیجیتال کمک کنند.