سه مرز جدید هوش مصنوعی از نگاه معاون گوگل کلود

مایکل گرستنهابر، معاون محصول گوگل کلود (Google Claud) که مدیریت پلتفرم Vertex AI را بر عهده دارد، معتقد است که مدل‌های هوش مصنوعی به طور هم‌زمان در سه جبهه هوش خام، زمان پاسخ‌گویی و هزینه در حال پیشروی هستند.

به گزارش سرویس هوش مصنوعی تک‌ناک، به گفته او، انتخاب یک مدل به نیاز خاص کاربر بستگی دارد: گاهی هوش بیشتر اولویت دارد حتی با صرف زمان ۴۵ دقیقه، گاهی سرعت پاسخ‌گویی حیاتی است و گاهی نیز مقیاس‌پذیری با هزینه کم برای پلتفرم‌های بزرگی مانند متا اهمیت می‌یابد.

معاون گوگل کلود سه مرز جدید هوش مصنوعی را تشریح کرد

در ادامه گفت‌وگوی تفصیلی techcrunch با معاون گوگل کلود را می‌خوانید:

چرا با بیان تجربه خود در زمینه هوش مصنوعی و کاری که در گوگل انجام می‌دهید شروع نمی‌کنید؟

من حدود دو سال است که در حوزه هوش مصنوعی فعالیت می‌کنم. یک سال و نیم در Anthropic بودم و الان نزدیک به شش ماه است که در گوگل هستم. من مدیریت Vertex AI، پلتفرم توسعه‌دهندگان گوگل را بر عهده دارم. اکثر مشتریان ما مهندسانی هستند که برنامه‌های کاربردی خود را می‌سازند. آنها به الگوهای عامل‌محور (agentic patterns) دسترسی دارند. آنها باید به استنتاج (inference) باهوش‌ترین مدل‌های جهان دسترسی داشته باشند. من این دسترسی را برای آنها فراهم می‌کنم، اما خود برنامه‌های کاربردی را ارائه نمی‌دهم. این وظیفه شرکت‌هایی مانند Shopify، Thomson Reuters و سایر مشتریان ما است که در حوزه‌های تخصصی خود این کار را انجام دهند.

چه گزینه‌ای شما را به سمت گوگل جذب کرد؟

به نظر من گوگل در جهان منحصربه‌فرد است، چرا که ما همه چیز را از لایه رابط گرفته تا لایه زیرساخت در اختیار داریم. ما می‌توانیم دیتاسنتر بسازیم، می‌توانیم برق بخریم و نیروگاه احداث کنیم. تراشه‌های مخصوص و مدل اختصاصی خود را داریم. لایه استنتاج و لایه عامل‌محوری را در اختیار داریم که خودمان کنترل می‌کنیم. APIهایی برای حافظه و برای نوشتن کدهای درهم‌تنیده (interleaved code) داریم. یک موتور عامل (agent engine) روی این لایه‌ها داریم که انطباق و حاکمیت را تضمین می‌کند. علاوه بر این، حتی رابط چت را با Gemini enterprise و Gemini chat برای مصرف‌کنندگان داریم، درست است؟ بنابراین بخشی از دلیل آمدن من این بود که گوگل را به‌ طور منحصربه‌فردی یکپارچه (vertically integrated) می‌دیدم و این را یک نقطه قوت می‌دانستم.

عجیب است، با وجود تمام تفاوت‌هایی که بین شرکت‌ها وجود دارد، به نظر می‌رسد که هر سه آزمایشگاه بزرگ از نظر قابلیت‌ها بسیار به هم نزدیک هستند. آیا این صرفاً یک رقابت برای هوش بیشتر است، یا پیچیده‌تر از این حرف‌ها است؟

من سه مرز می‌بینم. مدل‌هایی مانند Gemini Pro برای هوش خام تنظیم شده‌اند. به نوشتن کد فکر کنید. شما فقط بهترین کدی را می‌خواهید که می‌توانید به دست آورید، مهم نیست که ۴۵ دقیقه طول بکشد، چرا که باید از آن نگهداری شود، باید آن را در محیط تولید (production) قرار داد. من فقط بهترین را می‌خواهم.

مرز دوم به تأخیر (latency) مربوط می‌شود. برای نمونه، در فرایند پشتیبانی مشتری، هنگامی که نیاز به اعمال یک خط‌مشی خاص وجود دارد، هوش مصنوعی باید توانایی درک و اجرای آن را داشته باشد؛ پرسش‌هایی از قبیل اینکه آیا مشتری مجاز به بازگرداندن کالا است یا مواردی شبیه به آن، در این حوزه قرار می‌گیرند. با وجود این، صحت پاسخ در صورتی بی‌اعتبار خواهد شد که ۴۵ دقیقه زمان ببرد. در چنین کاربردهایی به باهوش‌ترین مدلی نیاز است که بتواند در محدوده زمانی مجاز پاسخگو باشد، چرا که پس از سرخوردگی و قطع تماس توسط مخاطب، افزایش هوش مدل دیگر نقشی ایفا نمی‌کند.

سومین دسته به کاربردهایی اختصاص دارد که در آن پلتفرم‌هایی مانند Reddit یا متا قصد مدیریت محتوای سراسر اینترنت را دارند. این شرکت‌ها اگرچه از بودجه‌های کلانی برخوردار هستند، اما نمی‌توانند ریسک سازمانی ناشی از نبود شفافیت در مقیاس‌پذیری یک مدل را بپذیرند؛ چرا که پیش‌بینی حجم پست‌های سمی در روز جاری یا آینده برای آنها غیرممکن است. به همین دلیل، این مجموعه‌ها ناچار هستند بودجه خود را به مدلی اختصاص دهند که بالاترین سطح هوش را در عین مقیاس‌پذیری برای تعداد نامحدودی از موضوعات ارائه دهد. در چنین شرایطی، مسئله هزینه از درجه اهمیت بسیار بالایی برخوردار می‌شود.

یکی از مواردی که باعث تعجب من شده این است که چرا سیستم‌های عامل‌محور (agentic systems) اینقدر دیر جا می‌افتند. به نظر می‌رسد که مدل‌ها آماده هستند اما با وجود نمونه‌های نمایشی (demos) باورنکردنی، شاهد تغییرات عمده‌ای نیستیم که یک سال پیش انتظار آن را داشتیم. به نظر شما چه چیزی مانع این اتفاق می‌شود؟

این فناوری تنها دو سال قدمت دارد و همچنان با کمبود زیرساخت‌های اساسی مواجه است. برای نمونه، الگوهای مشخصی برای حسابرسی عملکرد عامل‌های هوش مصنوعی یا احراز مجوز دسترسی آنها به داده‌ها وجود ندارد. این الگوها پیش‌نیاز استقرار در محیط تولید هستند و محیط تولید نیز همواره به‌ عنوان نشانگری تأخیری (trailing indicator) از توانایی‌های واقعی یک فناوری عمل می‌کند. از این رو، دو سال زمان کافی برای مشاهده کاربردهای عملی هوش مصنوعی در محیط تولید نیست و دقیقاً همینجا است که سازمان‌ها با چالش مواجه می‌شوند.

پیشرفت در حوزه مهندسی نرم‌افزار به شکلی چشمگیر و متمایز صورت گرفته است؛ دلیل این موضوع را می‌توان در تطابق کامل این حوزه با چرخه عمر توسعه نرم‌افزار (software development lifecycle) جست‌وجو کرد. در این فرایند، محیط توسعه (dev environment) بستری امن برای آزمون و خطا فراهم می‌کند و سپس کد تولیدشده به محیط آزمایش (test environment) ارتقا می‌یابد. به‌ عنوان نمونه، فرایند نگارش کد در گوگل الزام می‌کند که دو نفر کد را ممیزی نمایند و هر دو تأیید کنند که کیفیت لازم را برای قرار گرفتن در برند گوگل و ارائه به مشتریان دارد. وجود چنین فرایندهای نظارت انسانی متعددی (human-in-the-loop)، پیاده‌سازی را با کمترین ریسک ممکن همراه ساخته است. با وجود این، لازم است این الگوها برای سایر حوزه‌ها و حرفه‌ها نیز توسعه یابد.

برچسب‌ها: p6