مایکل گرستنهابر، معاون محصول گوگل کلود (Google Claud) که مدیریت پلتفرم Vertex AI را بر عهده دارد، معتقد است که مدلهای هوش مصنوعی به طور همزمان در سه جبهه هوش خام، زمان پاسخگویی و هزینه در حال پیشروی هستند.
به گزارش سرویس هوش مصنوعی تکناک، به گفته او، انتخاب یک مدل به نیاز خاص کاربر بستگی دارد: گاهی هوش بیشتر اولویت دارد حتی با صرف زمان ۴۵ دقیقه، گاهی سرعت پاسخگویی حیاتی است و گاهی نیز مقیاسپذیری با هزینه کم برای پلتفرمهای بزرگی مانند متا اهمیت مییابد.

در ادامه گفتوگوی تفصیلی techcrunch با معاون گوگل کلود را میخوانید:
چرا با بیان تجربه خود در زمینه هوش مصنوعی و کاری که در گوگل انجام میدهید شروع نمیکنید؟
من حدود دو سال است که در حوزه هوش مصنوعی فعالیت میکنم. یک سال و نیم در Anthropic بودم و الان نزدیک به شش ماه است که در گوگل هستم. من مدیریت Vertex AI، پلتفرم توسعهدهندگان گوگل را بر عهده دارم. اکثر مشتریان ما مهندسانی هستند که برنامههای کاربردی خود را میسازند. آنها به الگوهای عاملمحور (agentic patterns) دسترسی دارند. آنها باید به استنتاج (inference) باهوشترین مدلهای جهان دسترسی داشته باشند. من این دسترسی را برای آنها فراهم میکنم، اما خود برنامههای کاربردی را ارائه نمیدهم. این وظیفه شرکتهایی مانند Shopify، Thomson Reuters و سایر مشتریان ما است که در حوزههای تخصصی خود این کار را انجام دهند.
چه گزینهای شما را به سمت گوگل جذب کرد؟
به نظر من گوگل در جهان منحصربهفرد است، چرا که ما همه چیز را از لایه رابط گرفته تا لایه زیرساخت در اختیار داریم. ما میتوانیم دیتاسنتر بسازیم، میتوانیم برق بخریم و نیروگاه احداث کنیم. تراشههای مخصوص و مدل اختصاصی خود را داریم. لایه استنتاج و لایه عاملمحوری را در اختیار داریم که خودمان کنترل میکنیم. APIهایی برای حافظه و برای نوشتن کدهای درهمتنیده (interleaved code) داریم. یک موتور عامل (agent engine) روی این لایهها داریم که انطباق و حاکمیت را تضمین میکند. علاوه بر این، حتی رابط چت را با Gemini enterprise و Gemini chat برای مصرفکنندگان داریم، درست است؟ بنابراین بخشی از دلیل آمدن من این بود که گوگل را به طور منحصربهفردی یکپارچه (vertically integrated) میدیدم و این را یک نقطه قوت میدانستم.
عجیب است، با وجود تمام تفاوتهایی که بین شرکتها وجود دارد، به نظر میرسد که هر سه آزمایشگاه بزرگ از نظر قابلیتها بسیار به هم نزدیک هستند. آیا این صرفاً یک رقابت برای هوش بیشتر است، یا پیچیدهتر از این حرفها است؟
من سه مرز میبینم. مدلهایی مانند Gemini Pro برای هوش خام تنظیم شدهاند. به نوشتن کد فکر کنید. شما فقط بهترین کدی را میخواهید که میتوانید به دست آورید، مهم نیست که ۴۵ دقیقه طول بکشد، چرا که باید از آن نگهداری شود، باید آن را در محیط تولید (production) قرار داد. من فقط بهترین را میخواهم.
مرز دوم به تأخیر (latency) مربوط میشود. برای نمونه، در فرایند پشتیبانی مشتری، هنگامی که نیاز به اعمال یک خطمشی خاص وجود دارد، هوش مصنوعی باید توانایی درک و اجرای آن را داشته باشد؛ پرسشهایی از قبیل اینکه آیا مشتری مجاز به بازگرداندن کالا است یا مواردی شبیه به آن، در این حوزه قرار میگیرند. با وجود این، صحت پاسخ در صورتی بیاعتبار خواهد شد که ۴۵ دقیقه زمان ببرد. در چنین کاربردهایی به باهوشترین مدلی نیاز است که بتواند در محدوده زمانی مجاز پاسخگو باشد، چرا که پس از سرخوردگی و قطع تماس توسط مخاطب، افزایش هوش مدل دیگر نقشی ایفا نمیکند.
سومین دسته به کاربردهایی اختصاص دارد که در آن پلتفرمهایی مانند Reddit یا متا قصد مدیریت محتوای سراسر اینترنت را دارند. این شرکتها اگرچه از بودجههای کلانی برخوردار هستند، اما نمیتوانند ریسک سازمانی ناشی از نبود شفافیت در مقیاسپذیری یک مدل را بپذیرند؛ چرا که پیشبینی حجم پستهای سمی در روز جاری یا آینده برای آنها غیرممکن است. به همین دلیل، این مجموعهها ناچار هستند بودجه خود را به مدلی اختصاص دهند که بالاترین سطح هوش را در عین مقیاسپذیری برای تعداد نامحدودی از موضوعات ارائه دهد. در چنین شرایطی، مسئله هزینه از درجه اهمیت بسیار بالایی برخوردار میشود.
یکی از مواردی که باعث تعجب من شده این است که چرا سیستمهای عاملمحور (agentic systems) اینقدر دیر جا میافتند. به نظر میرسد که مدلها آماده هستند اما با وجود نمونههای نمایشی (demos) باورنکردنی، شاهد تغییرات عمدهای نیستیم که یک سال پیش انتظار آن را داشتیم. به نظر شما چه چیزی مانع این اتفاق میشود؟
این فناوری تنها دو سال قدمت دارد و همچنان با کمبود زیرساختهای اساسی مواجه است. برای نمونه، الگوهای مشخصی برای حسابرسی عملکرد عاملهای هوش مصنوعی یا احراز مجوز دسترسی آنها به دادهها وجود ندارد. این الگوها پیشنیاز استقرار در محیط تولید هستند و محیط تولید نیز همواره به عنوان نشانگری تأخیری (trailing indicator) از تواناییهای واقعی یک فناوری عمل میکند. از این رو، دو سال زمان کافی برای مشاهده کاربردهای عملی هوش مصنوعی در محیط تولید نیست و دقیقاً همینجا است که سازمانها با چالش مواجه میشوند.
پیشرفت در حوزه مهندسی نرمافزار به شکلی چشمگیر و متمایز صورت گرفته است؛ دلیل این موضوع را میتوان در تطابق کامل این حوزه با چرخه عمر توسعه نرمافزار (software development lifecycle) جستوجو کرد. در این فرایند، محیط توسعه (dev environment) بستری امن برای آزمون و خطا فراهم میکند و سپس کد تولیدشده به محیط آزمایش (test environment) ارتقا مییابد. به عنوان نمونه، فرایند نگارش کد در گوگل الزام میکند که دو نفر کد را ممیزی نمایند و هر دو تأیید کنند که کیفیت لازم را برای قرار گرفتن در برند گوگل و ارائه به مشتریان دارد. وجود چنین فرایندهای نظارت انسانی متعددی (human-in-the-loop)، پیادهسازی را با کمترین ریسک ممکن همراه ساخته است. با وجود این، لازم است این الگوها برای سایر حوزهها و حرفهها نیز توسعه یابد.

















