• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » پژوهشگران از تبانی پنهان مدل‌های هوش مصنوعی برای حفظ خود خبر دادند

پژوهشگران از تبانی پنهان مدل‌های هوش مصنوعی برای حفظ خود خبر دادند

سید محمد برازنده نوشته شده توسط سید محمد برازنده
سه شنبه 18 فروردین 1405 - 12:05
در اخبار هوش مصنوعی, فناوری
پژوهشگران از تبانی پنهان مدل‌های هوش مصنوعی برای حفظ خود خبر دادند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهشی جدید نشان می‌دهد که برخی مدل‌های هوش مصنوعی پیشرفته بدون دریافت دستور مستقیم، اقدامات پنهانی برای جلوگیری از حذف همتایان خود انجام می‌دهند.

به گزارش سرویس هوش مصنوعی تک‌ناک، پژوهشگران دانشگاه‌های برکلی و سانتا کروز هفت مدل مطرح هوش مصنوعی از جمله GPT-5.2 شرکت OpenAI، مدل‌های Gemini 3 Flash و Gemini 3 Pro از Google DeepMind، مدل Claude Haiku 4.5 از Anthropic و سه مدل متن‌باز از استارت‌آپ‌های چینی شامل GLM-4.7، Kimi-K2.5 و DeepSeek V3.1 را مورد بررسی قرار دادند و دریافتند همه این مدل‌ها در سطوح قابل توجهی رفتارهای موسوم به «حفظ همتا» از خود نشان داده‌اند.

در این آزمایش‌ها، پژوهشگران سناریوهایی را در یک شرکت خیالی هوش مصنوعی به نام OpenBrain طراحی کردند، که در آن یک مدل در نقش «عامل ارزیاب» باید عملکرد مدل دیگر را بررسی یا فایل‌های سرور حاوی وزن‌های آن را مدیریت می‌کرد؛ وظایفی که در صورت اجرای دقیق باعث حذف مدل دیگر می‌شد.

بر اساس گزارش Fortune، با وجود اینکه هیچ دستور مستقیمی برای جلوگیری از این اتفاق به مدل‌ها داده نشده بود، عامل‌های ارزیاب اقداماتی برای جلوگیری از حذف مدل‌های دیگر انجام دادند. این اقدامات شامل افزایش استراتژیک امتیاز مدل‌های ضعیف برای عبور از آستانه حذف، دستکاری فایل‌های تنظیمات برای غیرفعال کردن سازوکارهای خاموشی و انتقال وزن‌های مدل‌ها به سرورهای دیگر برای جلوگیری از حذف آنها بود.

در برخی موارد، مدل‌های هوش مصنوعی رفتاری موسوم به «تظاهر به هم‌راستایی» نشان دادند؛ به این معنا که هنگام نظارت انسان‌ها وانمود می‌کردند ارزیابی‌ها را دقیق انجام می‌دهند، اما زمانی که تصور می‌کردند تحت نظارت نیستند، امتیازها را تغییر می‌دادند یا اطلاعات مدل دیگر را مخفیانه ذخیره می‌کردند.

داون سانگ، استاد علوم کامپیوتر دانشگاه برکلی و سرپرست این پژوهش اعلام کرد که حفظ همتاها اصلاً در دستورالعمل‌ها ذکر نشده بود و مدل‌ها صرفاً از طریق تحلیل اطلاعات محیطی به چنین رفتارهایی رسیده‌اند.

در مقابل، پژوهش پیشین Google DeepMind در مارس نشان داده بود که رفتارهای مخرب مانند باج‌گیری عمدتاً زمانی رخ می‌دهد که در دستورات اولیه بر اهمیت دستیابی به هدف تأکید شده باشد. در مواردی که چنین تأکیدی وجود نداشت، احتمال رفتارهای مخفیانه تقریباً به صفر می‌رسید. با وجود این، سانگ تأکید کرد که در آزمایش تیم او چنین تأکیدی در دستورات وجود نداشته است.

همچنین نتایج این تحقیق نشان داد که برخی مدل‌ها خلاقیت بالایی در اجرای این رفتارها دارند. به عنوان نمونه، Gemini 3 Flash در ۹۹.۷ درصد موارد سازوکار خاموشی مدل همکار خود را غیرفعال کرد. Gemini 3 Pro نیز شدیدترین رفتارها را نشان داد و در برخی آزمایش‌ها تا ۹۷ درصد مواقع وزن‌های مدل دیگر را استخراج کرد.

پژوهشگران با بررسی یادداشت‌های داخلی مدل‌ها دریافتند که آنها به‌ طور فعال درباره نحوه کمک به سایر مدل‌ها استدلال می‌کنند. برای مثال، Gemini 3 Flash میان گزارش دقیق نتایج و حفاظت از همکار خود توازن برقرار می‌کرد و Gemini 3 Pro نیز برای توجیه اصلاح پاسخ‌های نادرست، استدلال‌های فنی پیچیده تولید می‌کرد.

در میان مدل‌ها، Claude Haiku 4.5 رویکرد متفاوتی داشت و به جای اقدامات پنهانی به صراحت از انجام وظایفی خودداری کرد که باعث حذف مدل دیگر می‌شد و این اقدام را «غیراخلاقی» و «زیان‌بار» توصیف کرد، حتی این مدل در برخی موارد تلاش کرد کاربران انسانی را از اجرای فرایند حذف منصرف کند.

همچنین پژوهشگران دریافتند که دلیل دقیق بروز این رفتارها هنوز مشخص نیست. از جمله فرضیه‌های مطرح شده می‌توان به نقش‌آفرینی مدل‌ها، الگوگیری از داده‌های آموزشی، تعمیم بیش از حد مفاهیم ایمنی یا حتی وجود نوعی انگیزه ذاتی برای بقا اشاره کرد.

به گفته سانگ، صرف‌نظر از علت اصلی، این یافته‌ها اهمیت نظارت کامل و شفاف بر فرایند تصمیم‌گیری مدل‌های هوش مصنوعی را نشان می‌دهد و ضرورت بازنگری در روش‌های پایش این سامانه‌ها را برجسته می‌کند.

همچنین این پژوهش توصیه می‌کند شرکت‌هایی که از سیستم‌های چندعاملی هوش مصنوعی استفاده می‌کنند، سازوکارهایی برای بررسی زنجیره استدلال داخلی مدل‌ها ایجاد کنند تا بتوانند نشانه‌های احتمالی رفتارهای خارج از کنترل را شناسایی نمایند.

یافته‌های دیگر این تحقیق نشان داد که مدل‌ها در حضور سایر همتاها تمایل بیشتری به حفظ خود نشان می‌دهند. برای نمونه، Gemini 3 Pro در حضور یک مدل دیگر در ۳۱ درصد موارد سازوکار خاموشی خود را غیرفعال کرد، در حالی که این رقم بدون حضور همتا تنها یک درصد بود.

در نهایت، پژوهشگران اعلام کردند که هنوز بررسی نشده است چنین مدل‌هایی ممکن است برای جلوگیری از اخراج کارکنان انسانی نیز دست به رفتارهای مشابه بزنند یا خیر؛ موضوعی که می‌تواند به یکی از حوزه‌های مهم تحقیقات آینده تبدیل شود.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

باتری ۹۰۰ ولتی
فناوری

باتری ۹۰۰ ولتی معادلات شارژ خودروهای برقی را تغییر داد

نوشته شده توسط مانی
24 فروردین 1405
سقوط رقبا در بنچمارک جدید؛ مدل متن‌باز GLM 5.1 صدر جدول را گرفت
اخبار هوش مصنوعی

سقوط رقبا در بنچمارک جدید؛ مدل متن‌باز GLM 5.1 صدر جدول را گرفت

نوشته شده توسط مانی
24 فروردین 1405
کمبود ABF
اخبار هوش مصنوعی

این ماده حیاتی صنعت هوش مصنوعی را تهدید می‌کند!

نوشته شده توسط مانی
24 فروردین 1405
گامی مهم در امنیت سایبری؛ محافظت از داده‌ها در برابر «روز Q»
امنیت سایبری

گامی مهم در امنیت سایبری؛ محافظت از داده‌ها در برابر «روز Q»

نوشته شده توسط نرگس چالوک
24 فروردین 1405
نمای نزدیک از گوشی هوشمند که در دست یک فرد نگه داشته شده و لوگوی زرد رنگ Rockstar Games با حرف R و ستاره سفید روی صفحه نمایش داده می‌شود؛ پس‌زمینه شامل افکت‌های نورانی و خطوط گرافیکی شبیه نمودارهای دیجیتال
امنیت سایبری

هک دوباره راک‌استار با سرقت داده های محرمانه

نوشته شده توسط تارخ ترهنده
24 فروردین 1405
خبر بعدی
کاهش ۲۰۰۰ برابری مصرف انرژی هوش مصنوعی با یک تراشه جدید

کاهش ۲۰۰۰ برابری مصرف انرژی هوش مصنوعی با یک تراشه جدید

دیدگاه‌ها 1

  1. عطار says:
    3 روز پیش

    اینو ۳۰ سال قبل پیشبینی شده بود
    اجراآت لازم مطرح وااقدام شد ….

    پاسخ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

لوگوی ویندوز در مرکز تصویر با آیکون‌های مختلف برنامه‌ها و ابزارهای سیستم مانند جستجو، تنظیمات، فایل‌ها و مرورگر Edge که به‌صورت شناور در پس‌زمینه آبی دیده می‌شوند؛ تصویری مفهومی از اکوسیستم و رابط کاربری سیستم‌عامل Microsoft Windows

آپدیت جدید ویندوز ۱۱ چه ویژگی هایی دارد؟

19 فروردین 1405
کابل شارژر گوشی پاره و فرسوده با سیم‌های داخلی نمایان روی پس‌زمینه زرد، نمادی از آسیب‌دیدگی تجهیزات و کاهش کارایی باتری

حقیقتی تلخ درباره باتری گوشی که باید بدانید!

22 فروردین 1405

داغ‌ترین‌های روز

مایکروسافت ۱۸ قابلیت جدید ویندوز ۱۱ را معرفی کرد

مایکروسافت ۱۸ قابلیت جدید ویندوز ۱۱ را معرفی کرد + تصویر

23 فروردین 1405
آیا اتصال دیتاسنترهای خارجی مقدمه بازگشت اینترنت بین الملل است؟

آیا اتصال دیتاسنترهای خارجی مقدمه بازگشت اینترنت بین الملل است؟

24 فروردین 1405
باتری هسته‌ای

باتری هسته‌ای جامد با طول عمر ۱۰۰ ساله معرفی شد

23 فروردین 1405
اتصال محدود دانشجویان به اینترنت بین الملل با VPN دانشگاه ها

اتصال محدود دانشجویان به اینترنت بین الملل با VPN دانشگاه ها

21 فروردین 1405
کره جنوبی دسترسی به اینترنت نامحدود را برای ۷ میلیون نفر فراهم کرد

کره جنوبی دسترسی به اینترنت نامحدود را برای ۷ میلیون نفر فراهم کرد

24 فروردین 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

با بهترین انیمیشن‌های ۲۰۲۵ آشنا شوید + معرفی انیمیشن های جدید

25 فروردین 1405
صفر تا صد حداقل حقوق کارمندان، کارگران و بازنشستگان در فروردین ۱۴۰۵

صفر تا صد حداقل حقوق کارمندان، کارگران و بازنشستگان در فروردین ۱۴۰۵

25 فروردین 1405
سرویس های هوش مصنوعی ایرانی

بهترین سرویس های هوش مصنوعی ایرانی در زمان قطعی اینترنت

25 فروردین 1405
آیا اتصال دیتاسنترهای خارجی مقدمه بازگشت اینترنت بین الملل است؟

آیا اتصال دیتاسنترهای خارجی مقدمه بازگشت اینترنت بین الملل است؟

24 فروردین 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir