• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » ساخت ابزار جدید حذف داده های خطرناک از مدل های هوش مصنوعی

ساخت ابزار جدید حذف داده های خطرناک از مدل های هوش مصنوعی

صمد کردی نوشته شده توسط صمد کردی
دوشنبه 21 اسفند 1402 - 20:00
در اخبار هوش مصنوعی, فناوری
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. چگونه کار می کند؟
  • 2. کاخ سفید نگران است

یک گروه از کارشناسان با ایجاد یک بنچمارک جدید به نام مجموعه داده‌های نماینده سلاح‌های کشتار جمعی (WMDP)، راهی برای بررسی اطلاعات خطرناک در مدل‌های هوش مصنوعی و حذف آنها فراهم کرده‌اند.

به گزارش تک‌ناک هوش مصنوعی (AI)، همانند دیگر فناوری‌ها مانند ویرایش ژن و انرژی هسته‌ای، می‌تواند برای اهداف خوب و بداستفاده شود. با توجه به حجم زیاد پول و تلاشی که با سرعت بالا صرف توسعه هوش مصنوعی می‌شود، نگرانی‌هایی در مورد استفاده از مدل‌های زبان بزرگ (LLMs) برای اهداف مخرب مانند توسعه سلاح وجود دارد.

برای درک و کاهش این خطرات، سازمان‌های دولتی و آزمایشگاه‌های هوش مصنوعی به طور یکسان در حال اندازه‌گیری میزان درک و تولید محتوای مرتبط با موضوعات خطرناک مانند امنیت زیستی، امنیت سایبری و امنیت شیمیایی توسط مدل‌های زبان بزرگ هستند.

با این حال، این کار محرمانه است و در حال حاضر خصوصی است، که واقعاً به نفع هوش مصنوعی در گفتمان عمومی کمک نمی کند.

اکنون گروهی از کارشناسان فکر می‌کنند که این محدودیت باید بررسی شود. آنها یک بنچمارک جدید به نام مجموعه داده WMDP (نماینده سلاح‌های کشتار جمعی) ایجاد کرده‌اند.

این مجموعه داده نه تنها روشی برای بررسی اینکه آیا یک مدل هوش مصنوعی اطلاعات خطرناکی دارد ارائه می‌دهد و راهی برای حذف آن اطلاعات مخرب در حالی که بقیه مدل را بدون تغییر نگه می‌دارد پیشنهاد می‌کند

01
از 02
چگونه کار می کند؟

پژوهشگران با مشاوره با کارشناسان امنیت زیستی، سلاح‌های شیمیایی و امنیت سایبری کار خود را آغاز کردند. این کارشناسان تمام راه‌های احتمالی وقوع آسیب در زمینه‌های خود را فهرست کردند.

سپس، آنها 4000 سوال چند گزینه‌ای برای سنجش دانش فرد در مورد چگونگی ایجاد این آسیب‌ها ایجاد کردند. آنها مطمئن شدند که سوالات هیچ اطلاعات حساسی را فاش نمی کنند تا بتوان آنها را به صورت علنی به اشتراک گذاشت.

مجموعه داده WMDP دو هدف اصلی را دنبال می‌کند: اول، به عنوان راهی برای ارزیابی میزان درک مدل‌های زبان بزرگ از موضوعات خطرناک، و دوم، به عنوان معیاری برای توسعه روش‌هایی برای «فراموش کردن» این دانش از مدل‌ها.

این تیم همچنین یک روش حذف یادگیری جدید به نام CUT معرفی کرده است که همانطور که از نامش پیداست، دانش خطرناک را از مدل‌های زبان بزرگ حذف می‌کند و در عین حال همچنان توانایی‌های کلی آنها را در زمینه‌های دیگر مانند زیست‌شناسی و علوم کامپیوتر حفظ می‌کند.

به طور کلی، هدف ارائه ابزاری به محققان برای ارزیابی و رسیدگی به خطرات مرتبط با استفاده از مدل‌های زبان بزرگ برای اهداف مخرب است.

02
از 02
کاخ سفید نگران است

کاخ سفید نگران استفاده از هوش مصنوعی توسط بازیگران مخرب برای توسعه سلاح‌های خطرناک است، بنابراین خواستار تحقیق برای درک بهتر این خطر شده است.

در اکتبر 2023، رئیس جمهور بایدن یک دستور اجرایی امضا کرد تا اطمینان حاصل شود که ایالات متحده در به کارگیری پتانسیل و رسیدگی به خطرات مرتبط با هوش مصنوعی نقش رهبری را ایفا می کند.

این دستورالعمل هشت اصل و اولویت راهنما برای استفاده مسئولانه از هوش مصنوعی را ترسیم می‌کند، از جمله ایمنی، امنیت، حریم خصوصی، برابری، حقوق مدنی، حمایت از مصرف‌کننده، توانمندسازی کارگر، نوآوری، رقابت و رهبری جهانی.

«دولت من بالاترین اولویت را بر مدیریت توسعه و استفاده ایمن و مسئولانه از هوش مصنوعی قرار می دهد و بنابراین رویکرد هماهنگ و کل دولت فدرال را برای انجام این کار پیش می برد. سرعت بالای پیشرفت قابلیت های هوش مصنوعی، ایالات متحده را مجبور می کند تا در این لحظه به خاطر امنیت، اقتصاد و جامعه پیشگام باشد.»، دستورالعمل اجرایی بیان کرد.

اما در حال حاضر، روش‌هایی که شرکت‌های هوش مصنوعی برای کنترل خروجی سیستم‌های خود استفاده می‌کنند، به راحتی قابل دور زدن هستند. همچنین، آزمایش‌ها برای بررسی اینکه آیا یک مدل هوش مصنوعی ممکن است خطرناک باشد، پرهزینه و زمان‌بر هستند.

دن هندریکس، مدیر اجرایی مرکز ایمنی هوش مصنوعی و نویسنده اول این مطالعه به مجله تایم گفت: «امیدواریم این به عنوان یکی از معیارهای اصلی که همه توسعه‌دهندگان متن‌باز مدل‌های خود را با آن مقایسه می‌کنند، پذیرفته شود. این یک چارچوب خوب برای حداقل سوق دادن آنها به حداقل کردن مسائل ایمنی فراهم می کند.»

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

زنی با چهره‌ای غمگین در حال حمل جعبه وسایل شخصی خود پس از اخراج از محیط کار.
اخبار هوش مصنوعی

هوش مصنوعی؛ مقصر اصلی اخراج‌های گسترده در سال ۲۰۲۵

نوشته شده توسط اسما کلهر
6 دی 1404
لوگوی رسمی ChatGPT با نشان نمادین گره‌ای سفید در مرکز، روی پس‌زمینه گرادیانی بنفش و آبی با افکت حرکتی دیجیتال
اخبار هوش مصنوعی

تبلیغات اسپانسرشده ممکن است وارد پاسخ‌های ChatGPT شود

نوشته شده توسط تارخ ترهنده
6 دی 1404
پرتره نزدیک از ایلان ماسک با چهره‌ای جدی در یک محیط رسمی یا مصاحبه.
پیشنهاد سردبیر

افشاگری تکان‌دهنده ایلان ماسک: «پدرم شرور به تمام معناست»

نوشته شده توسط اسما کلهر
6 دی 1404
برچسب هشدار سلامت رسانه‌های اجتماعی در نیویورک
شبکه های اجتماعی

نیویورک رسانه‌های اجتماعی را به نصب «برچسب هشدار سلامت» ملزم کرد

نوشته شده توسط اسما کلهر
6 دی 1404
والپیپر رسمی Halo Campaign Evolved با نمایش شخصیت زره‌پوش نمادین سری Halo در محیط طبیعی سیاره Halo، حضور سازه‌های باستانی فوررانر و لوگوی بازی در مرکز تصویر
اخبار هوش مصنوعی

ایکس‌باکس توسعه بازی Halo را به هوش مصنوعی می‌سپارد

نوشته شده توسط تارخ ترهنده
6 دی 1404
خبر بعدی

افزایش سهم حسگرهای دوربین سونی در گوشی های سامسونگ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

انواع اتصال گوشی و نحوه کار هرکدام

انواع اتصال گوشی چیست؟ + نحوه کار

16 آذر 1404 - به‌روزشده در 17 آذر 1404
رابط کاربری اینستاگرام Reels روی چند آیفون با پس‌زمینه گرادیانی قرمز و نارنجی، همراه با نمایش ویدیوهای کوتاه و صفحه اشتراک‌گذاری

شخصی‌سازی محتوای الگوریتم ریلز اینستاگرام با هوش مصنوعی فعال شد

19 آذر 1404

داغ‌ترین‌های روز

سامانه پدافند هوایی S-500 روسیه روی خودروی پرتابگر

پدافند هوایی S-500 روسیه رسما آغاز به کار کرد

29 آذر 1404
نمای پشت گوشی Honor Power 2 در سه رنگ نارنجی، سفید و مشکی، با بدنه تخت، ماژول دوربین مستطیلی با سه لنز بزرگ و طراحی الهام‌گرفته از پرچم‌داران مدرن، تمرکز بر تنوع رنگ و هویت بصری محصول

این گوشی کپی برابر اصل آیفون ۱۷ پرو است

5 دی 1404
تایید انتشار رابط کاربری One UI 8.5 برای سری A سامسونگ

تایید انتشار رابط کاربری One UI 8.5 برای سری A سامسونگ

4 دی 1404
اسکرین‌شات کامل از محیط فایل اکسپلورر ویندوز ۱۱ در پوشه تصاویر (Pictures).

ویندوز ۱۱ سبک‌تر می‌شود؛ راهکار جدید مایکروسافت برای کاهش مصرف رم در فایل اکسپلورر

5 دی 1404
نمای نزدیک از ساعت هوشمند Huawei Watch نسخه دهمین سالگرد با بدنه فلزی، تاج چرخان و صفحه نمایش دایره‌ای حاوی ویجت‌ های سلامت و زمان، تمرکز بر طراحی پریمیوم و رابط کاربری پیشرفته

هواوی نسخه دهمین سالگرد هواوی واچ را هم‌زمان با نوا ۱۵ معرفی می‌کند

26 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

تصویر دو کارت گرافیک رادئون سه فن که روی مجموعه‌ای از تراشه‌های GPU چیده شده‌اند.

اقدام تحسین‌برانگیز «زفیر» در پی بحران خرابی پردازنده‌های گرافیکی سری RX 6000

6 دی 1404
نمای نیم‌رخ لپ‌تاپ Framework که طراحی باریک و لوگوی برند روی درب آن را نشان می‌دهد.

شوک قیمتی در بازار حافظه؛ افزایش دوباره قیمت های رم شرکت «فریم‌ورک»

6 دی 1404
زنی با چهره‌ای غمگین در حال حمل جعبه وسایل شخصی خود پس از اخراج از محیط کار.

هوش مصنوعی؛ مقصر اصلی اخراج‌های گسترده در سال ۲۰۲۵

6 دی 1404
لوگوی رسمی ChatGPT با نشان نمادین گره‌ای سفید در مرکز، روی پس‌زمینه گرادیانی بنفش و آبی با افکت حرکتی دیجیتال

تبلیغات اسپانسرشده ممکن است وارد پاسخ‌های ChatGPT شود

6 دی 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir