• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » ساخت ابزار جدید حذف داده های خطرناک از مدل های هوش مصنوعی

ساخت ابزار جدید حذف داده های خطرناک از مدل های هوش مصنوعی

صمد کردی نوشته شده توسط صمد کردی
دوشنبه 21 اسفند 1402 - 20:00
در اخبار هوش مصنوعی, فناوری
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. چگونه کار می کند؟
  • 2. کاخ سفید نگران است

یک گروه از کارشناسان با ایجاد یک بنچمارک جدید به نام مجموعه داده‌های نماینده سلاح‌های کشتار جمعی (WMDP)، راهی برای بررسی اطلاعات خطرناک در مدل‌های هوش مصنوعی و حذف آنها فراهم کرده‌اند.

به گزارش تک‌ناک هوش مصنوعی (AI)، همانند دیگر فناوری‌ها مانند ویرایش ژن و انرژی هسته‌ای، می‌تواند برای اهداف خوب و بداستفاده شود. با توجه به حجم زیاد پول و تلاشی که با سرعت بالا صرف توسعه هوش مصنوعی می‌شود، نگرانی‌هایی در مورد استفاده از مدل‌های زبان بزرگ (LLMs) برای اهداف مخرب مانند توسعه سلاح وجود دارد.

برای درک و کاهش این خطرات، سازمان‌های دولتی و آزمایشگاه‌های هوش مصنوعی به طور یکسان در حال اندازه‌گیری میزان درک و تولید محتوای مرتبط با موضوعات خطرناک مانند امنیت زیستی، امنیت سایبری و امنیت شیمیایی توسط مدل‌های زبان بزرگ هستند.

با این حال، این کار محرمانه است و در حال حاضر خصوصی است، که واقعاً به نفع هوش مصنوعی در گفتمان عمومی کمک نمی کند.

اکنون گروهی از کارشناسان فکر می‌کنند که این محدودیت باید بررسی شود. آنها یک بنچمارک جدید به نام مجموعه داده WMDP (نماینده سلاح‌های کشتار جمعی) ایجاد کرده‌اند.

این مجموعه داده نه تنها روشی برای بررسی اینکه آیا یک مدل هوش مصنوعی اطلاعات خطرناکی دارد ارائه می‌دهد و راهی برای حذف آن اطلاعات مخرب در حالی که بقیه مدل را بدون تغییر نگه می‌دارد پیشنهاد می‌کند

01
از 02
چگونه کار می کند؟

پژوهشگران با مشاوره با کارشناسان امنیت زیستی، سلاح‌های شیمیایی و امنیت سایبری کار خود را آغاز کردند. این کارشناسان تمام راه‌های احتمالی وقوع آسیب در زمینه‌های خود را فهرست کردند.

سپس، آنها 4000 سوال چند گزینه‌ای برای سنجش دانش فرد در مورد چگونگی ایجاد این آسیب‌ها ایجاد کردند. آنها مطمئن شدند که سوالات هیچ اطلاعات حساسی را فاش نمی کنند تا بتوان آنها را به صورت علنی به اشتراک گذاشت.

مجموعه داده WMDP دو هدف اصلی را دنبال می‌کند: اول، به عنوان راهی برای ارزیابی میزان درک مدل‌های زبان بزرگ از موضوعات خطرناک، و دوم، به عنوان معیاری برای توسعه روش‌هایی برای «فراموش کردن» این دانش از مدل‌ها.

این تیم همچنین یک روش حذف یادگیری جدید به نام CUT معرفی کرده است که همانطور که از نامش پیداست، دانش خطرناک را از مدل‌های زبان بزرگ حذف می‌کند و در عین حال همچنان توانایی‌های کلی آنها را در زمینه‌های دیگر مانند زیست‌شناسی و علوم کامپیوتر حفظ می‌کند.

به طور کلی، هدف ارائه ابزاری به محققان برای ارزیابی و رسیدگی به خطرات مرتبط با استفاده از مدل‌های زبان بزرگ برای اهداف مخرب است.

02
از 02
کاخ سفید نگران است

کاخ سفید نگران استفاده از هوش مصنوعی توسط بازیگران مخرب برای توسعه سلاح‌های خطرناک است، بنابراین خواستار تحقیق برای درک بهتر این خطر شده است.

در اکتبر 2023، رئیس جمهور بایدن یک دستور اجرایی امضا کرد تا اطمینان حاصل شود که ایالات متحده در به کارگیری پتانسیل و رسیدگی به خطرات مرتبط با هوش مصنوعی نقش رهبری را ایفا می کند.

این دستورالعمل هشت اصل و اولویت راهنما برای استفاده مسئولانه از هوش مصنوعی را ترسیم می‌کند، از جمله ایمنی، امنیت، حریم خصوصی، برابری، حقوق مدنی، حمایت از مصرف‌کننده، توانمندسازی کارگر، نوآوری، رقابت و رهبری جهانی.

«دولت من بالاترین اولویت را بر مدیریت توسعه و استفاده ایمن و مسئولانه از هوش مصنوعی قرار می دهد و بنابراین رویکرد هماهنگ و کل دولت فدرال را برای انجام این کار پیش می برد. سرعت بالای پیشرفت قابلیت های هوش مصنوعی، ایالات متحده را مجبور می کند تا در این لحظه به خاطر امنیت، اقتصاد و جامعه پیشگام باشد.»، دستورالعمل اجرایی بیان کرد.

اما در حال حاضر، روش‌هایی که شرکت‌های هوش مصنوعی برای کنترل خروجی سیستم‌های خود استفاده می‌کنند، به راحتی قابل دور زدن هستند. همچنین، آزمایش‌ها برای بررسی اینکه آیا یک مدل هوش مصنوعی ممکن است خطرناک باشد، پرهزینه و زمان‌بر هستند.

دن هندریکس، مدیر اجرایی مرکز ایمنی هوش مصنوعی و نویسنده اول این مطالعه به مجله تایم گفت: «امیدواریم این به عنوان یکی از معیارهای اصلی که همه توسعه‌دهندگان متن‌باز مدل‌های خود را با آن مقایسه می‌کنند، پذیرفته شود. این یک چارچوب خوب برای حداقل سوق دادن آنها به حداقل کردن مسائل ایمنی فراهم می کند.»

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

بازگشت متا به دنیای خبر با قراردادهای هوش مصنوعی
اخبار هوش مصنوعی

بازگشت متا به دنیای خبر با قراردادهای هوش مصنوعی

نوشته شده توسط اسما کلهر
14 آذر 1404
رونمایی بزرگ‌های فناوری در CES 2026 با محوریت هوش مصنوعی و تراشه‌های ۲ نانومتری
پیشنهاد سردبیر

در نمایشگاه فناوری CES 2026 شاهد چه اتفاقاتی خواهیم بود؟

نوشته شده توسط اسما کلهر
14 آذر 1404
طرح گرافیکی با پس‌زمینه تیره و اشکال انتزاعی آبی و بنفش که لوگوی کروی و پازلی ویکی‌پدیا را در مرکز نشان می‌دهد
فناوری

با این قابلیت ویکی‌پدیا می توانید فعالیت شخصی یکساله خود را مرور کنید

نوشته شده توسط اسما کلهر
14 آذر 1404
لوگوی تایپوگرافی شرکت OpenAI با رنگ مشکی بر روی پس‌زمینه‌ی سبزآبی و طرح‌های هندسی
اخبار هوش مصنوعی

رقابت داغ هوش مصنوعی؛ اپن‌ای‌آی با عرضه زودهنگام GPT-5.2 به گوگل پاسخ می‌دهد

نوشته شده توسط اسما کلهر
14 آذر 1404
نمای داخلی کابین خودروی تسلا شامل فرمان و صفحه نمایشگر لمسی مرکزی در محیط نمایشگاه.
اخبار هوش مصنوعی

نسخه جدید FSD تسلا رانندگان را به ارسال پیامک حین رانندگی دعوت می‌کند

نوشته شده توسط اسما کلهر
14 آذر 1404
خبر بعدی

افزایش سهم حسگرهای دوربین سونی در گوشی های سامسونگ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

تلفن محکم HMD Terra M با صفحه‌کلید فیزیکی و صفحه‌نمایش روشن، که در یک داک شارژ مشکی قرار دارد و نور سبز شارژ را نشان می‌دهد.

شرکت HMD یک گوشی هوشمند فوق‌مقاوم برای بخش‌های حساس معرفی کرد

27 آبان 1404
Microsoft AI says it’ll make superintelligent AI that won’t be terrible for humanity

طرح مایکروسافت برای ساخت هوش مصنوعی فوق هوشمند انسان گرا

15 آبان 1404 - به‌روزشده در 16 آبان 1404

داغ‌ترین‌های روز

باتری‌های قابل شارژ Portronics Lithius Cell با اندازه‌های AA و AAA که یک کابل USB-C در حال اتصال به یکی از آن‌ها دیده می‌شود.

پورترونیکس باتری‌های قلمی قابل شارژ با USB-C را رونمایی کرد

10 آذر 1404 - به‌روزشده در 11 آذر 1404
بررسی Redmi K90 Pro Max

بررسی Redmi K90 Pro Max ؛ اولین گوشی دنیا با ووفر از شرکت Bose!

9 آذر 1404 - به‌روزشده در 10 آذر 1404
مقایسه A17 با A26

مقایسه گلکسی A17 با A26؛ کدام میان‌رده سامسونگ ارزش خرید بیشتری دارد؟

9 آذر 1404 - به‌روزشده در 10 آذر 1404
نمای نزدیک (ماکرو) از پین‌های طلایی اتصال در زیر یک پردازنده کامپیوتری (CPU).

مایکروسافت لیست پردازنده‌هایی که از ویندوز ۱۱ پشتیبانی می‌کند منتشر کرد

12 آذر 1404
ترفندهای ساده برای بهینه‌سازی عملکرد SSD و افزایش سرعت سیستم

ترفندهای ساده برای بهینه‌سازی عملکرد SSD و افزایش سرعت سیستم

9 آذر 1404 - به‌روزشده در 10 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

بازگشت متا به دنیای خبر با قراردادهای هوش مصنوعی

بازگشت متا به دنیای خبر با قراردادهای هوش مصنوعی

14 آذر 1404
رونمایی بزرگ‌های فناوری در CES 2026 با محوریت هوش مصنوعی و تراشه‌های ۲ نانومتری

در نمایشگاه فناوری CES 2026 شاهد چه اتفاقاتی خواهیم بود؟

14 آذر 1404
طرح گرافیکی با پس‌زمینه تیره و اشکال انتزاعی آبی و بنفش که لوگوی کروی و پازلی ویکی‌پدیا را در مرکز نشان می‌دهد

با این قابلیت ویکی‌پدیا می توانید فعالیت شخصی یکساله خود را مرور کنید

14 آذر 1404
لوگوی تایپوگرافی شرکت OpenAI با رنگ مشکی بر روی پس‌زمینه‌ی سبزآبی و طرح‌های هندسی

رقابت داغ هوش مصنوعی؛ اپن‌ای‌آی با عرضه زودهنگام GPT-5.2 به گوگل پاسخ می‌دهد

14 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir