• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » اپل مدل هوش مصنوعی UniGen 1.5 را برای تولید و ویرایش تصاویر معرفی کرد

اپل مدل هوش مصنوعی UniGen 1.5 را برای تولید و ویرایش تصاویر معرفی کرد

اسما کلهر نوشته شده توسط اسما کلهر
جمعه 28 آذر 1404 - 23:20 - به‌روزشده در شنبه 29 آذر 1404 - 07:55
در اخبار هوش مصنوعی, فناوری
دو تصویر در کنار هم از یک کاسه میوه که در یکی دانه‌های انار و در دیگری انگور قرار دارد، برای نمایش قابلیت ویرایش هوش مصنوعی.
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

اپل با معرفی مدل چندوجهی UniGen 1.5، یک چارچوب یکپارچه برای درک، تولید و ویرایش تصویر ارائه داده که با افزودن مرحله «هم‌ترازی دستورالعمل ویرایش» مبتنی بر یادگیری تقویتی، عملکردی رقابتی در معیارهای استاندارد صنعتی به‌دست آورده است.

به گزارش سرویس هوش‌مصنوعی تکناک، تیمی از محققان اپل، از آزمایشگاه‌های این شرکت، از توسعه و بهبود قابل توجهی در مدل هوش مصنوعی خود با نام “UniGen 1.5” خبر دادند. این سیستم پیشرفته، با تکیه بر مدل قبلی UniGen، توانایی‌های درک، تولید و ویرایش تصویر را در یک مدل واحد و یکپارچه مدیریت می‌کند، که گامی مهم در حوزه هوش مصنوعی چندوجهی محسوب می‌شود.

محققان اپل، پیش از این در ماه مه، مطالعه‌ای با عنوان “UniGen: استراتژی‌های بهبود یافته آموزش و زمان آزمایش برای درک و تولید چندوجهی یکپارچه” را منتشر کرده بودند. در آن زمان، آن‌ها یک مدل زبان بزرگ چندوجهی یکپارچه را معرفی کردند که قادر به درک و تولید تصویر در یک سیستم واحد بود و نیاز به مدل‌های جداگانه برای هر وظیفه را از بین می‌برد.

اکنون، در مقاله‌ای جدید با عنوان “UniGen-1.5: افزایش تولید و ویرایش تصویر از طریق یکپارچه‌سازی پاداش در یادگیری تقویتی”، اپل نشان داده است که چگونه این تحقیق جدید، یونی‌ژن را با افزودن قابلیت‌های ویرایش تصویر به همان چارچوب یکپارچه گسترش می‌دهد. این یکپارچه‌سازی کامل، درک، تولید و ویرایش را بدون نیاز به سیستم‌های مختلف مدیریت می‌کند.

یک نمودار فنی که فرآیند تولید و درک تصویر توسط مدل UniGen اپل را با مثال «میز ناهارخوری روی چمدان» توضیح می‌دهد.

یکپارچه‌سازی این قابلیت‌ها در یک سیستم واحد، به دلیل تفاوت در رویکردهای مورد نیاز برای درک و تولید تصاویر، همواره چالش‌برانگیز بوده است. با این حال، محققان اپل استدلال می‌کنند که یک مدل یکپارچه می‌تواند از توانایی درک خود برای بهبود عملکرد تولید استفاده کند.

یکی از چالش‌های اصلی در ویرایش تصویر برای مدل‌های هوش مصنوعی، به‌ویژه در تغییرات ظریف یا بسیار خاص، درک کامل دستورالعمل‌های ویرایش پیچیده است. UniGen-1.5، برای رفع این مشکل، یک مرحله جدید پس از آموزش را با نام “هم‌ترازی دستورالعمل ویرایش” (Edit Instruction Alignment) معرفی می‌کند.

اپل یک مدل هوش مصنوعی واحد می‌سازد که می‌تواند تصاویر را ببیند، ایجاد و ویرایش کند

این مرحله، که پس از تنظیم دقیق نظارت‌شده (SFT) انجام می‌شود، مدل را بهینه‌سازی می‌کند تا توصیف متنی دقیقی از آنچه تصویر ویرایش‌شده باید شامل شود، بر اساس تصویر اصلی و دستورالعمل ویرایش، استنتاج کند. سپس، یادگیری تقویتی به کار گرفته می‌شود تا مدل را با پاداش دادن به خروجی‌های بهتر و جریمه کردن خروجی‌های ضعیف‌تر آموزش دهد. این مرحله میانی، به مدل کمک می‌کند تا ویرایش مورد نظر را بهتر درونی‌سازی کند، قبل از تولید تصویر نهایی.

محققان اپل یک سیستم پاداش یکسان را برای تولید و ویرایش تصویر در UniGen-1.5 به کار گرفتند، که خود دستاوردی مهم تلقی می‌شود، زیرا ویرایش‌ها می‌توانند از تغییرات جزئی تا تبدیل‌های کامل متغیر باشند.

هنگامی که UniGen-1.5 بر روی چندین معیار استاندارد صنعتی، از جمله GenEval و DPG-Bench برای درک و تولید تصویر، و ImgEdit برای ویرایش تصویر آزمایش شد، این مدل چندین مدل زبان بزرگ چندوجهی پیشرفته (هم منبع باز و هم اختصاصی) را یا برابر کرد یا از آن‌ها پیشی گرفت. برای مثال، UniGen-1.5 در GenEval و DPG-Bench به ترتیب نمرات 0.89 و 86.83 را کسب کرد و در ویرایش تصویر، نمره کلی 4.31 را در ImgEdit به دست آورد که با مدل‌های اختصاصی مانند GPT-Image-1 قابل مقایسه است.

اپل یک مدل هوش مصنوعی واحد می‌سازد که می‌تواند تصاویر را ببیند، ایجاد و ویرایش کند

به نقل از 9to5mac، با این حال، محققان به برخی محدودیت‌ها نیز اشاره کردند. UniGen-1.5 در تولید متن دقیق و همچنین در حفظ سازگاری هویت تحت شرایط خاص (مانند تغییرات در بافت یا رنگ) مشکلاتی دارد. اپل متعهد است تا این محدودیت‌ها را در آینده برطرف کند.

این دستاورد، پایه‌ای قوی‌تر برای پیشبرد تحقیقات در مدل‌های زبان بزرگ چندوجهی یکپارچه فراهم می‌کند و نشان‌دهنده تعهد اپل به نوآوری در زمینه هوش مصنوعی مولد است.

اسما کلهر

اسما کلهر

دانش آموخته مترجمی زبان انگلیسی ،نویسنده حوزه تکنولوژی

مطالب مرتبط

نمای بالاسری از یک گوشی هوشمند قرارگرفته روی میز گرد روشن با رابط کاربری ChatGPT Voice، نمایش انیمیشن صوتی آبی‌رنگ و اشاره به قابلیت مکالمه صوتی پیشرفته هوش مصنوعی
اخبار هوش مصنوعی

اپ استور ChatGPT می‌تواند سالانه ۴۴ میلیارد دلار به اپل و گوگل ضرر بزند

نوشته شده توسط تارخ ترهنده
29 آذر 1404
لوگوی سفید واتس‌اپ روی پس‌زمینه سبز با طرح‌های خطی از آیکون‌های ارتباطی.
پیشنهاد سردبیر

واتساپ قابلیت جدید آزمون را برای کانال‌ها معرفی کرد

نوشته شده توسط اسما کلهر
29 آذر 1404
تصویرسازی هنری از فردی که گوشی به دست دارد و خطوط مدار الکترونیکی از صفحه نمایش به بیرون ساطع می‌شود.
اخبار هوش مصنوعی

گوگل مدل جدید FunctionGemma را معرفی کرد

نوشته شده توسط اسما کلهر
29 آذر 1404
تصویری از هیدئو کوجیما با نمایش یک سازه رباتیک بازویی در نزدیکی گوش، نورپردازی آبی و حال‌وهوای علمی‌تخیلی، مرتبط با فناوری‌ پیشرفته، روایت‌های آینده‌نگر و طراحی خلاقانه در صنعت سرگرمی
اخبار هوش مصنوعی

هیدئو کوجیما: هوش مصنوعی آینده بازی‌سازی را متحول می‌کند

نوشته شده توسط تارخ ترهنده
29 آذر 1404
کارشناس وب‌سایت RTINGS.com در میان قفسه‌های آزمایشگاه بررسی دوام و کیفیت تلویزیون‌ها.
فناوری

آزمایش سه‌ساله RTINGS؛ تلویزیون‌های اولد از LCD مطمئن‌ترند + ویدئو

نوشته شده توسط اسما کلهر
29 آذر 1404
خبر بعدی
نمای رابط کاربری Duck.ai در DuckDuckGo با ابزار تولید تصویر هوش مصنوعی، نمایش پیش‌نمایش لوگوی DuckDuckGo به‌صورت رندر فتورئال با نماد اردک و پاپیون سبز، تمرکز بر قابلیت‌های Image Generation و حفظ حریم خصوصی

قابلیت تولید تصویر با هوش مصنوعی به DuckDuckGo اضافه شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

هوش‌مصنوعی گوگل

گوگل امکان پرو مجازی لباس را با سلفی فراهم کرد

21 آذر 1404
نمای روبه‌روی Rimac Nevera R Founder’s Edition

فروش کامل خاص ترین ابرخودرو ریماک تنها در یک هفته

29 آذر 1404

داغ‌ترین‌های روز

پوستر تبلیغاتی ساعت Rogbid در طبیعت که قابلیت چراغ‌قوه جانبی و مسیریابی روی صفحه آن فعال است.

ساعت هوشمند راگبید Enduro با باتری ۱۱۰۰ میلی‌آمپر ساعتی عرضه شد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
نمای نزدیک از ساعت هوشمند Huawei Watch نسخه دهمین سالگرد با بدنه فلزی، تاج چرخان و صفحه نمایش دایره‌ای حاوی ویجت‌ های سلامت و زمان، تمرکز بر طراحی پریمیوم و رابط کاربری پیشرفته

هواوی نسخه دهمین سالگرد هواوی واچ را هم‌زمان با نوا ۱۵ معرفی می‌کند

26 آذر 1404
تصویر یک تولیدکننده محتوای نگران را نشان می‌دهد که مقابل مانیتور با نمودار درآمد در حال سقوط و لوگوی یوتیوب نشسته است و کاهش شدید درآمد تبلیغاتی را به‌صورت نمادین نمایش می‌دهد.

زلزله در یوتیوب فارسی؛ سقوط ۹۰ درصدی درآمد تولیدکنندگان محتوا

26 آذر 1404
اگر ارزش صندوق‌های ETF ریپل (XRP) به ۱۰ میلیارد دلار برسند چه اتفاقی می‌افتد؟

اگر ارزش صندوق‌های ETF ریپل (XRP) به ۱۰ میلیارد دلار برسند چه اتفاقی می‌افتد؟

23 آذر 1404 - به‌روزشده در 24 آذر 1404
اپل برای عرضه هشت آیفون جدید آماده می‌ شود

اپل برای عرضه هشت آیفون جدید آماده می‌ شود

26 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نمای بالاسری از یک گوشی هوشمند قرارگرفته روی میز گرد روشن با رابط کاربری ChatGPT Voice، نمایش انیمیشن صوتی آبی‌رنگ و اشاره به قابلیت مکالمه صوتی پیشرفته هوش مصنوعی

اپ استور ChatGPT می‌تواند سالانه ۴۴ میلیارد دلار به اپل و گوگل ضرر بزند

29 آذر 1404
لوگوی سفید واتس‌اپ روی پس‌زمینه سبز با طرح‌های خطی از آیکون‌های ارتباطی.

واتساپ قابلیت جدید آزمون را برای کانال‌ها معرفی کرد

29 آذر 1404
تصویرسازی هنری از فردی که گوشی به دست دارد و خطوط مدار الکترونیکی از صفحه نمایش به بیرون ساطع می‌شود.

گوگل مدل جدید FunctionGemma را معرفی کرد

29 آذر 1404
نمای نزدیک و انتزاعی از یک برد مدار چاپی (PCB) با تراشه‌ها و نورپردازی آبی درخشان.

نقص جدید UEFI راه را برای حملات قبل از بوت بر روی مادربردها می‌گشاید

29 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir