متا ابزار تولید پادکست هوش مصنوعی متن باز NotebookLlama را منتشر کرد که به کاربران اجازه میدهد پادکستها را به طور خودکار تولید کنند.
به گزارش سرویس فناوری تکناک، این ابزار از مدلهای زبانی Llama ساخت متا برای پردازش بیشتر محتوای متنی استفاده میکند. این سیستم میتواند مانند NotebookLM شرکت گوگل، فایلهای متنی آپلودشده را به شکل دیالوگهای پادکستمانند خلاصهسازی کند.
در فرایند کاری ابزار تولید پادکست NotebookLlama، ابتدا یک نسخه متنی از یک فایل، مثل PDF مقالات خبری یا پستهای وبلاگ تولید میشود. سپس سیستم با افزودن عناصر دراماتیک و وقفههای بیشتر، این نسخه را به مدلهای متن به گفتار باز انتقال میدهد تا نتیجه نهایی به صورت صوتی آماده شود.
نتایج کنونی NotebookLlama به کیفیت NotebookLM نرسیدهاند. در نمونههای شنیداری تولیدشده توسط NotebookLlama، کیفیت صداها به طور واضحی روباتیک است و گاهی در نقاط نامناسب همپوشانی یا تداخل دارند.
با وجود این، محققان متا معتقد هستند که این کیفیت را میتوان با مدلهای قویتر بهبود بخشید. طبق گفته آنان در صفحه GitHub پروژه NotebookLlama، «مدل متن به گفتار محدودیتی برای میزان طبیعی بودن صدا ایجاد میکند.» آنها بیان کردند که یکی از روشهای احتمالی بهبود، بهرهگیری از دو عامل مختلف برای بحث در خصوص موضوع موردنظر و نگارش طرح پادکست است. در حال حاضر، این پروژه از یک مدل واحد برای ایجاد طرح پادکست استفاده میکند.
NotebookLlama اولین تلاش برای شبیهسازی ویژگی تولید پادکست در NotebookLM نیست و برخی پروژهها به موفقیتهای بیشتری دست یافتهاند. هرچند که هیچیک از این سیستمها (حتی NotebookLM خود گوگل) نتوانستهاند مشکل «توهم» که مختص به تمامی AIها است را برطرف کنند. این مشکل باعث میشود که پادکستهای تولیدشده توسط AI شامل اطلاعات ساختگی شود و از دقت کامل برخوردار نباشند.