به گزارش پلاتو هنر، شرکت OpenAI هفته گذشته از جدیدترین مدل هوش مصنوعی خود به نام Sora رونمایی کرد که میتواند ویدئوهای یک دقیقه با واقعنمایی بالا تولید کند. ویدئوهایی که از Sora در شبکههای مجازی دستبهدست شد، همگی فاقد صدا بودند و اکنون، استارتآپ ایلوِنلبز (ElevenLabs) از این موقعیت استفاده کرده تا مهارت مدل جدید خودش را نشان دهد.
پیوتر دابکوفسکی و متی استانیسزوسکی، استارتآپ ایلوِنلبز را در سال 2022 تاسیس کردند و در تلاش هستند تا نرمافزارهای تبدیل متن به گفتار، ابزار دوبله و صداگذاری مبتنی بر هوش مصنوعی توسعه دهند.
خبرگزاری ایسنا طی گزارشی عنوان کرد که «اکنون این شرکت روی چیز جدیدی کار میکند، که طبق گزارشها میتواند صداهایی را برای همراهی با فیلمهای ویدئویی بیصدا بر اساس توضیحات یک صحنه ارائه شده توسط کاربر ایجاد کند.»
این شرکت برای نشان دادن مهارت خود، تعدادی از فیلمهای صامت Sora را صداگذاری کرده است که ظاهرا این صداها در نتیجه پرامپتهای متنی هستند. ایلوِنلبز ویدئویی در کانال یوتیوب خود منتشر کرده که در آن صحنههای مختلف را با استفاده از این مدل جدیدش صداگذاری کرده است. این ویدئو را در ادامه میتوانید مشاهده کنید:
این شرکت عنوان کرد: «ما از پیامهای متنی مانند «برخورد امواج»، «صدای برخورد فلزات»، «صدای پرندگان» و «موتور ماشین مسابقهای» برای تولید صدا استفاده کردیم که روی برخی از کلیپهای مورد علاقهمان از اعلان سورا قرار دادیم.»
بیشتر بخوانید: