به گزارش پلاتو هنر، «این اولین باری بود که احساس کردم زمین زیرپایم میلرزد.» این جمله را فیلمسازی به نام پال تریلو در واکنش به تواناییهای ابزار تبدیل متن به ویدئو Sora گفته است!
15 فوریه امسال بود که OpenAI شرکت سازنده چتبات ChatGPT و ابزار تبدیل متن به عکس Dall-E، از ابزار تبدیل متن به ویدئو Sora در ایکس رونمایی کرد. سم آلتمن مدیرعامل این شرکت، در صفحه ایکس خود از کاربران خواست تا چند پرامپت پیشنهاد دهند. آلتمن هم با ویدئوییهایی که با Sora ساخته بود به پرامپتهای پیشنهادی مخاطبانش پاسخ داد!
Sora در زبان ژاپنی به معنی آسمان است و احتمالا سازندگان آن، چنین اسمی را انتخاب کردند تا در ذهن، تداعیگر خلاقیت بدون حدومرز باشد. این ابزار پرامپتهای متنی کاربران را به ویدئوهای صامت یک دقیقهای تبدیل میکند. البته، «سورا» اولین ابزار تبدیل متن به ویدئو نیست. پیش از آن، ابزارهای هوش مصنوعی زیادی برای ساخت ویدئو وجود داشتند اما مسئلهای که باعث شده تا Sora این همه سر زبانها بیافتد، توانایی منحصربهفرد آن در واقعنمایی صحنهها است. ویدئوهای «سورا» توانایی این ابزار در خلق ویدئوهایی باکیفیت بالا از صحنههای پیچیده که جزئیات زیادی دارند را نشان میدهد.
پال تریلو فیلمساز و مشاور برخی از کمپانیهای هوش مصنوعی عنوان کرد که تواناییهای «سورا» و کیفیت ویدئوهایش او را شگفتزده میکند اما تا زمانی که «سورا» تبدیل به برنامهای منبعباز نشود و به هنرمندان اجازه کنترل کامل و شخصیسازی ندهد، او نمیداند که Sora مخل این صنعت است یا صرفا یک دمو خوب از محصول یک شرکت فناوری.
او مطرح کرد: «به نظرم Sora به کار کسانی میآید که هنوز در ابتدای مسیر فیلمسازی هستند و میخواهند آزمونوخطا کنند و ایدههایشان را امتحان کنند اما امکانات کافی ندارند.»
یکی از ویدئوهای Sora، موجودی را نشان میدهد که در جنگل بالاوپایین میپرد و به یک قارچ میرسد. تریلو با اشاره به این ویدئو عنوان کرد که «سورا» ترتیب رخ دادن وقایع در یک پرامپت پیچیده که چندین اتفاق همزمان با هم رخ میدهند را متوجه میشود و همین توانایی باعث میشود تا Sora یک قدم به ابزاری مفیدی برای داستانگویی نزدیکتر شود.
تریلو که در کمپانیهای هوش مصنوعی زیادی به عنوان مشاور ساخت ابزارهایشان حضور داشته، گفت: «این اولین باری بود که احساس کردم زمین زیرپایم میلرزد. این نگرانکننده است اما در عین حال نمیشود برایش شگفتزده نبود.»
Sora علاوهبر همه تواناییهای نگرانکنندهای که دارد، ضعفهایی هم دارد. شاید یکی از بزرگترین ضعفهای آن، صامت بودن ویدئوها باشد. در ویدئوهای «سورا»، شخصیتها نمیتوانند دیالوگ بگویند.
یکی دیگر از ضعفهای Sora، قوانین سختگیرانه شرکت OpenAI است که به کاربران اجازه ساخت صحنههای خشن برای فیلمهای جنایی و اکشن را نمیدهد. برخی از فیلمسازان تلاش کردند تا این محدودیتها را دور بزنند و برای مثال، به جای استفاده از کلمه خون در پرامپتهایشان، از کلمه سس کچاپ استفاده کردند اما در نهایت جز ناامیدی، نتیجه دیگری دستگیرشان نشد. باتوجه به قوانین سختگیرانه این شرکت، ساخت صحنههای عاشقانه با Sora هم سرنوشتی مثل سرنوشت صحنههای خشن و اکشن را دارند.
Sora میتواند نمای 60 ثانیهای قابل قبولی تولید کند ولی این به آن معنا نیست که میتواند یک فیلم منسجم هم بسازد. حتی اگر هالیوود بخواهد از ابزارهای هوش مصنوعی مولد مانند «سورا» استفاده کند، امکان اینکه تولیدات هوش مصنوعی را کپیرایت کند، وجود ندارد. ادوارد کلاریس وکیل دادگستری عنوان کرد که «استودیوها باید خیلی مراقب باشند تا هوش مصنوعی مولد را در مراحل ساخت تولیداتشان به کار نگیرند» زیرا در غیر این صورت، با توجه به اینکه فعلا قانون کپیرایت شامل تولیدات هوش مصنوعی نمیشود، آنها عملا دارند آثاری را تولید میکنند که «تحت پوشش قوانین مالکیت فکری نیستند.»
گری مارکس پژوهشگر حوزه هوش مصنوعی با اشاره به ظاهر و غیب شدن یک دفعه اجسام یا تغییر شکل ناگهانی آنها در ویدئوهای «سورا» عنوان کرد که فکر نمیکند این ابزار مناسب تولیدات حرفهای سینما و تلوزیون باشد.
نشریه هالیوود ریپورتر طی گزارشی اعلام کرده بود که در ماه ژانویه، مطالعهای با حضور ۳۰۰ تن از مدیران هالیوود صورت گرفت و سه چهارم آنها عنوان کردند که ابزارهای هوش مصنوعی به حذف و کاهش مشاغل در شرکتهایشان میانجامند. براساس این مطالعه، تا سه سال آینده، نزدیک ۲۰۴,۰۰۰ موقعیت شغلی شدیدا تحتتاثیر هوش مصنوعی و ابزارهای آن قرار خواهند گرفت.
در این مطالعه همچنین مطرح شد که اگر این فناوری به رشد خود ادامه دهد، مهندسین صدا، صدا پیشگان و طراحان کانسپت در معرض بیشترین خطر جابهجایی با هوش مصنوعی قرار دارند. جلوههای بصری و دیگر کارهای مربوط به بخش پساتولید فیلم نیز به همان مقدار در معرض تهدید قرار دارند.
کارلا اُرتیز طراح کانسپت بعضی از فیلمهای کمپانی مارول گفت: «این مشخصا یک زنگ خطر برای اتحادیهها و هر متخصصی با هر توانایی است. این نشان میدهد که این فناوری اینجا است تا با ما رقابت کند. این تنها قدم اول است.» او با اشاره به اینکه از هوش مصنوعی مولد دارد در ساخت پروژهها استفاده میشود، مطرح کرد: «هوش مصنوعی صنعت ما را از بین خواهد برد.»
البته هنرمندانی هم مانند دیوید استریپینیس وجود دارند که حاضر به استفاده از هوش مصنوعی و ابزارهای آن هستند. دیوید استریپینیس طراح جلوههای بصری فیلمهای «آواتار» و «مرد پولادین» درمورد این مسئله گفت: «این صنعت همیشه دنبال راههای کم خرج برای انجام هر کاری است. من از این فناوری استفاده خواهم کرد چون دو راه بیشتر ندارم: یا آن را بپذیرم یا با امیدوار بودن، جلوی فاجعه را بگیرم.»
تعدادی هنرمند طی گفتگوهایشان با نشریه هالیوود ریپورتر، خبر از به کار گیری ابزارهای هوش مصنوعی مانند میدجرنی در هالیوود را دادند. آنها عنوان کردند که رندرهای اولیه را با کمک این ابزار میسازند و سپس، تغییراتی را روی آنها اعمال میکنند.
دیوید استریپینیس در رابطه با کاهش هزینهها عنوان کرد: «بزرگترین مشکل در جلوههای بصری این است که کارفرما نمیداند چه چیزی میخواهد و موقعی که میگوید کاری که انجام دادید درست نیست، در حقیقت شما 15,000 دلار خرج انجام ایده اشتباهی کردید.» او در ادامه مطرح کرد که با استفاده از این فناوری، کارگردانان میتوانند چیزی که در نظر دارند را بهتر بیان کنند.
ابزار Sora با همه مزایای نگرانکنندهای که به همراه دارد، هنوز نمیتواند کاملا نیازهای یک فیلمساز را بر طرف کند یا به عبارتی دیگر، یک فیلم کامل بسازد و همچنان در حد یک ابزار است نه یک جایگزین! این ابزار هنوز در دسترس عموم قرار نگرفته و فعلا توسط متخصصین و فیلمسازان در مرحله ارزیابی است.
فاطمه زهرا معصومی
منابع:
Hollywood Reporter, ”AI’s New Job? All-Purpose Hollywood Crewmember”, 2024
IndieWire, ”Is OpenAI’s Sora the Filmmaking Apocalypse, or Just a Great Demo for a Tech Company?”, 2024
بیشتر بخوانید: