متن به ویدیو خود به نام Sora

OpenAI ابزار جدید متن به ویدیو خود به نام Sora را راه‌اندازی کرد

سرفصل‌های مقاله

کمپانی OpenAI، سازنده ChatGPT و Dall-E، با راه‌اندازی Sora به رقابت تولید محتوای هوش مصنوعی متن به ویدیو پیوسته است، که توانایی تولید ویدیوهای تا یک دقیقه بر اساس درخواست کاربر را دارد.

این شرکت چندین ویدئوی تاثیرگذار را که با استفاده از سورا ایجاد شده بود، از جمله زنی که در خیابانی در توکیو قدم می‌زد و فیلم‌های تاریخی کالیفرنیا در دوران طوفان طلا در زمان رونمایی نشان داد.

هوش مصنوعی متن به ویدیو Sora

هوش مصنوعی متن به ویدیو Sora

Sora در حال حاضر برای عموم مردم در حال پیش نمایش است اما برای گروه‌های منتخبی مانند کارشناسان امنیتی و سازندگان در دسترس است. این شرکت اجازه داده است تا به افراد خاصی دسترسی داشته باشند تا در مورد چگونگی پیشبرد این مدل بازخورد کسب کنند تا برای متخصصان خلاق بسیار مفید باشد. تاریخ انتشار کلی هنوز به صورت عمومی اعلام نشده است.

این شرکت گفت: «ما در حال کار با تیم‌های قرمز، متخصصان حوزه در زمینه‌هایی مانند اطلاعات نادرست، محتوای نفرت‌انگیز و سوگیری هستیم، که به‌طور خصمانه مدل را آزمایش خواهند کرد.» ما همچنین در حال ساخت ابزارهایی برای کمک به شناسایی محتوای گمراه‌کننده مانند طبقه‌بندی تشخیصی هستیم که می‌تواند تشخیص دهد که یک ویدیو توسط Sora چه زمانی تولید شده است.

OpenAI اولین شرکتی نیست که این نوع فناوری را راه اندازی می‌کند. متا، گوگل و چندین شرکت دیگر نسخه‌های خود را از برنامه‌های تولید متن به ویدیو هوش مصنوعی راه اندازی کرده‌اند یا در حال راه اندازی هستند. برخی از محبوب‌ترین برنامه‌های موجود در بازار عبارتند از Stability AI، Runway، Pika و Google Lumiere. با این حال، تحلیل‌های صنعتی به کیفیت بالای ویدیوهای Sora به عنوان بهتر از اکثر رقبا اشاره کرده‌اند. شاید به همین دلیل است که تظاهرات سورا این همه هیاهو ایجاد کرده است.

شاید این مطلب هم برای‌تان جالب باشد: هوش مصنوعی گوگل (جمینی)

طبق گفته OpenAI، مزیت Sora در مقایسه با سایر مدل‌ها، فوتورئالیسم قابل توجه آن و توانایی آن در تولید کلیپ‌های طولانی‌تر از پرامپ‌های کوتاه است. سورا مبتنی بر درک عمیق زبان است و آن را قادر می‌سازد تا اعلان‌ها را تفسیر کند و شخصیت‌ها و احساسات را ایجاد کند.

از محصول جدید OpenAI چه انتظاری باید داشت

نسخه ی آزمایشی Sora توانایی خود را در تولید ویدیو از چند کلمه نشان داد، با این حال، توانایی خود را در تولید فیلم از یک تصویر یا یک توالی فریم نشان نداد. راه‌اندازی Sora باعث ایجاد هیجان می‌شود، اما چند نگرانی را نیز برانگیخته است. چنین فناوری می‌تواند برای تولید دیپ فیک و انتشار اطلاعات نادرست استفاده شود. می‌توانیم انتظار داشته باشیم که Sora محدودیت‌هایی برای محتوا از جمله افراد واقعی نامناسب یا استفاده از یک پلتفرم برای ایجاد محتوای حاوی هرزه‌نگاری یا خشونت داشته باشد.

آدیتیا رامش، محقق اصلی و سرپرست تیم Dall-E، می‌گوید: «راه‌حل اطلاعات نادرست شامل سطوحی از کاهش‌دهنده‌ها از سوی ما است، اما به درک جامعه و شبکه‌های اجتماعی نیز نیاز دارد.

یکی دیگر از نگرانی‌های سورا این است که می‌تواند آثار دارای حق چاپ دیگران را نقض کند. در حالی که OpenAI ادعا می‌کند که داده‌های آموزشی از محتوایی است که دارای مجوز یا در دسترس عموم است، همیشه ابهاماتی در مورد آنچه “در دسترس عموم” تلقی می‌شود وجود دارد. اگر OpenAI نتواند به این موضوع رسیدگی کند، آنها می‌توانند آماده رویارویی با تعدادی از دعاوی علیه خود باشند.

همچنین برخی مشکلات در مورد توانایی سورا برای شبیه سازی دقیق فیزیک یک صحنه پیچیده وجود دارد. به عنوان مثال، ممکن است تمایل به اشتباه گرفتن جزئیات مکانی یک اعلان داشته باشد.

Sora قرار است به کاربر عادی اجازه دهد تا با استفاده از متن ویدیوهای هوش مصنوعی بسازد. در حالی که فناوری تبدیل متن به هوش مصنوعی راه درازی در پیش دارد تا صنعت فیلم‌سازی را تهدید کند، اینها می‌توانند مراحلی باشند که منجر به یک اختلال بزرگ در صنعت سرگرمی شود.

در حال حاضر، OpenAI آنقدر دورتر فکر نمی‌کند. تمرکز این شرکت بر این خواهد بود که با رد محتوای نامناسب و اطلاعات نادرست و برچسب‌گذاری ویدیوهای ایجاد شده توسط Sora مطابق با دستورالعمل‌های C2PA، ویژگی‌های ایمنی پایه پلتفرم را بهبود بخشد.

شما می‌توانید همین حالا از طریق زبان فارسی به موتور‌های هوش مصنوعی مولد مانند ChatGPT و سرویس متن به عکس لئوناردو دسترسی پیدا کنید. تنها کافی است اپلیکیشن زی‌گپ را دانلود و به راحتی از آن استفاده کنید. همچنین شما می‌توانید نظرات خود را با ما و سایر کاربران در شبکه‌های اجتماعی ما در اینستاگرام و تلگرام به اشتراک بگذارید.

نوید رضایی
نوید رضایی