کمپانی OpenAI، سازنده ChatGPT و Dall-E، با راهاندازی Sora به رقابت تولید محتوای هوش مصنوعی متن به ویدیو پیوسته است، که توانایی تولید ویدیوهای تا یک دقیقه بر اساس درخواست کاربر را دارد.
این شرکت چندین ویدئوی تاثیرگذار را که با استفاده از سورا ایجاد شده بود، از جمله زنی که در خیابانی در توکیو قدم میزد و فیلمهای تاریخی کالیفرنیا در دوران طوفان طلا در زمان رونمایی نشان داد.
هوش مصنوعی متن به ویدیو Sora
Sora در حال حاضر برای عموم مردم در حال پیش نمایش است اما برای گروههای منتخبی مانند کارشناسان امنیتی و سازندگان در دسترس است. این شرکت اجازه داده است تا به افراد خاصی دسترسی داشته باشند تا در مورد چگونگی پیشبرد این مدل بازخورد کسب کنند تا برای متخصصان خلاق بسیار مفید باشد. تاریخ انتشار کلی هنوز به صورت عمومی اعلام نشده است.
این شرکت گفت: «ما در حال کار با تیمهای قرمز، متخصصان حوزه در زمینههایی مانند اطلاعات نادرست، محتوای نفرتانگیز و سوگیری هستیم، که بهطور خصمانه مدل را آزمایش خواهند کرد.» ما همچنین در حال ساخت ابزارهایی برای کمک به شناسایی محتوای گمراهکننده مانند طبقهبندی تشخیصی هستیم که میتواند تشخیص دهد که یک ویدیو توسط Sora چه زمانی تولید شده است.
OpenAI اولین شرکتی نیست که این نوع فناوری را راه اندازی میکند. متا، گوگل و چندین شرکت دیگر نسخههای خود را از برنامههای تولید متن به ویدیو هوش مصنوعی راه اندازی کردهاند یا در حال راه اندازی هستند. برخی از محبوبترین برنامههای موجود در بازار عبارتند از Stability AI، Runway، Pika و Google Lumiere. با این حال، تحلیلهای صنعتی به کیفیت بالای ویدیوهای Sora به عنوان بهتر از اکثر رقبا اشاره کردهاند. شاید به همین دلیل است که تظاهرات سورا این همه هیاهو ایجاد کرده است.
شاید این مطلب هم برایتان جالب باشد: هوش مصنوعی گوگل (جمینی)
طبق گفته OpenAI، مزیت Sora در مقایسه با سایر مدلها، فوتورئالیسم قابل توجه آن و توانایی آن در تولید کلیپهای طولانیتر از پرامپهای کوتاه است. سورا مبتنی بر درک عمیق زبان است و آن را قادر میسازد تا اعلانها را تفسیر کند و شخصیتها و احساسات را ایجاد کند.
از محصول جدید OpenAI چه انتظاری باید داشت
نسخه ی آزمایشی Sora توانایی خود را در تولید ویدیو از چند کلمه نشان داد، با این حال، توانایی خود را در تولید فیلم از یک تصویر یا یک توالی فریم نشان نداد. راهاندازی Sora باعث ایجاد هیجان میشود، اما چند نگرانی را نیز برانگیخته است. چنین فناوری میتواند برای تولید دیپ فیک و انتشار اطلاعات نادرست استفاده شود. میتوانیم انتظار داشته باشیم که Sora محدودیتهایی برای محتوا از جمله افراد واقعی نامناسب یا استفاده از یک پلتفرم برای ایجاد محتوای حاوی هرزهنگاری یا خشونت داشته باشد.
آدیتیا رامش، محقق اصلی و سرپرست تیم Dall-E، میگوید: «راهحل اطلاعات نادرست شامل سطوحی از کاهشدهندهها از سوی ما است، اما به درک جامعه و شبکههای اجتماعی نیز نیاز دارد.
یکی دیگر از نگرانیهای سورا این است که میتواند آثار دارای حق چاپ دیگران را نقض کند. در حالی که OpenAI ادعا میکند که دادههای آموزشی از محتوایی است که دارای مجوز یا در دسترس عموم است، همیشه ابهاماتی در مورد آنچه “در دسترس عموم” تلقی میشود وجود دارد. اگر OpenAI نتواند به این موضوع رسیدگی کند، آنها میتوانند آماده رویارویی با تعدادی از دعاوی علیه خود باشند.
همچنین برخی مشکلات در مورد توانایی سورا برای شبیه سازی دقیق فیزیک یک صحنه پیچیده وجود دارد. به عنوان مثال، ممکن است تمایل به اشتباه گرفتن جزئیات مکانی یک اعلان داشته باشد.
Sora قرار است به کاربر عادی اجازه دهد تا با استفاده از متن ویدیوهای هوش مصنوعی بسازد. در حالی که فناوری تبدیل متن به هوش مصنوعی راه درازی در پیش دارد تا صنعت فیلمسازی را تهدید کند، اینها میتوانند مراحلی باشند که منجر به یک اختلال بزرگ در صنعت سرگرمی شود.
در حال حاضر، OpenAI آنقدر دورتر فکر نمیکند. تمرکز این شرکت بر این خواهد بود که با رد محتوای نامناسب و اطلاعات نادرست و برچسبگذاری ویدیوهای ایجاد شده توسط Sora مطابق با دستورالعملهای C2PA، ویژگیهای ایمنی پایه پلتفرم را بهبود بخشد.
شما میتوانید همین حالا از طریق زبان فارسی به موتورهای هوش مصنوعی مولد مانند ChatGPT و سرویس متن به عکس لئوناردو دسترسی پیدا کنید. تنها کافی است اپلیکیشن زیگپ را دانلود و به راحتی از آن استفاده کنید. همچنین شما میتوانید نظرات خود را با ما و سایر کاربران در شبکههای اجتماعی ما در اینستاگرام و تلگرام به اشتراک بگذارید.