OpenAI از Sora پرده برداری کرده است، تولید کننده متن به ویدیوی پیشرفته خود، که ویدیوهای واقع گرایانه خیره کننده ای را به نمایش می گذارد که قابلیت های مدل هوش مصنوعی را برجسته می کند. معرفی Sora که در روز پنجشنبه ارائه شد، یک گام مهم رو به جلو در فناوری تولید ویدیو با هوش مصنوعی است.
با این حال، نگرانی ها در مورد پیامدهای بالقوه آن برای صنعت فیلم و تکثیر محتوای دیپ فیک افزایش یافته است.
معرفی سورا، مدل تبدیل متن به ویدیوی ما.
Sora میتواند ویدیوهای حداکثر ۶۰ ثانیهای ایجاد کند که صحنههای بسیار دقیق، حرکات پیچیده دوربین و شخصیتهای متعدد با احساسات پر جنب و جوش را نشان میدهد. https://t.co/7j2JN27M3W
اعلان: «زیبا، برفی… pic.twitter.com/ruTEWn87vf
– OpenAI (@OpenAI) 15 فوریه ۲۰۲۴
طبق پست وبلاگ OpenAI، Sora دارای توانایی تولید صحنه های پیچیده با شخصیت های متعدد، پویایی حرکتی ظریف و جزئیات واقعی سوژه ها و پس زمینه ها است.
درک مدل فراتر از درخواست های کاربر است و درک فیزیک دنیای واقعی را در بر می گیرد.
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
– سم آلتمن (@sama) 15 فوریه ۲۰۲۴
در حالی که OpenAI تاریخ انتشار خاصی را برای Sora برای عموم مردم فاش نکرده است، عرضه فعلی گروه منتخبی از محققان و خلاقان را برای آزمایش اولیه هدف قرار می دهد. این انتشار کنترلشده قبل از راهاندازی گستردهتر انجام میشود و نگرانیها را در مورد سوء استفاده احتمالی از چنین فناوری پیشرفتهای افزایش میدهد.
سورا که به عنوان اولین تلاش OpenAI در تولید ویدئو با هوش مصنوعی شناخته می شود، مکمل مجموعه ابزارهای مبتنی بر هوش مصنوعی موجود این شرکت، از جمله ChatGPT و Dall-E است.
به طور قابلتوجهی، سورا خود را به عنوان چیزی بیش از یک ابزار خلاقانه متمایز میکند و آنچه را که محقق ارشد انویدیا، دکتر جیم فن، بهعنوان «موتور فیزیک مبتنی بر داده» توصیف میکند، مجسم میکند. با گنجاندن محاسبات مبتنی بر فیزیک در رندر ویدیو، Sora از تکنیک های معمول تولید تصویر فراتر می رود.
https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp
– سم آلتمن (@sama) 15 فوریه ۲۰۲۴
Sora با استفاده از یک مدل انتشار، فیلمها را از فریمهای اولیه تار و پر شده با استاتیک به دنبالههای صیقلی و با وفاداری بالا اصلاح میکند. این رویکرد Sora را از رقبا متمایز می کند و ویدیوهای طولانی تر و پویاتری تولید می کند که با تکنیک های فیلم سازی سنتی رقابت می کند.
سورا با وجود قابلیت های قابل توجهش بدون محدودیت نیست. OpenAI تصدیق می کند که این مدل هنوز به اصلاح نیاز دارد، به ویژه در درک علیت و آگاهی فضایی.
موارد مختلف، که در آن سورا نتوانست روابط علت و معلولی را بهطور دقیق به تصویر بکشد یا جهتگیری فضایی را اشتباه تعبیر کرد، بر چالشهای ذاتی در استقرار مسئولانه چنین سیستمهای هوش مصنوعی پیشرفته تأکید میکند.
علاوه بر این، استفاده نادرست از Sora برای ایجاد محتوای فریبنده یا مضر، نگرانی های ایمنی قابل توجهی را ایجاد می کند. با توجه به رواج فناوری دیپفیک، OpenAI بر تعهد خود به ایجاد تدابیر امنیتی در برابر اطلاعات نادرست و محتوای مضر تأکید میکند.
با این حال، با توجه به موارد قبلی دور زدن پادمانهای هوش مصنوعی، اثربخشی این اقدامات نامشخص است.
از آنجایی که انتشار Sora نوید دهنده عصر جدیدی در تولید ویدیو مبتنی بر هوش مصنوعی است، پتانسیل تحولآفرین آن با نگرانیهای پیرامون پیامدهای اخلاقی و تأثیرات اجتماعی آن مطابقت دارد. عصر طلوع محتوای تولید شده توسط هوش مصنوعی، بحث های انتقادی را در مورد محافظت در برابر سوء استفاده در حالی که از پتانسیل خلاقانه آن به طور مسئولانه استفاده می کند، برانگیخته است.
منبع: https://www.firstpost.com/tech/openai-launches-new-ai-tool-sora-can-make-videos-from-simple-texts-that-look-terrifyingly-realistic-13733982.html