OpenAI ابزار جدید هوش مصنوعی Sora را راه‌اندازی می‌کند که می‌تواند از متون ساده ویدیوهایی بسازد که به طرز وحشتناکی واقعی به نظر می‌رسند

OpenAI از Sora پرده برداری کرده است، تولید کننده متن به ویدیوی پیشرفته خود، که ویدیوهای واقع گرایانه خیره کننده ای را به نمایش می گذارد که قابلیت های مدل هوش مصنوعی را برجسته می کند. معرفی Sora که در روز پنجشنبه ارائه شد، یک گام مهم رو به جلو در فناوری تولید ویدیو با هوش مصنوعی است.

با این حال، نگرانی ها در مورد پیامدهای بالقوه آن برای صنعت فیلم و تکثیر محتوای دیپ فیک افزایش یافته است.

معرفی سورا، مدل تبدیل متن به ویدیوی ما.

Sora می‌تواند ویدیوهای حداکثر ۶۰ ثانیه‌ای ایجاد کند که صحنه‌های بسیار دقیق، حرکات پیچیده دوربین و شخصیت‌های متعدد با احساسات پر جنب و جوش را نشان می‌دهد. https://t.co/7j2JN27M3W

اعلان: «زیبا، برفی… pic.twitter.com/ruTEWn87vf

– OpenAI (@OpenAI) 15 فوریه ۲۰۲۴

طبق پست وبلاگ OpenAI، Sora دارای توانایی تولید صحنه های پیچیده با شخصیت های متعدد، پویایی حرکتی ظریف و جزئیات واقعی سوژه ها و پس زمینه ها است.

درک مدل فراتر از درخواست های کاربر است و درک فیزیک دنیای واقعی را در بر می گیرد.

https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP

– سم آلتمن (@sama) 15 فوریه ۲۰۲۴

در حالی که OpenAI تاریخ انتشار خاصی را برای Sora برای عموم مردم فاش نکرده است، عرضه فعلی گروه منتخبی از محققان و خلاقان را برای آزمایش اولیه هدف قرار می دهد. این انتشار کنترل‌شده قبل از راه‌اندازی گسترده‌تر انجام می‌شود و نگرانی‌ها را در مورد سوء استفاده احتمالی از چنین فناوری پیشرفته‌ای افزایش می‌دهد.

سورا که به عنوان اولین تلاش OpenAI در تولید ویدئو با هوش مصنوعی شناخته می شود، مکمل مجموعه ابزارهای مبتنی بر هوش مصنوعی موجود این شرکت، از جمله ChatGPT و Dall-E است.

به طور قابل‌توجهی، سورا خود را به عنوان چیزی بیش از یک ابزار خلاقانه متمایز می‌کند و آنچه را که محقق ارشد انویدیا، دکتر جیم فن، به‌عنوان «موتور فیزیک مبتنی بر داده» توصیف می‌کند، مجسم می‌کند. با گنجاندن محاسبات مبتنی بر فیزیک در رندر ویدیو، Sora از تکنیک های معمول تولید تصویر فراتر می رود.

https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp

– سم آلتمن (@sama) 15 فوریه ۲۰۲۴

Sora با استفاده از یک مدل انتشار، فیلم‌ها را از فریم‌های اولیه تار و پر شده با استاتیک به دنباله‌های صیقلی و با وفاداری بالا اصلاح می‌کند. این رویکرد Sora را از رقبا متمایز می کند و ویدیوهای طولانی تر و پویاتری تولید می کند که با تکنیک های فیلم سازی سنتی رقابت می کند.

سورا با وجود قابلیت های قابل توجهش بدون محدودیت نیست. OpenAI تصدیق می کند که این مدل هنوز به اصلاح نیاز دارد، به ویژه در درک علیت و آگاهی فضایی.

موارد مختلف، که در آن سورا نتوانست روابط علت و معلولی را به‌طور دقیق به تصویر بکشد یا جهت‌گیری فضایی را اشتباه تعبیر کرد، بر چالش‌های ذاتی در استقرار مسئولانه چنین سیستم‌های هوش مصنوعی پیشرفته تأکید می‌کند.

علاوه بر این، استفاده نادرست از Sora برای ایجاد محتوای فریبنده یا مضر، نگرانی های ایمنی قابل توجهی را ایجاد می کند. با توجه به رواج فناوری دیپ‌فیک، OpenAI بر تعهد خود به ایجاد تدابیر امنیتی در برابر اطلاعات نادرست و محتوای مضر تأکید می‌کند.

با این حال، با توجه به موارد قبلی دور زدن پادمان‌های هوش مصنوعی، اثربخشی این اقدامات نامشخص است.

از آنجایی که انتشار Sora نوید دهنده عصر جدیدی در تولید ویدیو مبتنی بر هوش مصنوعی است، پتانسیل تحول‌آفرین آن با نگرانی‌های پیرامون پیامدهای اخلاقی و تأثیرات اجتماعی آن مطابقت دارد. عصر طلوع محتوای تولید شده توسط هوش مصنوعی، بحث های انتقادی را در مورد محافظت در برابر سوء استفاده در حالی که از پتانسیل خلاقانه آن به طور مسئولانه استفاده می کند، برانگیخته است.

منبع: https://www.firstpost.com/tech/openai-launches-new-ai-tool-sora-can-make-videos-from-simple-texts-that-look-terrifyingly-realistic-13733982.html

دیدگاهتان را بنویسید لغو پاسخ