توسعه دهنده Stability AI، هنر مولد Stable Diffusion اکنون می تواند متحرک شود اعلام کرد. این شرکت محصول جدیدی به نام انتشار ویدئوی پایدار در یک پیشنمایش تحقیقاتی، به کاربران اجازه میدهد از یک تصویر ویدیو ایجاد کنند. "این مدل ویدیویی مولد هوش مصنوعی پیشرفته، گامی مهم در سفر ما به سمت ایجاد مدلهایی برای همه از هر نوع است." شرکت نوشت
این ابزار جدید در قالب دو مدل تصویر به ویدیو منتشر شده است که هر کدام قادر به تولید ۱۴ تا ۲۵ فریم با سرعت بین ۳ تا ۳۰ فریم در ثانیه با وضوح ۵۷۶ × ۱۰۲۴ هستند. این قابلیت سنتز چند نمای از یک فریم را با تنظیم دقیق در مجموعه داده های چند نمایشی دارد. "در زمان انتشار در شکل اصلی خود، از طریق ارزیابی خارجی، متوجه شدیم که این مدلها از مدلهای بسته پیشرو در مطالعات ترجیحی کاربر پیشی میگیرند." این شرکت گفت، آن را با سیستم عامل های متن به ویدئو مقایسه کرد باند و آزمایشگاه پیکا.
Stable Video Diffusion در این مرحله فقط برای اهداف تحقیقاتی در دسترس است، نه برای کاربردهای دنیای واقعی یا تجاری. کاربران بالقوه می توانند ثبت نام قرار گرفتن در لیست انتظار برای دسترسی به یک "تجربه وب آینده با رابط متن به ویدیو،" هوش مصنوعی پایداری نوشت. این ابزار کاربردهای بالقوه را در بخش هایی از جمله تبلیغات، آموزش، سرگرمی و موارد دیگر به نمایش می گذارد.
به نظر می رسد نمونه های نشان داده شده در ویدیوی بالا از کیفیت نسبتاً بالایی برخوردار بوده و با سیستم های مولد رقیب مطابقت دارند. با این حال، آن را تا به برخی از محدودیت ها، شرکت نوشت: فیلم نسبتاً کوتاه (کمتر از ۴ ثانیه) تولید می کند، فاقد فوتورئالیسم کامل است، نمی تواند حرکت دوربین را به جز حرکت آهسته انجام دهد، کنترل متن ندارد، نمی تواند متن خوانا تولید کند و ممکن است افراد و چهره ها را به درستی تولید نکند.
این ابزار بر روی مجموعه دادهای از میلیونها ویدیو آموزش داده شد و سپس روی مجموعهای کوچکتر تنظیم شد و هوش مصنوعی پایداری تنها گفت که از ویدیویی استفاده میکند که برای اهداف تحقیقاتی در دسترس عموم قرار دارد. منشاء مجموعه داده مهم است، با توجه به اینکه Stability AI اخیراً وجود داشت توسط Getty Images شکایت کرد برای تراشیدن آرشیو تصاویرش.
ویدئو یک هدف کلیدی برای هوش مصنوعی مولد است، به دلیل پتانسیل آن برای ساده سازی تولید محتوا. با این حال، همچنین ابزاری با بیشترین پتانسیل برای سوء استفاده از طریق دیپ فیک، نقض حق چاپ و موارد دیگر است. و بر خلاف OpenAI با محصول ChatGPT خود، Stability در تجاری سازی محصول Stable Diffusion خود موفقیت کمتری داشته است و از طریق پول نقد با نرخ بالا مصرف شده است. TechCrunch اشاره شد. و هفته گذشته، معاون صدا در Stability AI، اد نیوتن رکس، استعفا داد استفاده از محتوای دارای حق چاپ برای آموزش مدل های هوش مصنوعی مولد.
این مقاله در ابتدا در Engadget در https://www.engadget.com/the-ai-startup-behind-stable-diffusion-is-now-testing-generative-video-105519658.html?src=rss ظاهر شد
منبع: https://www.engadget.com/the-ai-startup-behind-stable-diffusion-is-now-testing-generative-video-105519658.html?src=rss