استارتاپ هوش مصنوعی پشت Stable Diffusion اکنون در حال آزمایش ویدیوی مولد است

توسعه دهنده Stability AI، هنر مولد Stable Diffusion اکنون می تواند متحرک شود اعلام کرد. این شرکت محصول جدیدی به نام انتشار ویدئوی پایدار در یک پیش‌نمایش تحقیقاتی، به کاربران اجازه می‌دهد از یک تصویر ویدیو ایجاد کنند. "این مدل ویدیویی مولد هوش مصنوعی پیشرفته، گامی مهم در سفر ما به سمت ایجاد مدل‌هایی برای همه از هر نوع است." شرکت نوشت

این ابزار جدید در قالب دو مدل تصویر به ویدیو منتشر شده است که هر کدام قادر به تولید ۱۴ تا ۲۵ فریم با سرعت بین ۳ تا ۳۰ فریم در ثانیه با وضوح ۵۷۶ × ۱۰۲۴ هستند. این قابلیت سنتز چند نمای از یک فریم را با تنظیم دقیق در مجموعه داده های چند نمایشی دارد. "در زمان انتشار در شکل اصلی خود، از طریق ارزیابی خارجی، متوجه شدیم که این مدل‌ها از مدل‌های بسته پیشرو در مطالعات ترجیحی کاربر پیشی می‌گیرند." این شرکت گفت، آن را با سیستم عامل های متن به ویدئو مقایسه کرد باند و آزمایشگاه پیکا.

Stable Video Diffusion در این مرحله فقط برای اهداف تحقیقاتی در دسترس است، نه برای کاربردهای دنیای واقعی یا تجاری. کاربران بالقوه می توانند ثبت نام قرار گرفتن در لیست انتظار برای دسترسی به یک "تجربه وب آینده با رابط متن به ویدیو،" هوش مصنوعی پایداری نوشت. این ابزار کاربردهای بالقوه را در بخش هایی از جمله تبلیغات، آموزش، سرگرمی و موارد دیگر به نمایش می گذارد.

به نظر می رسد نمونه های نشان داده شده در ویدیوی بالا از کیفیت نسبتاً بالایی برخوردار بوده و با سیستم های مولد رقیب مطابقت دارند. با این حال، آن را تا به برخی از محدودیت ها، شرکت نوشت: فیلم نسبتاً کوتاه (کمتر از ۴ ثانیه) تولید می کند، فاقد فوتورئالیسم کامل است، نمی تواند حرکت دوربین را به جز حرکت آهسته انجام دهد، کنترل متن ندارد، نمی تواند متن خوانا تولید کند و ممکن است افراد و چهره ها را به درستی تولید نکند.

این ابزار بر روی مجموعه داده‌ای از میلیون‌ها ویدیو آموزش داده شد و سپس روی مجموعه‌ای کوچک‌تر تنظیم شد و هوش مصنوعی پایداری تنها گفت که از ویدیویی استفاده می‌کند که برای اهداف تحقیقاتی در دسترس عموم قرار دارد. منشاء مجموعه داده مهم است، با توجه به اینکه Stability AI اخیراً وجود داشت توسط Getty Images شکایت کرد برای تراشیدن آرشیو تصاویرش.

ویدئو یک هدف کلیدی برای هوش مصنوعی مولد است، به دلیل پتانسیل آن برای ساده سازی تولید محتوا. با این حال، همچنین ابزاری با بیشترین پتانسیل برای سوء استفاده از طریق دیپ فیک، نقض حق چاپ و موارد دیگر است. و بر خلاف OpenAI با محصول ChatGPT خود، Stability در تجاری سازی محصول Stable Diffusion خود موفقیت کمتری داشته است و از طریق پول نقد با نرخ بالا مصرف شده است. TechCrunch اشاره شد. و هفته گذشته، معاون صدا در Stability AI، اد نیوتن رکس، استعفا داد استفاده از محتوای دارای حق چاپ برای آموزش مدل های هوش مصنوعی مولد.

این مقاله در ابتدا در Engadget در https://www.engadget.com/the-ai-startup-behind-stable-diffusion-is-now-testing-generative-video-105519658.html?src=rss ظاهر شد

منبع: https://www.engadget.com/the-ai-startup-behind-stable-diffusion-is-now-testing-generative-video-105519658.html?src=rss

دیدگاهتان را بنویسید لغو پاسخ