VentureBeat ارائه می دهد: AI Unleashed – یک رویداد اجرایی انحصاری برای رهبران داده های سازمانی. شبکه و یادگیری با همتایان صنعت. بیشتر بدانید
هوش مصنوعی پایداری امروز چندین پیشرفت جدید در پلتفرم Stable Diffusion خود اعلام کرد. این بهروزرسانیها نه تنها قابلیتهای جدید و هیجانانگیزی را برای تبدیل متن به تصویر ارائه میکنند، بلکه در حوزه تولید محتوای سهبعدی نیز سرمایهگذاری میکنند.
قابل توجه ترین پیشرفت، مدل کاملاً جدید Stable 3D است. تا به حال، Stable Diffusion اساساً روی تولید تصویر دو بعدی (۲ بعدی) کار کرده است. مدل Stable 3D آن را تغییر میدهد و عملکردی را ارائه میدهد که میتواند به هر نوع ایجاد محتوای سه بعدی، از جمله طراحی گرافیکی و حتی توسعه بازیهای ویدیویی کمک کند.
در کنار تلاش خود برای تولید محتوای سه بعدی، Stability AI ابزار Sky Replacer را معرفی کرده است که دقیقاً همان کاری را که از نامش پیداست را انجام می دهد – جایگزینی آسمان در یک تصویر دو بعدی.
پلتفرم Stable Diffusion همچنین اکنون Stable Fine-Tuning را ارائه می دهد که برای کمک به شرکت ها در تسریع فرآیند تنظیم دقیق تصویر برای موارد استفاده خاص طراحی شده است.
علاوه بر این، این شرکت یک واترمارک نامرئی را برای احراز هویت محتوا در تصاویر تولید شده توسط Stability AI API یکپارچه خواهد کرد. به روز رسانی های جدید همه در مورد کمک به شرکت ها با خطوط لوله توسعه خلاق است زیرا هوش مصنوعی مولد به طور فزاینده ای بخشی از گردش کار رایج می شود.
عماد مستقع، مدیر عامل Stability AI در مصاحبه ای اختصاصی با VentureBeat گفت: «این در مورد این است که داستان نویسان خلاق ابزارهایی را که برای داشتن آن سطح از کنترل بیشتر روی تصاویر نیاز دارند، بیاورند.
Stable Diffusion ویژگی هایی را در یک چشم انداز GenAI رقابتی فزاینده اضافه می کند
پیشرفتهای Stability AI در زمانی اتفاق میافتد که بازار تولید متن به تصویر به شدت رقابتی شده است.
ادوبی با خود بازار را هدف گرفته است ابزار کرم شب تاب که به شدت با نرم افزار طراحی این شرکت ادغام شده اند. میانه سفر به طور فزاینده ای ویژگی های جدیدی را به فناوری خود اضافه می کند تا به طراحان در تولید تصاویر کمک کند. نباید فراموش شود، OpenAI اخیراً خود را منتشر کرده است مدل های DALL-E 3 با قابلیت های بهبود یافته برای تولید متن در داخل تصاویر.
Mostaque به خوبی از رقابت خود آگاه است و قصد دارد به چندین روش به تمایز هوش مصنوعی پایداری کمک کند. او به طور خاص تاکید کرد که شرکت او اکنون از صرفاً مدل سازی به سمت ایجاد یک خط لوله خلاقانه دور می شود. با ویژگیهای جدید Sky Replacer و Fine Tuning، او خاطرنشان کرد که این دو گامهای اضافی هستند که بالاتر و فراتر از آنچه در یک مدل پایه اصلی برای تولید تصاویر وجود دارد، هستند.
Sky Replacer فقط یک ویژگی نیست، بلکه تمرکزی برای یک مورد استفاده تجاری است
مفهوم جایگزینی پسزمینه در یک تصویر، مفهوم جدیدی نیست. در برنامههای غیر مولد هوش مصنوعی، پسزمینهها معمولاً با تکنیکهایی مانند صفحهنمایش سبز و کلیدهای رنگی جایگزین میشوند.
Mostaque گفت که هوش مصنوعی پایداری بر روی آن تکنیکهای کلاسیک بنا میشود و گردش کار را خودکار میکند تا فرآیند را برای کاربران تجاری سریع و کارآمد کند. تغییر رنگ پسزمینه آسمان فقط به معنای افزودن نوعی استعداد خلاقانه نیست، این قابلیتی است که کاربرد بسیار خاص و کاربردی دارد.
Mostaque گفت: “Sky Replacer برای مثال برای املاک و مستغلات عالی است.”
Mostaque خاطرنشان کرد که کاربران میخواهند بتوانند پسزمینههای متفاوتی با جلوههای نوری متفاوت داشته باشند. اساساً او تأکید کرد که همه چیز در مورد ارائه کنترل است زیرا سازمان ها گردش کار خود را برای تولید تصاویر و محتوا دارند. کاری که هوش مصنوعی پایداری انجام می دهد، ایجاد گردش کار بهینه شده برای کمک به فعال کردن کنترلی است که موارد استفاده مختلف به آن نیاز دارند.
او گفت: «Sky Replacer اولین مورد از مجموعههایی است که ما آنها را ارائه خواهیم کرد که بسیار خاص صنعت و شرکت هستند و بر اساس تجربیاتی که در طول شش تا ۱۲ ماه گذشته داشتهایم.»
Stable 3D، Stable Diffusion را برای موارد استفاده جدید گسترش می دهد
مدل جدید Sable 3D با گسترش مدل انتشار مورد استفاده در Stable Diffusion برای شامل مجموعه دادههای سه بعدی اضافی و بردارسازی کار میکند.
Mostaque گفت: “من فوق العاده در مورد توانایی ایجاد کل دنیاها به صورت سه بعدی هیجان زده هستم.”
Mostaque توضیح داد که Stable 3D از هر دو Stable Diffusion و Stability AI ساخته شده است. منتشر شود-XLکه یکی از بزرگترین مجموعه داده های سه بعدی باز جهان است. ساختن و رندر کردن تصاویر سه بعدی مدتهاست که یک فرآیند فشرده منابع بوده است، اما این یکی از مواردی است که Mostaque خوشبین است که Stable 3D نسبت به رویکردهای سنتی برای تولید تصاویر سه بعدی کارآمدتر خواهد بود. او تاکید کرد که هنوز روزهای اولیه برای هوش مصنوعی پایدار است، اما خوشبین است که این فناوری به طور پیوسته در طول زمان تکامل و گسترش یابد. Stable 3D در ابتدا به عنوان پیش نمایش خصوصی در دسترس است.
او گفت: «این کار در مقایسه با نوع کلاسیک ایجاد مدل سه بعدی بسیار کارآمد است. “چیزهایی که به طور کلاسیک برای ساخت آنها زمان زیادی می برد، اکنون به سرعت اولین برش را دریافت می کنند.”
واترمارک و بایدن EO در AI
با دستور اجرایی (EO) از دولت بایدن این هفته در هوش مصنوعی، یک جزء جهت ادغام واترمارک ها در محتوای تولید شده است.
هوش مصنوعی پایداری اکنون واترمارک های نامرئی و اعتبار محتوا را در API خود ادغام می کند. Content Credentials یک تلاش صنعتی چند فروشنده است که Adobe و دیگران برای کمک به ارائه اطلاعات در مورد اطلاعات نویسنده در مورد محتوا در آن مشارکت دارند. Mostaque گفت که افزودن واترمارک های نامرئی و اعتبار محتوا کاری مسئول است. این همچنین بخشی از تلاش گستردهتری است که هوش مصنوعی پایداری روی آن کار میکند تا اصالت را به محتوای تولید شده برساند.
Mostaque گفت: “ما واقعاً در حال پیشروی تعدادی از ابتکارات و برخی موارد اضافی هستیم که در این زمینه اعلام می کنیم، و همچنین تحقیقات اضافی، زیرا می خواهیم بدانیم چه چیزی واقعی و چه چیزی جعلی است.” “همچنین به برخی از اسناد و مکانیسمهای دیگری که برای نسخههای آینده ایجاد میکنیم کمک میکند.”
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/ai/exclusive-stability-ai-brings-advanced-3d-and-image-fine-tuning-to-stable-diffusion/