آمازون می گوید Titan طیف وسیعی از قابلیت های ویرایش تصویر را ارائه می دهد، مانند استفاده از یک پیام متنی برای تغییرات خودکار تصویر، به لطف مدل تقسیم بندی یکپارچه خود. این مدل هم در نقاشی داخلی که شامل ویرایش تصویر با ماسک است و هم در نقاشی بیرونی که امکان تغییرات یا پسوندهای پسزمینه را میدهد مهارت دارد. اینها خیلی دور از چیزی نیستند که دوست دارند Adobe در حال تلاش برای ارائه خدمات هستنداما به نظر می رسد اجرای آمازون ساده ترین است.
در تصاویر بالا و پایین، نگاهی به نحوه پذیرش فرمان های یک خطی تایتان برای تغییر پس زمینه یا جایگزینی سوژه اصلی در یک تصویر بیندازید. حتی می تواند عناصری مانند پسوند بدن سوژه را از تصویر تولید شده اضافه یا حذف کند.
کاربران برای تنظیم اندازه تصویر و انتخاب تعداد تغییرات تصویری که مدل باید تولید کند، انعطاف پذیری دارند. علاوه بر این، این مدل را میتوان با دادههای داخلی سفارشی تنظیم کرد تا اطمینان حاصل شود که تصاویر تولید شده با استانداردهای برند خاص مطابقت دارند یا تصاویری به سبک خاصی ایجاد میکنند. به عنوان مثال می توان با اصلاح مدل با تصاویری از کمپین های بازاریابی گذشته به این امر دست یافت.
در مقایسه، Dall-E OpenAI نمی تواند تصاویر محلی را برای ویرایش های بعدی پردازش کند. بهترین کاری که می توانید انجام دهید این است که پس از خرید اشتراک ChatGPT، یک GPT سفارشی ایجاد کنید و از آن برای درخواست های آموزش داده شده در مجموعه داده های آموزشی محلی استفاده کنید. مولد متن به تصویر Titan به انگلیسی محدود شده است و اکنون در Amazon Bedrock در دسترس است.
منبع: https://www.slashgear.com/1458871/amazon-ai-image-generation-titan-watermark/