یک ویدیوی نمایشی از Gemini، مدل جدید هوش مصنوعی گوگل، آنقدر که به نظر میرسد «ذهنافکن» نیست.
روز چهارشنبه گوگل منتشر شد جوزا، یک مدل چندوجهی بومی ساخته شده که در معیارهای اصلی اطلاعاتی از GPT-4 OpenAI پیشی گرفته است. یک ویدیوی نمایشی شش دقیقهای که تواناییهای شگفتانگیز Gemini را برای ردیابی توپ در فنجان، تعیین مکان کشورها بر روی نقشه و شناسایی یک نقاشی ساده اردک نشان میدهد. وای فناوران در رسانه های اجتماعی – و به نظر می رسید اینترنت را متقاعد می کند که AGI (هوش عمومی مصنوعی) در افق است.
اما طولی نکشید که کارشناسان دریافتند ویدیوی Gemini کمی اغراق آمیز است. مانند پارمی اولسون برای بلومبرگ برای اولین بار گزارش شد، ویدئو به روش های متعددی ویرایش شد.
ممکن است توییت حذف شده باشد
گوگل چگونه دموی Gemini را زیبا کرد؟
همانطور که توسط گوگل تایید شده است، این ویدئو در زمان واقعی ضبط نشده است. به گفته سخنگوی گوگل، در عوض، این ویدئو با استفاده از فریمهای تصویر ثابت از فیلم و درخواست از طریق متن ایجاد شده است.
به نظر می رسد که Gemini توسط صدای شخص تحریک می شود، اما صدا در واقع بعدا اضافه شده است. با این حال، نماینده گوگل گفت: “کاربر گزیده های واقعی از دستورات واقعی مورد استفاده برای تولید خروجی Gemini را که در ادامه می آید، صدا می کند.” علاوه بر این، با توجه به توضیحات در یوتیوب، “تأخیر کاهش یافته است و خروجی های Gemini برای اختصار کوتاه شده است.” به عبارت دیگر زمان پاسخگویی سریع آن در ویدیو واقعی نیست.
پس از اینکه مشخص شد قابلیتهای Gemini با ویرایش ساده ویدیو افزایش یافته است، اوریول وینیالز، معاون آموزشی و پژوهشی Google DeepMind ارسال شده در X (توئیتر سابق) برای روشن شدن همه چیز. Vinyals گفت: “تمام پیامها و خروجیهای کاربر در ویدیو واقعی هستند و برای اختصار کوتاه شدهاند.” این ویدئو نشان میدهد که تجربههای کاربری چندوجهی ساخته شده با Gemini چگونه میتواند باشد. ما آن را برای الهام بخشیدن به توسعهدهندگان ساختهایم.
ممکن است توییت حذف شده باشد
اما کاربران همچنان احساس می کردند فریب خورده اند. “اگر میخواهید الهامبخش توسعهدهندگان باشید، پس چرا محتوای واقعی را پست نمیکنید؟ درخواستها نمیتوانند “واقعی” و در عین حال کوتاه شوند. این نابخردانه و گمراهکننده بود.” یک کاربر در پست Vinyals “با عرض پوزش، “واقعی اما کوتاه شده” چیزی نیست.” دیگری گفت.
واکنش شدید به نسخه نمایشی برخی از دستاوردهای واقعی Gemini را تحت الشعاع قرار داد. پست وبلاگی که نحوه ساخت ویدیو را توضیح میدهد، مهارتهای استدلالی چشمگیر Gemini را نشان میدهد، حتی اگر فقط از طریق پیامهای متنی و عکسهای ثابت (برخلاف صدا و ویدیو) باشد. سایر ویدیوهای تبلیغاتی موارد استفاده خاص را نشان میدهند که Gemini چگونه میتواند استخراج داده های علمی از ۲۰۰۰۰۰ مقاله تحقیقاتی یا کمک به والدین به فرزندانشان تکالیف ریاضی و فیزیک.
با این اوصاف، اینکه تواناییهای Gemini بالاتر از حد انتظار باشد یا پایینتر، به تصمیم کاربران بستگی دارد.
موضوعات
هوش مصنوعی
گوگل
منبع: https://mashable.com/article/google-gemini-demo-video-editing