گوگل از Gemini رونمایی کرد و آن را «بزرگترین و تواناترین مدل هوش مصنوعی» نامید.
روز چهارشنبه Google DeepMind، آزمایشگاه تحقیقاتی هوش مصنوعی این شرکت، معرفی کرد مدل بسیار مورد انتظار که طبق گزارشات از OpenAI پیشی گرفته است GPT-4 در معیارهای اصلی
از زمانی که OpenAI راه اندازی شد ChatGPT یک سال پیش، شرکتهای فناوری پیشرو در رقابتی برای پیشرفتهای هوش مصنوعی قفل شدهاند. تاکنون، مایکروسافت به دلیل دسترسی به مدلهای OpenAI به عنوان یک سرمایهگذار بزرگ در شرکت هوش مصنوعی، کمی پیشرفت داشته است. گوگل به طور غیر مشخصی صاف کف پا بوده است. انتشار اولیه Bard – رقیب ChatGPT آن – بود خراب. و گوگل به طور کلی از نسخه های OpenAI و مایکروسافت عقب مانده است بینگ و کمک خلبان. با این حال، Google Gemini ممکن است به اندازه کافی پیشرفت بزرگی برای جهش از OpenAI باشد.
جمینی چیست؟
به گفته گوگل، آنچه Gemini را بسیار خوب میکند، قابلیتهای چندوجهی، استدلال پیچیده و تواناییهای کدنویسی پیشرفته آن است. بر خلاف سایر مدلهای هوش مصنوعی چندوجهی که ابتدا بر روی متن ساخته میشوند، سپس به دادههای تصویر اضافه میشوند، Gemini به طور طبیعی چندوجهی است. این بدان معناست که از ابتدا علاوه بر متن، در زمینه صدا و تصویر نیز آموزش دیده بود. در این اطلاعیه آمده است: «این به Gemini کمک میکند تا همه انواع ورودیها را از پایه درک کند و استدلال کند، بسیار بهتر از مدلهای چندوجهی موجود».
Gemini 90 درصد در مقایسه با GPT-4 86.4 در MMLU (درک زبان چندوظیفه ای عظیم)، که دانش چند رشته ای و حل مسئله را آزمایش می کند، به دست آورد.
بنابراین می دانیم که Gemini نمرات خوبی گرفته است، اما در دنیای واقعی چگونه عمل می کند؟ همه ما به دنبال یافتن این موضوع هستیم. Google Gemini را برای سه اندازه مختلف بهینه کرده است: Gemini Ultra، بزرگترین مدل برای کارهای بسیار پیچیده، Gemini Pro، مدل متوسط وزن که قادر به انجام بیشتر کارهای دیگر است، و Gemini Nano، یک مدل کارآمد که به اندازه کافی کوچک است که در تلفن شما زندگی کند.
که صحبت از آن شد، از امروز، Gemini Nano بر روی آن اجرا خواهد شد گوگل پیکسل ۸ پرو. در حال حاضر، Gemini Nano دو ویژگی را در دستگاه تامین می کند. می تواند رونوشت ها را در برنامه ضبط کننده خلاصه کند و همچنین پاسخ هایی را برای پاسخ هوشمند برای صفحه کلید تلفن (Gboard) پیشنهاد می کند.
حتی اگر کاربر اندروید نیستید، میتوانید Gemini را از امروز در Google Bard آزمایش کنید. انتظار داشته باشید که متوجه پیشرفت همه جانبه در استدلال، برنامه ریزی و درک باشید. Gemini Pro به Bard نیرو می دهد، اما فقط پیام های متنی را ارسال می کند.
چندوجهی به زودی در راه است. سال آینده، گوگل قصد دارد یک نسخه پیشرفته از Bard را معرفی کند که توسط Gemini Ultra ارائه خواهد شد.
موضوعات
هوش مصنوعی
گوگل
منبع: https://mashable.com/article/google-gemini-gpt4-generative-ai-multimodal-model