۳۴B LLM هوش مصنوعی چینی یونیکورن از مدل های بزرگتر Llama 2 و Falcon بهتر عمل می کند.

VentureBeat ارائه می دهد: AI Unleashed – یک رویداد اجرایی انحصاری برای رهبران داده های سازمانی. شبکه و یادگیری با همتایان صنعت. بیشتر بدانید


۰۱٫ هوش مصنوعیاستارت‌آپ چینی که توسط کارشناس و سرمایه‌گذار باتجربه هوش مصنوعی کای فو لی تأسیس شده است، پارامتر ۳۴ میلیاردی را منتشر کرده است. مدل زبان بزرگ (LLM) که به ترتیب از ۷۰ میلیارد نسخه متن باز لاما ۲ و ۱۸۰ میلیارد نسخه فالکون که توسط متا پلتفرمز، شرکت و موسسه نوآوری فناوری در ابوظبی ساخته شده اند، بهتر عمل می کند.

مدل جدید هوش مصنوعی که Yi-34B نام دارد، از زبان‌های چینی و انگلیسی پشتیبانی می‌کند و می‌تواند برای موارد مختلف به‌خوبی تنظیم شود. این استارت آپ همچنین گزینه کوچکتری را ارائه می دهد که با ۶ میلیارد پارامتر آموزش دیده است و در معیارهای مدل AI/ML که به طور گسترده استفاده می شود، عملکرد بدتری دارد، اما هنوز قابل احترام است.

در نهایت، این شرکت که در کمتر از هشت ماه از عرضه خود به وضعیت تک‌شاخ رسیده است، قصد دارد این مدل‌ها را دو برابر کرده و یک پیشنهاد تجاری با قابلیت پذیرش عرضه کند. OpenAIرا رهبر فعلی بازار هوش مصنوعی مولد بر اساس تعداد کاربران

این استراتژی یک روند جهانی را برجسته می کند که در آن شرکت های جهانی در حال توسعه مدل های هوش مصنوعی مولد هستند که عمدتاً به سمت بازارهای مربوطه خود طراحی شده اند.

رویداد

هوش مصنوعی آزاد شد

یک شب انحصاری فقط دعوت از بینش و شبکه، که برای مدیران ارشد سازمانی که بر پشته‌های داده و استراتژی‌ها نظارت دارند، طراحی شده است.

بیشتر بدانید

چشم انداز مبتنی بر LLM از “انسان + هوش مصنوعی”

لی ۰۱٫AI را در ماه مارس با مأموریت کمک به عصر هوش مصنوعی ۲٫۰ تأسیس کرد، جایی که مدل‌های زبانی بزرگ می‌توانند بهره‌وری انسان را افزایش دهند و آنها را برای ایجاد تغییرات اقتصادی و اجتماعی قابل توجهی توانمند کنند.

تیم پشتیبان ۰۱٫AI قاطعانه بر این باور است که هوش مصنوعی جدید ۲٫۰ مبتنی بر پیشرفت در مدل پایه، فناوری، پلتفرم‌ها و برنامه‌های کاربردی را در همه سطوح متحول می‌کند. این روند منجر به موج بعدی برنامه‌های کاربردی مبتنی بر هوش مصنوعی و مدل‌های کسب‌وکار مبتنی بر هوش مصنوعی می‌شود و در طول زمان نوآوری‌های AI 2.0 را تقویت می‌کند.»

مطابق با گزارش هالی به سرعت یک تیم فناوری شامل کارشناسان هوش مصنوعی از شرکت‌هایی مانند گوگل، هوآوی و مایکروسافت تحقیقات آسیا را گرد هم آورد و تراشه‌های مورد نیاز برای آموزش ۰۱ را جمع آوری کرد. سری مدل‌های Yi هوش مصنوعی.

سرمایه اولیه این تلاش توسط Sinovation Ventures، که ریاست آن نیز توسط لی، و همچنین واحد ابری Alibaba انجام شد. با این حال، مبلغ دقیق جمع آوری شده در این مرحله نامشخص است.

اولین نسخه عمومی از این شرکت، دو مدل پایه دوزبانه (انگلیسی/چینی) را با اندازه پارامترهای ۶B و ۳۴B معرفی کرد – هر دو با طول دنباله ۴K با امکان افزایش تا ۳۲K در طول زمان استنتاج آموزش داده شدند. عرضه بعدی این مدل ها با طول زمینه ۲۰۰K ارائه شد.

در Hugging Face، مدل پایه ۳۴B با عملکرد بهتر نسبت به LLM های پایه بسیار بزرگتر از قبل آموزش دیده، از جمله Llama 2-70B و Falcon-180B، متمایز بود.

به عنوان مثال، زمانی که وظایف محک زده شده مدل ۰۱٫AI که حول استدلال رایج و درک مطلب می چرخید، امتیازهای ۸۰٫۱ و ۷۶٫۴ را به دست آورد، در حالی که Llama 2 با امتیازهای ۷۱٫۹ و ۶۹٫۴ از نزدیک دنبال شد. حتی در معیار MMLU (درک زبان چندوظیفه عظیم)، مدل چینی با امتیاز ۷۶٫۳ بهتر عمل کرد، در حالی که مدل های Llama و Falcon به ترتیب امتیاز ۶۸٫۹ و ۷۰٫۴ را کسب کردند.

یک مدل کوچکتر که عملکرد بهتری ارائه می دهد می تواند منابع محاسباتی را برای کاربران نهایی ذخیره کند و به آنها امکان می دهد مدل را به دقت تنظیم کنند و برنامه هایی را با هدف استفاده از موارد مختلف به صورت مقرون به صرفه بسازند. به گفته این شرکت، تمام مدل‌های سری فعلی Yi برای تحقیقات آکادمیک کاملاً باز هستند. با این حال، اگر نیاز به استفاده تجاری رایگان باشد، تیم ها باید مجوزهای لازم را برای شروع کار با مدل ها دریافت کنند.

خیلی بیشتر در راه است

پیشنهادات فعلی استارتاپ لی گزینه های سودآوری برای سازمان های جهانی است که در چین به مشتریان خدمات ارائه می دهند. آن‌ها می‌توانند از این مدل برای ساخت ربات‌های چت به زبان انگلیسی و چینی استفاده کنند. در ادامه، این شرکت قصد دارد این تلاش ها را با افزودن پشتیبانی از زبان های بیشتر به مدل های منبع باز گسترش دهد. همچنین قصد دارد یک LLM تجاری بزرگتر با هدف قرار دادن سری GPT OpenAI راه اندازی کند، اگرچه تا کنون اطلاعات زیادی در مورد این پروژه فاش نشده است.

شایان ذکر است، ۰۱٫AI تنها راه اندازی هوش مصنوعی نیست که بر زبان ها و بازارهای خاص با LLM تمرکز می کند. همین ماه گذشته، غول چینی بایدو از انتشار ERNIE 4.0 خبر داد LLM و پیش‌نمایش مجموعه‌ای از برنامه‌های کاربردی جدید ساخته شده بر روی آن، از جمله Qingduo، یک پلتفرم خلاقانه که هدف آن رقابت با Canva و Adobe Creative Cloud است، ارائه کرد.

به همین ترتیب، غول کره ای ناور نیز ارائه می دهد HyperCLOVA X، مدل زبان بزرگ نسل بعدی آن (LLM) که ۶۵۰۰ برابر بیشتر از ChatGPT داده های کره ای را یاد گرفته است و به ویژه برای تجربیات بومی سازی شده مفید است که می تواند نه تنها عبارات طبیعی زبان کره ای بلکه قوانین، نهادها و زمینه فرهنگی مرتبط با کره ای را درک کند. جامعه. Reliance Industries هند نیز هست کار با انویدیا برای ساخت یک مدل زبان بزرگ آموزش داده شده بر روی زبان های مختلف کشور، متناسب با کاربردهای مختلف.

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.


منبع: https://venturebeat.com/ai/chinese-ai-unicorns-34b-llm-outperforms-larger-llama-2-and-falcon-models/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *