در ۱۰ ژانویه به رهبران سانفرانسیسکو بپیوندید تا یک شب منحصر به فرد شبکه، بینش و گفتگو داشته باشید. درخواست دعوت اینجا.
Nvidia تنها شرکتی نیست که شتابدهندههای هوش مصنوعی را برای آموزش و استنتاج میسازد، بلکه فضایی است که اینتل بر اساس تحقیقات جدید، با فناوری Intel Gaudi 2 خود به شدت در حال رقابت و برتری است.
Databricks تحقیقات جدیدی را انجام داد که امروز منتشر شد و نشان داد که Intel Gaudi 2 رقابت عملکرد قوی در برابر شتابدهندههای هوش مصنوعی پیشرو در صنعت Nvidia ارائه میکند. تحقیقات Databricks نشان داد که برای مدل زبان بزرگ (LLM) استنباط، Gaudi 2 با تأخیر سیستم های Nvidia H100 در رمزگشایی مطابقت داشت و عملکرد بهتری نسبت به Nvidia A100 داشت. این تحقیق نشان داد که استنتاج Gaudi 2 نسبت به H100 و A100 از پهنای باند حافظه بالاتری استفاده می کند.
انویدیا همچنان عملکرد آموزشی بیشتری را در شتابدهندههای برتر خود ارائه میکند. با استفاده از Databricks MosaicML ریخته گری LLM برای آموزش، محققان دریافتند که Gaudi 2 با بیش از ۲۶۰ TFLOPS در تراشه، به دومین عملکرد سریع آموزش تک نود LLM بعد از NVIDIA H100 دست یافت. به طور کلی، تحقیقات Databricks گزارش داد که بر اساس قیمت گذاری ابر عمومی، Gaud i2 بهترین دلار در هر عملکرد را برای آموزش و استنتاج در مقایسه با A100 و H100 دارد.
اینتل نتایج آزمایش خود را بر روی Gaudi 2 از طریق معیار MLcommons MLperf برای آموزش و استنباط ارائه کرده است. دادههای جدید Databricks اعتبار بیشتری را برای اینتل در مورد عملکرد فناوری Gaudi خود از طرف شخص ثالث فراهم میکند.
Abhinav Venigalla، معمار ارشد NLP در Databricks، به VentureBeat گفت: “ما تحت تاثیر عملکرد Gaudi 2 قرار گرفتیم، به خصوص استفاده بالای به دست آمده برای استنتاج LLM.” ما پیشبینی میکنیم که با استفاده از پشتیبانی FP8 Gaudi 2 که در آخرین نسخه نرمافزاری آنها موجود است، آموزشهای بیشتر و استنباط دستاوردهای عملکردی داشته باشیم، به دلیل محدودیتهای زمانی، ما فقط توانستیم عملکرد را با استفاده از BF16 بررسی کنیم.
اعداد عملکرد Databricks برای اینتل نیز تعجب آور نیست. ایتان مدینا، مدیر ارشد اجرایی در آزمایشگاه هابانا، یک شرکت اینتل، به VentureBeat گفت که این گزارش با دادههایی که اینتل اندازهگیری میکند و با بازخوردهایی که از مشتریان دریافت میکند، مطابقت دارد.
مدینه گفت: “همیشه خوب است که آنچه می گوییم تایید شود.” از آنجایی که بسیاری از مردم می گویند که Gaudi به نوعی بهترین مخفیانه اینتل است، در واقع مهم است که این نوع بررسی های انتشاراتی در دسترس قرار گیرد تا مشتریان بیشتر و بیشتری بدانند که Gaudi جایگزین مناسبی است.
اینتل همچنان به موفقیت های رقابتی برای گائودی ادامه می دهد
اینتل استارتاپ تراشه هوش مصنوعی Habana Labs را خریداری کرد و فناوری Gaudi آن در سال ۲۰۱۹ با قیمت ۲ میلیارد دلار بازگشته است و از آن زمان تاکنون به طور پیوسته این فناوری را بهبود بخشیده است.
یکی از راه هایی که هدف فروشندگان برای اثبات عملکرد با معیارهای استاندارد صنعتی است. هر دو انویدیا و اینتل به طور معمول در معیارهای MLcommons MLPerf هم برای آموزش و هم برای استنتاج شرکت می کنند که چندین بار در سال به روز می شوند. در جدیدترین معیارهای آموزشی MLPerf 3.1 انویدیا و اینتل که در نوامبر منتشر شد، رکوردهای سرعت آموزش LLM جدیدی را ثبت کردند. چند ماه قبل از آن در سپتامبر، معیارهای استنتاج MLPerf 3.1 منتشر شد، همچنین با عملکرد رقابتی قوی برای Nvidia و Intel.
در حالی که معیارهایی مانند MLPerf و گزارش Databricks ارزشمند هستند، مدینا خاطرنشان کرد که بسیاری از مشتریان برای اطمینان از اینکه پشته سختافزار و نرمافزار برای یک مدل خاص و مورد استفاده کار میکند، به آزمایشهای خود متکی هستند.
او گفت: «بلوغ پشته نرمافزاری فوقالعاده مهم است، زیرا مردم نسبت به سازمانهایی که فروشندگان بهنوعی بهینهسازی آن را انجام میدهند، مشکوک هستند.»
به گفته مدینه، MLPerf جایگاه خود را دارد، زیرا مردم میدانند که برای ارائه نتایج، یک پشته فناوری باید سطح خاصی از بلوغ را پشت سر بگذارد. با این حال، او تأکید کرد که نتایج MLPerf چیزی نیست که مشتریان برای تصمیم گیری تجاری به آن تکیه کنند.
مدینه گفت: «نتایج MLperf نوعی فیلتر بلوغ است که سازمانها قبل از صرف زمان برای آزمایش از آن استفاده میکنند».
Gaudi 3 در سال ۲۰۲۴ عرضه می شود
داده های جدید Gaudi 2 در حالی منتشر می شود که اینتل در حال آماده شدن برای راه اندازی فناوری شتاب دهنده هوش مصنوعی Gaudi 3 در سال ۲۰۲۴ است.
Gaudi 2 با فرآیند ۷ نانومتری توسعه یافته است، در حالی که Gaudi 3 مبتنی بر فرآیند ۵ نانومتری است و ۴ برابر قدرت پردازش و دو برابر پهنای باند شبکه را ارائه می دهد. مدینه گفت که Gaudi 3 در سال ۲۰۲۴ به بازار عرضه می شود و به تولید انبوه می رسد.
مدینه گفت: “Gaudi 3 محصولی است که Gaudi 2 را می گیرد و فقط رهبری عملکرد را ارائه می دهد.” “این واقعا یک جهش بزرگ در عملکرد است که به مزایای عملکرد به ازای هر دلار و عملکرد در هر وات ترجمه می شود.”
با نگاهی فراتر از Gaudi 3 و احتمالاً در سال ۲۰۲۵، اینتل در حال کار بر روی نسلهای آینده است که محاسبات با کارایی بالا (HPC) و فناوری شتابدهنده هوش مصنوعی این شرکت را به هم نزدیک میکنند. اینتل همچنین همچنان به ارزش فناوری های CPU خود برای بارهای کاری استنتاج هوش مصنوعی نیز ادامه می دهد. اینتل اخیرا اعلام کرده است پردازنده های Xeon نسل پنجم با شتاب هوش مصنوعی
مدینه گفت: “CPU ها هنوز درصد قابل توجهی از استنتاج دارند و حتی تنظیم دقیق می تواند در CPU ها مفید باشد.” پردازندهها در آمادهسازی دادهها شرکت میکنند و البته همراه با شتابدهنده Gaudi برای بارهای کاری که چگالی محاسبات برای هوش مصنوعی بسیار زیاد است، ارائه میشوند؛ بنابراین استراتژی کلی ارائه طیف وسیعی از راهحلها است.
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/ai/exclusive-databricks-research-confirms-that-intel-gaudi-bests-nvidia-on-price-performance-for-ai-accelerators/