آیا آماده اید تا آگاهی بیشتری را به برند خود بیاورید؟ در نظر بگیرید که برای تور AI Impact Tour اسپانسر شوید. درباره فرصت ها بیشتر بدانید اینجا.
سیبشرکتی که عملاً مترادف با نوآوری فناوری است، بار دیگر خود را در خط مقدم انقلاب هوش مصنوعی قرار داده است.
این شرکت مستقر در کوپرتینو، کالیفرنیا، اخیراً از طریق دو مقاله جدید که تکنیکهای جدیدی را برای آواتارهای سه بعدی و استنتاج مدل زبانی کارآمد معرفی میکند، گامهای مهمی را در تحقیقات هوش مصنوعی اعلام کرده است. این پیشرفتها میتوانند تجربههای بصری همهجانبهتری را ایجاد کنند و به سیستمهای پیچیده هوش مصنوعی اجازه دهند روی دستگاههای مصرفکننده مانند آیفون و آیپد اجرا شوند.
در اولین مقاله تحقیقاتیدانشمندان اپل پیشنهاد می کنند آغوش (Human Gaussian Splats) برای تولید آواتارهای سه بعدی متحرک از ویدیوهای کوتاه تک چشمی (یعنی فیلم های گرفته شده از یک دوربین). محمد کوکاباس، نویسنده اصلی این مقاله گفت: روش ما فقط یک ویدیوی تک چشمی با تعداد کمی فریم (۵۰ تا ۱۰۰) می گیرد و به طور خودکار می آموزد که صحنه ایستا و یک آواتار انسانی کاملاً متحرک را در عرض ۳۰ دقیقه از هم جدا کند.
HUGS هم صحنه انسان و هم صحنه پس زمینه را با استفاده از پاشیدن گاوسی سه بعدی، یک تکنیک رندر کارآمد، نشان می دهد. مدل انسان از یک مدل آماری شکل بدن به نام مقداردهی اولیه شده است SMPL. اما HUGS به گاوسیان اجازه انحراف را می دهد و امکان ثبت جزئیاتی مانند لباس و مو را فراهم می کند.
رمان ماژول تغییر شکل عصبی گاوسی ها را به شیوه ای واقع گرایانه با استفاده از لایه برداری ترکیبی خطی متحرک می کند. این حرکت هماهنگ در حین قرار دادن آواتار از مصنوعات جلوگیری می کند. به گفته کوکاباس، HUGS “ترکیب ژست بدیع انسان و ترکیب نمای بدیع انسان و صحنه را ممکن می کند.”
در مقایسه با روشهای قبلی تولید آواتار، HUGS در آموزش و رندر تا ۱۰۰ برابر سریعتر است. محققان پس از بهینه سازی سیستم به مدت ۳۰ دقیقه روی یک GPU معمولی بازی، نتایج واقعی واقعی را نشان می دهند. HUGS همچنین از تکنیک های پیشرفته ای مانند عملکرد بهتر عمل می کند Vid2Avatar و NeuMan در کیفیت بازسازی سه بعدی
قابلیت جدید مدل سازی سه بعدی یک دستاورد واقعا چشمگیر از سوی محققان اپل است. عملکرد بلادرنگ و توانایی ایجاد آواتار از ویدیوهای درون وحشی میتواند در آینده نسبتاً نزدیک امکانات جدیدی را برای آزمایش مجازی، حضور از راه دور و رسانههای مصنوعی باز کند. اگر بتوانید صحنه های سه بعدی جدیدی مانند این را درست بر روی دوربین آیفون خود ایجاد کنید، امکانات را تصور کنید!
پر کردن شکاف حافظه در استنتاج هوش مصنوعی
در کاغذ دوممحققان اپل با یک چالش کلیدی در استقرار مدلهای زبان بزرگ (LLM) در دستگاههایی با حافظه محدود مقابله کردند. مدلهای مدرن زبان طبیعی مانند GPT-4 حاوی صدها میلیارد پارامتر هستند که استنتاج را روی سختافزار مصرفکننده گران میکند.
سیستم پیشنهادی انتقال داده از حافظه فلش به DRAM کمیاب را در طول استنتاج به حداقل می رساند. کیوان علیزاده، نویسنده اصلی این مقاله توضیح داد: “روش ما شامل ساخت یک مدل هزینه استنتاج است که با رفتار حافظه فلش هماهنگ است، و ما را برای بهینه سازی در دو حوزه مهم راهنمایی می کند: کاهش حجم داده های منتقل شده از فلش و خواندن داده ها در قطعات بزرگتر و پیوسته تر.” . .
دو تکنیک اصلی معرفی شده است. “پنجره“فعالسازیهای حاصل از استنتاجهای اخیر را مجدداً استفاده میکند، در حالی که”دسته بندی ردیف-ستون“با ذخیره سطرها و ستونها در کنار هم، بلوکهای بزرگتری از دادهها را میخواند. در CPU Apple M1 Max، این روشها تاخیر استنتاج را ۴-۵ برابر در مقایسه با بارگذاری ساده بهبود میبخشند. در یک GPU، سرعت افزایش به ۲۰-۲۵ برابر میرسد.
مهرداد فرجتبار یکی از نویسندگان این مقاله گفت: “این پیشرفت به ویژه برای استقرار LLM های پیشرفته در محیط های محدود به منابع بسیار مهم است و در نتیجه کاربرد و دسترسی آنها را گسترش می دهد.” این بهینهسازیها به زودی به دستیاران و چتباتهای پیچیده هوش مصنوعی اجازه میدهد تا به راحتی روی آیفون، آیپد و سایر دستگاههای تلفن همراه اجرا شوند.
چشم انداز استراتژیک اپل
هر دو مقاله رهبری رو به رشد اپل را در تحقیقات و برنامه های کاربردی هوش مصنوعی نشان می دهند. کارشناسان هشدار میدهند که در عین نویدبخش بودن، اپل باید هنگام استفاده از این فناوریها در محصولات مصرفکننده دقت و مسئولیت زیادی به خرج دهد. از حفاظت از حریم خصوصی تا کاهش سوء استفاده، تاثیر اجتماعی باید در نظر گرفته شود.
از آنجایی که اپل به طور بالقوه این نوآوری ها را در مجموعه محصولات خود ادغام می کند، واضح است که این شرکت نه تنها دستگاه های خود را بهبود می بخشد، بلکه نیازهای آینده خدمات مبتنی بر هوش مصنوعی را نیز پیش بینی می کند. اپل با اجازه دادن به مدلهای پیچیدهتر هوش مصنوعی برای اجرا بر روی دستگاههایی با حافظه محدود، به طور بالقوه زمینه را برای کلاس جدیدی از برنامهها و سرویسها فراهم میکند که از قدرت LLMها به گونهای استفاده میکنند که قبلا غیرممکن بود.
علاوه بر این، اپل با انتشار این تحقیق به جامعه گستردهتر هوش مصنوعی کمک میکند که میتواند پیشرفتهای بیشتر در این زمینه را تحریک کند. این اقدامی است که نشاندهنده اعتماد اپل به موقعیت خود بهعنوان یک رهبر فناوری و تعهد آن به جلو بردن مرزهای ممکن است.
آخرین نوآوریهای اپل در صورتی که هوشمندانه اعمال شوند، میتوانند هوش مصنوعی را به سطح بالاتری ببرند. آواتارهای دیجیتال واقعی و دستیارهای قدرتمند هوش مصنوعی در دستگاه های قابل حمل زمانی دور به نظر می رسید – اما به لطف دانشمندان اپل، آینده به سرعت در حال تبدیل شدن به واقعیت است.
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/ai/apples-latest-ai-research-could-completely-transform-your-iphone/