VentureBeat ارائه می دهد: AI Unleashed – یک رویداد اجرایی انحصاری برای رهبران داده های سازمانی. شبکه و یادگیری با همتایان صنعت. بیشتر بدانید
مستقر در سانفرانسیسکو دیتاسوریک استارتآپ هوش مصنوعی متخصص در برچسبگذاری متن و صدا برای پروژههای هوش مصنوعی، امروز راهاندازی آزمایشگاه LLM را اعلام کرد، یک فروشگاه جامع یک مرحلهای برای کمک به تیمها در ساخت و آموزش برنامههای کاربردی مدل زبانی بزرگ سفارشی مانند ChatGPT.
این آزمایشگاه که هم برای استقرار ابری و هم برای استقرار داخلی در دسترس است، به شرکتها نقطه شروعی میدهد تا سفارشی داخلی خود را ایجاد کنند. هوش مصنوعی مولد برنامه های کاربردی بدون نگرانی در مورد خطرات کسب و کار و حریم خصوصی داده ها که اغلب از خدمات شخص ثالث ناشی می شود. همچنین به تیم ها کنترل بیشتری بر پروژه هایشان می دهد.
“ما ابزاری ساختهایم که به طور کلی به رایجترین نقاط درد میپردازد، از بهترین شیوههای به سرعت در حال تکامل پشتیبانی میکند، و فلسفه طراحی امضای خود را برای سادهسازی و سادهسازی فرآیند به کار میگیرد. در طول سال گذشته، ما مدلهای سفارشی را برای خودمان ساخته و ارائه کردهایم. ایوان لی، مدیرعامل و موسس Datasaur در بیانیه ای گفت: استفاده داخلی و مشتریان ما، و از این تجربه، ما توانستیم یک محصول LLM مقیاس پذیر و با استفاده آسان ایجاد کنیم.
آنچه آزمایشگاه Datasaur LLM به میز آورده است
از زمان راهاندازی در سال ۲۰۱۹، Datasaur به تیمهای سازمانی کمک کرده است تا با کار مداوم و توسعه یک پلت فرم جامع حاشیهنویسی داده، برچسبگذاری دادهها را برای هوش مصنوعی و NLP اجرا کنند. اکنون، آن کار در آزمایشگاه LLM به اوج خود رسیده است.
لی در ایمیلی به VentureBeat نوشت: «این ابزار فراتر از پیشنهادات موجود Datasaur است، که در درجه اول بر روشهای سنتی پردازش زبان طبیعی (NLP) مانند شناسایی موجودیت و طبقهبندی متن تمرکز میکند. LLM ها تکامل جدید و قدرتمند فناوری LLM هستند و ما می خواهیم به عنوان راه حل کلید در دست صنعت برای همه برنامه های کاربردی هوش مصنوعی متن، اسناد و صوتی مرتبط به کار ادامه دهیم.
در شکل فعلی، این پیشنهاد یک رابط همهکاره برای مدیریت جنبههای مختلف ساخت یک برنامه LLM، درست از دریافت دادههای داخلی، آمادهسازی داده، بازیابی تولید افزوده شده (RAG)، انتخاب مدل تعبیهشده، و بهینهسازی جستجوی شباهت ارائه میکند. افزایش پاسخ های LLM و بهینه سازی هزینه های سرور. لی می گوید که کل کار بر اساس اصول ماژولار بودن، ترکیب پذیری، سادگی و قابلیت نگهداری اجرا شده است.
“این (رویکرد) به طور موثر جاسازی های متنی مختلف را مدیریت می کند، پایگاه های داده برداری و مدل های فونداسیون فضای LLM به طور مداوم در حال تغییر است و مهم است که یک پلت فرم مبتنی بر فناوری ایجاد کنیم که به کاربران امکان می دهد فناوری های مختلف را در داخل و خارج مبادله کنند، زیرا آنها در تلاش برای توسعه بهترین راه حل ممکن برای موارد استفاده خود هستند.”
برای شروع کار با آزمایشگاه LLM، کاربران باید یک مدل پایه انتخابی را انتخاب کنند و تنظیمات/پیکربندی (دما، حداکثر طول و غیره) مرتبط با آن را به روز کنند.
از جمله مدل های پشتیبانی شده هستند لاما ۲ متاموسسه نوآوری فناوری در ابوظبی شاهینو کلود آنتروپیکهمچنین کاج برای پایگاه های داده برداری
در مرحله بعد، آنها باید الگوهای اعلانات را برای نمونهبرداری انتخاب کرده و آنها را آزمایش کنند تا ببینند چه چیزی بر روی چیزی که به دنبال آن هستند بهترین کار را میکند. آنها همچنین می توانند اسناد را برای RAG بارگذاری کنند.
پس از تکمیل مراحل فوق، آنها باید پیکربندی بهینه را برای معاوضه کیفیت/عملکرد نهایی کرده و برنامه را اجرا کنند. بعداً، همانطور که استفاده می شود، می توانند جفت های prompt/complete را ارزیابی کنند رتبه بندی/رتبه بندی پروژه ها و دوباره به مدل برای تنظیم دقیق/تقویت یادگیری از طریق بازخورد انسانی (RLHF) اضافه کنید.
شکستن موانع فنی
در حالی که لی تعداد شرکتهایی را که آزمایشگاه جدید LLM را آزمایش میکنند به اشتراک نمیگذارد، او خاطرنشان کرد که بازخوردها تاکنون مثبت بوده است.
میشل هاندکا، بنیانگذار و مدیر عامل شرکت GLAIR.aiیکی از مشتریان این شرکت، خاطرنشان کرد که آزمایشگاه شکاف های ارتباطی بین تیم های مهندسی و غیر مهندسی را پر می کند و موانع فنی در توسعه برنامه های LLM را از بین می برد – به آنها امکان می دهد به راحتی روند توسعه را مقیاس کنند.
تا کنون، Datasaur به شرکتها در بخشهای حیاتی، مانند مالی، حقوقی و مراقبتهای بهداشتی کمک کرده است تا دادههای بدون ساختار خام را به مجموعه دادههای ارزشمند ML تبدیل کنند. برخی از نامهای بزرگی که در حال حاضر با این شرکت کار میکنند عبارتند از: Qualtrics، Ontra، Consensus، LegalTech و Von Wobeser y Sierra.
لی تأکید کرد: «ما توانستهایم از رهبران صنعت آیندهنگر حمایت کنیم و در مسیر رسیدن به درآمد ۵ برابری در سال ۲۰۲۴ هستیم.
آینده Datasaur و آزمایشگاه LLM آن چیست
در سال آینده، این شرکت قصد دارد آزمایشگاه را ایجاد کند و بیشتر در توسعه LLM در سطح سازمانی سرمایه گذاری کند.
کاربران محصول می توانند موفق ترین پیکربندی ها و درخواست های خود را ذخیره کرده و یافته ها را با همکاران خود به اشتراک بگذارند.
آزمایشگاه از مدل های پایه جدید و جدید نیز پشتیبانی خواهد کرد.
به طور کلی، انتظار می رود این محصول با توجه به نیاز روزافزون به برنامه های کاربردی LLM سفارشی و متمرکز بر حریم خصوصی، تأثیر قابل توجهی داشته باشد. در اخیر گزارش نظرسنجی LLM برای سال ۲۰۲۳تقریباً ۶۲ درصد از پاسخ دهندگان اظهار داشتند که از برنامه های LLM (مانند ChatGPT و Github Copilot) حداقل برای یک مورد استفاده مانند ربات های چت، پشتیبانی مشتری و کدنویسی استفاده می کنند.
با این حال، با محدود کردن شرکتها به دلیل نگرانیهای مربوط به حفظ حریم خصوصی، دسترسی کارمندان به مدلهای همهمنظوره را محدود کردهاند، تمرکز تا حد زیادی به سمت راهحلهای داخلی سفارشی، ساختهشده برای حفظ حریم خصوصی، امنیت و الزامات قانونی تغییر کرده است.
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/ai/datasaur-launches-llm-lab-to-help-enterprises-build-custom-chatgpt-like-applications/