Braintrust Data می‌خواهد با ارزیابی‌های سریع‌تر هوش مصنوعی سازمانی را بهتر کند

آیا آماده اید تا آگاهی بیشتری را به برند خود بیاورید؟ در نظر بگیرید که برای تور AI Impact Tour اسپانسر شوید. درباره فرصت ها بیشتر بدانید اینجا.


مستقر در کالیفرنیا داده های اعتماد مغزیاستارتاپی که به شرکت‌ها در ساخت و بهبود هوش مصنوعی در سرعت و مقیاس کمک می‌کند، امروز اعلام کرد که ۵٫۱ میلیون دلار در دور اولیه سرمایه به رهبری Greylock Partners جمع‌آوری کرده است.

اندکی بیش از دو ماه پیش توسط آنکور گویال تأسیس شد که سرمایه‌گذاری قبلی خود در زمینه هوش مصنوعی Impira را به فیگماBraintrust مشکل ارزیابی هوش مصنوعی را با دادن ابزاری اختصاصی به تیم ها هدف قرار می دهد تا ببینند مدل هوش مصنوعی آنها چگونه عمل می کند و قبل از رسیدن به مرحله تولید آن را به خوبی بهبود بخشد.

این شرکت علیرغم اینکه یک سرمایه گذاری در مراحل اولیه است، ده ها مشتری و سرمایه گذاری از نام های شناخته شده در صنعت، از جمله الاد گیل، کلم دلانگو، جذب کرده است. گرگ براکمنجک آلتمن، هاوی لیو، گیرمو راخ، برایان هلمیگ، سایمون لاست، ویپول ود پراکاش.

اکنون، این شرکت قصد دارد تیم خود را گسترش دهد و بر روی این کار بسازد و به توسعه دهندگان این امکان را می دهد که سریعتر حرکت کنند و دائماً در خط مقدم هوش مصنوعی باقی بمانند.

رویداد VB

تور تاثیر هوش مصنوعی

در تور AI Impact VentureBeat که به شهر نزدیک شما می آید، با جامعه هوش مصنوعی سازمانی ارتباط برقرار کنید!

بیشتر بدانید

تولید هوش مصنوعی می تواند کثیف باشد

هوش مصنوعی پشتوانه برنامه‌های تجاری مدرن است، اما وقتی نوبت به حفظ این برنامه‌ها می‌رسد، همه چیز می‌تواند کاملاً به هم ریخته شود. یک تغییر کوچک کد با هدف بهبود برنامه ممکن است منجر به شکسته شدن کل گردش کار شود و تیم‌های باطن را برای کشف و رفع مشکل ایجاد کند.

این رویکرد واکنشی می‌تواند تجربه مشتری را بشکند – به همین دلیل است که تیم‌های توسعه‌دهنده توجه زیادی به تمرین ارزیابی در حلقه توسعه‌دهنده می‌کنند، جایی که سعی می‌کنند عملکرد سیستم هوش مصنوعی را اندازه‌گیری کنند. آنها ابتدا داده ها و معیارهای زمینه خاص را تجزیه و تحلیل می کنند و سپس به سرعت با مدل های مختلف، اعلان ها، تنظیم دقیق و سایر تکنیک ها برای دستیابی به نتایج مطلوب آزمایش می کنند.

زمان و تلاش، کارآمد

حال، مسئله این است که این تکنیک به خوبی کار می‌کند، اما زمان و تلاش زیادی را نیز می‌طلبد، و اغلب راه‌اندازی ویژگی‌ها را به تأخیر می‌اندازد – این دقیقاً همان چیزی است که گویال در طول کار خود در Impira و Figma با آن روبرو شد.

پس از صحبت با چندین تیم در یک مشکل، او تصمیم گرفت تا Braintrust Data را بسازد تا تغییرات کد را در نمونه‌های واقعی آزمایش کند و امکان ارزیابی سریع‌تر را فراهم کند.

“محصول ما به شما این امکان را می دهد که به راحتی (در کمتر از یک ساعت) کد خود را برای تعریف ارزیابی ها، گرفتن بازخوردهای کاربر، ثبت و ضبط کنید. LLM تماس‌ها، و غیره. هر بار که تغییری ایجاد می‌کنید، می‌توانید ارزیابی‌ها را دوباره اجرا کنید و فوراً داشبوردی دریافت کنید که به شما می‌گوید چقدر چیزها را بهبود داده‌اید یا پسرفت کرده‌اید، و موارد فردی را (قبل از انتقال به استقرار نهایی) اشکال‌زدایی کنید. همچنین می‌توانید نمونه‌هایی را از مرحله‌بندی/تولید ثبت کنید و ارزیابی‌هایی را علیه آن‌ها اجرا کنید تا موارد لبه جدیدی را که کاربران به آن ضربه می‌زنند، پیدا کنید.» او به VentureBeat گفت.

صدها مشتری در حال حاضر

مدیر عامل این محصول را در آگوست ۲۰۲۳ روانه بازار کرد و تاکنون “صدها” شرکت و استارت آپ را به عنوان مشتری، از جمله نام های شناخته شده ای مانند Airtable، Zapier، Coda و Instacart معرفی کرده است. به گفته وی، با Braintrust، این بازیکنان توانسته اند دقت ارائه های هوش مصنوعی خود را تنها در عرض چند هفته بیش از ۳۰ درصد افزایش دهند که منجر به چرخه کشتی سریع تر، تعامل بیشتر و همکاری تیمی بهتر می شود.

گویال افزود: “محصول ما می تواند در محیط ابری شما اجرا شود، که برای امنیت سازمانی حیاتی است، به ویژه در هوش مصنوعی که با PII و اطلاعات اختصاصی بیداد می کند. این امر به مشتریان سازمانی ما امکان می دهد تا از Braintrust برای کارهای حیاتی خود استفاده کنند.” .

مهمتر از آن، علاوه بر ارزیابی ها، Braintrust شروع به ارائه قابلیت های مفید دیگری برای کمک به تیم های هوش مصنوعی برای تکرار و ارسال سریعتر کرده است. این شامل یک زمین بازی سریع برای مقایسه چند فرمان، معیارها، جفت های ورودی/خروجی مربوطه بین اجراها، مدیریت مجموعه داده ها و یک پروکسی هوش مصنوعی است که به مدل های هوش مصنوعی محبوب، از جمله همه موارد، دسترسی پیدا می کند. OpenAI مدل‌ها، مدل‌های انسانی، LLaMa 2 و میسترال.

تمرکز روزافزون بر کیفیت هوش مصنوعی

از آنجایی که شرکت‌ها نسبت به قابلیت‌های هوش مصنوعی صعودی هستند، پیشنهادی برای ارزیابی عملکرد مدل و رفع شکاف‌ها می‌تواند مفید باشد. با این حال، برینتراست در این فضا تنها نیست.

در طول سال گذشته، از زمانی که OpenAI با راه‌اندازی ChatGPT رونق هوش مصنوعی مولد را آغاز کرد، بسیاری از بازیکنان محصولاتی را برای کمک به تیم‌ها در ساخت محصولات هوش مصنوعی ارائه کردند. برخی از آنها بر روی مدل ها تمرکز می کنند معیارهای عملکرد مانند نرخ خطای APIمحدودیت نرخ و زمان پاسخ.

در همین حال، دیگران هدف قرار می دهند جبهه قابل مشاهدهارائه تجزیه و تحلیل دقیق و بینش در مورد کیفیت خروجی های ارائه شده توسط مدل.

Braintrust از سوی خود مدعی است که با ارائه بینش قبل از رسیدن مدل به مرحله تولید، متمایز می شود.

شکی نیست که این یک فضای هیجان‌انگیز با شرکت‌های دیگر است که تلاش می‌کنند ارزش اضافه کنند. بیشتر محصولات موجود در آنجا بر روی قابلیت مشاهده متمرکز هستند، که به شما امکان می‌دهد ببینید در تولید چه اتفاقی می‌افتد. متأسفانه، اگر فقط قابلیت مشاهده دارید، باید چیزهایی را ارسال کنید. ما متوجه شدیم که تیم‌های مهندسی که ارزیابی‌های عالی را پیاده‌سازی می‌کنند، بسیار سریع‌تر – تا ۱۰ برابر سریع‌تر – نسبت به آن‌هایی که فقط در حال تماشای اتفاقات تولید هستند و سعی می‌کنند آن‌ها را به طور موقت اصلاح کنند، حرکت می‌کنند. گویال اشاره کرد.

با این دور از Greylock، که کل سرمایه شرکت را به ۸٫۳ میلیون دلار افزایش می دهد، او قصد دارد استعدادهای بیشتری را استخدام کند و به طور تهاجمی به نقشه راه محصول ادامه دهد تا راه حل پیشرو بازار را برای ارزیابی ها ایجاد کند و از ابزارهای هوش مصنوعی بیشتر، از جمله یک زمین بازی سریع، پشتیبانی کند. ، گزارش تولید، پشتیبانی از مدل چند وجهی، پروکسی هوش مصنوعی و موارد دیگر.

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.


منبع: https://venturebeat.com/ai/braintrust-data-wants-to-make-enterprise-ai-better-with-faster-evaluations/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *