شرکت‌های بزرگ فناوری مانند گوگل، مایکروسافت این استارت‌آپ هندی را توسط یک جوان ۲۷ ساله برای کمک به آموزش مدل‌های هوش مصنوعی خود استخدام می‌کنند.

آموزش مدل‌های هوش مصنوعی یک امر گران‌قیمت است. جمع آوری داده ها و تولید داده ها معمولاً بسیار گران است. با این حال، یک استارت‌آپ هندی، این کد را برای تولید داده‌ها برای شرکت‌های فناوری بزرگ که برای گوگل، متا و اینستاگرام کار می‌کنند، شکسته است. قسمت سرگرم کننده؟ این استارت آپ توسط یک جوان ۲۷ ساله راه اندازی شد.

Karya که در سال ۲۰۲۱ و قبل از موج ChatGPT تأسیس شد، توجه غول های فناوری را که تشنه داده هستند به خود جلب کرده است. به گفته ناسکام، انجمن تجاری صنعت فناوری کشور، پیش‌بینی می‌شود که در هند، تعداد کارگران حاشیه نویسی داده تا سال ۲۰۳۰ به یک میلیون نفر برسد.

Karya خود را با پرداخت ۲۰ برابر حداقل دستمزد به پیمانکاران خود، که عمدتاً زنان در مناطق روستایی هستند، متمایز می کند و هدف آن تولید داده های با کیفیت بالا به زبان هندی است که شرکت های فناوری به دنبال آن هستند.

مانو چوپرا، بنیانگذار ۲۷ ساله Karya، یک مهندس کامپیوتر تحصیل کرده در استنفورد، می گوید: شرکت های بزرگ فناوری میلیاردها دلار برای جمع آوری داده های آموزشی برای مدل های هوش مصنوعی و یادگیری ماشین خود هزینه می کنند. دستمزد کم برای چنین کاری یک شکست صنعتی است.

چندین شرکت پیشرو در فناوری با Karya همکاری می کنند تا یکی از چالش های حیاتی در توسعه هوش مصنوعی را برطرف کنند: به دست آوردن داده های با کیفیت بالا برای خدمت به کاربران غیر انگلیسی زبان. این مشارکت ها نشان دهنده یک تغییر بالقوه در اقتصاد صنعت داده و رابطه سیلیکون ولی با ارائه دهندگان داده است.

مایکروسافت از Karya برای منبع داده‌های گفتار محلی برای محصولات هوش مصنوعی خود استفاده کرده است، بنیاد بیل و ملیندا گیتس نیز با Karya برای کاهش تعصبات جنسیتی در مدل‌های زبان تغذیه داده کار می‌کند، و Google برای جمع‌آوری داده‌های گفتاری در ۸۵ سال به Karya و سایر شرکای محلی متکی است. مناطق هند

تنها در هند، نزدیک به یک میلیارد کاربر بالقوه مشتاق دسترسی به راه حل های مبتنی بر هوش مصنوعی در بخش های مختلف، از مراقبت های بهداشتی گرفته تا آموزش و امور مالی هستند.

مانیش گوپتا، رئیس بخش تحقیقات گوگل در هند، با اشاره به چت ربات هوش مصنوعی این شرکت خاطرنشان می کند: «هند اولین کشور غیرغربی است که ما این کار را در آن انجام می دهیم، و ما Bard را به ۹ زبان هندی آزمایش می کنیم. “بیش از ۷۰ زبان هندی که توسط بیش از یک میلیون نفر صحبت می شود، هرکدام دارای ساختار دیجیتال صفر بودند. مشکل بسیار فاحش است.

در هند، بیش از ۳۲۰۰۰ کارگر جمع‌سپاری، ۴۰ میلیون کار دیجیتالی پرداخت‌شده را انجام داده‌اند، مانند تشخیص تصویر، تراز کردن خطوط، حاشیه‌نویسی ویدیویی و حاشیه‌نویسی گفتار. بنیانگذار Karya، مانو چوپرا، نه تنها به دنبال بهبود عرضه اطلاعات است، بلکه به دنبال مبارزه با فقر است. چوپرا، که فقر را در سال های اولیه زندگی خود تجربه کرد، به استفاده از فناوری برای پرداختن به این موضوع اختصاص دارد.
Karya همچنین با بیش از ۳۰,۰۰۰ زن جوان تحصیل کرده برای ایجاد مجموعه داده های “جنسیتی عمدی” برای بنیاد بیل و ملیندا گیتس کار می کند. هدف این تلاش گسترده کاهش تعصبات مربوط به جنسیت در مدل‌های زبانی بزرگ است که نقطه عطفی برای زبان‌های هندی ایجاد می‌کند.

تأثیر کاریا به هند محدود نمی شود. این شرکت در حال مذاکره برای گسترش پلت فرم خود به عنوان خدماتی برای سازمان‌های آفریقا و آمریکای جنوبی برای تلاش‌های جمع‌آوری داده‌های مشابه است.

(با نظر آژانس ها)


منبع: https://www.firstpost.com/tech/big-tech-like-google-microsoft-are-hiring-this-indian-startup-by-a-27-y-o-to-help-train-their-ai-models-13342292.html

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *