آموزش مدلهای هوش مصنوعی یک امر گرانقیمت است. جمع آوری داده ها و تولید داده ها معمولاً بسیار گران است. با این حال، یک استارتآپ هندی، این کد را برای تولید دادهها برای شرکتهای فناوری بزرگ که برای گوگل، متا و اینستاگرام کار میکنند، شکسته است. قسمت سرگرم کننده؟ این استارت آپ توسط یک جوان ۲۷ ساله راه اندازی شد.
Karya که در سال ۲۰۲۱ و قبل از موج ChatGPT تأسیس شد، توجه غول های فناوری را که تشنه داده هستند به خود جلب کرده است. به گفته ناسکام، انجمن تجاری صنعت فناوری کشور، پیشبینی میشود که در هند، تعداد کارگران حاشیه نویسی داده تا سال ۲۰۳۰ به یک میلیون نفر برسد.
Karya خود را با پرداخت ۲۰ برابر حداقل دستمزد به پیمانکاران خود، که عمدتاً زنان در مناطق روستایی هستند، متمایز می کند و هدف آن تولید داده های با کیفیت بالا به زبان هندی است که شرکت های فناوری به دنبال آن هستند.
مانو چوپرا، بنیانگذار ۲۷ ساله Karya، یک مهندس کامپیوتر تحصیل کرده در استنفورد، می گوید: شرکت های بزرگ فناوری میلیاردها دلار برای جمع آوری داده های آموزشی برای مدل های هوش مصنوعی و یادگیری ماشین خود هزینه می کنند. دستمزد کم برای چنین کاری یک شکست صنعتی است.
چندین شرکت پیشرو در فناوری با Karya همکاری می کنند تا یکی از چالش های حیاتی در توسعه هوش مصنوعی را برطرف کنند: به دست آوردن داده های با کیفیت بالا برای خدمت به کاربران غیر انگلیسی زبان. این مشارکت ها نشان دهنده یک تغییر بالقوه در اقتصاد صنعت داده و رابطه سیلیکون ولی با ارائه دهندگان داده است.
مایکروسافت از Karya برای منبع دادههای گفتار محلی برای محصولات هوش مصنوعی خود استفاده کرده است، بنیاد بیل و ملیندا گیتس نیز با Karya برای کاهش تعصبات جنسیتی در مدلهای زبان تغذیه داده کار میکند، و Google برای جمعآوری دادههای گفتاری در ۸۵ سال به Karya و سایر شرکای محلی متکی است. مناطق هند
تنها در هند، نزدیک به یک میلیارد کاربر بالقوه مشتاق دسترسی به راه حل های مبتنی بر هوش مصنوعی در بخش های مختلف، از مراقبت های بهداشتی گرفته تا آموزش و امور مالی هستند.
مانیش گوپتا، رئیس بخش تحقیقات گوگل در هند، با اشاره به چت ربات هوش مصنوعی این شرکت خاطرنشان می کند: «هند اولین کشور غیرغربی است که ما این کار را در آن انجام می دهیم، و ما Bard را به ۹ زبان هندی آزمایش می کنیم. “بیش از ۷۰ زبان هندی که توسط بیش از یک میلیون نفر صحبت می شود، هرکدام دارای ساختار دیجیتال صفر بودند. مشکل بسیار فاحش است.
در هند، بیش از ۳۲۰۰۰ کارگر جمعسپاری، ۴۰ میلیون کار دیجیتالی پرداختشده را انجام دادهاند، مانند تشخیص تصویر، تراز کردن خطوط، حاشیهنویسی ویدیویی و حاشیهنویسی گفتار. بنیانگذار Karya، مانو چوپرا، نه تنها به دنبال بهبود عرضه اطلاعات است، بلکه به دنبال مبارزه با فقر است. چوپرا، که فقر را در سال های اولیه زندگی خود تجربه کرد، به استفاده از فناوری برای پرداختن به این موضوع اختصاص دارد.
Karya همچنین با بیش از ۳۰,۰۰۰ زن جوان تحصیل کرده برای ایجاد مجموعه داده های “جنسیتی عمدی” برای بنیاد بیل و ملیندا گیتس کار می کند. هدف این تلاش گسترده کاهش تعصبات مربوط به جنسیت در مدلهای زبانی بزرگ است که نقطه عطفی برای زبانهای هندی ایجاد میکند.
تأثیر کاریا به هند محدود نمی شود. این شرکت در حال مذاکره برای گسترش پلت فرم خود به عنوان خدماتی برای سازمانهای آفریقا و آمریکای جنوبی برای تلاشهای جمعآوری دادههای مشابه است.
(با نظر آژانس ها)
منبع: https://www.firstpost.com/tech/big-tech-like-google-microsoft-are-hiring-this-indian-startup-by-a-27-y-o-to-help-train-their-ai-models-13342292.html