هر بار که مایکروسافت امسال یکی از ویژگیهای اصلی هوش مصنوعی را راهاندازی میکرد، نمیتوانستم در مورد مسیر جدید شرکت تردید بیشتری داشته باشم. مایکروسافت، غول محافظهکار و کمحرکتی است که مدتی پس از آن که بیشتر مردم از وجود هوش مصنوعی مولد مطلع شدند، محصولات خود را حول هوش مصنوعی تغییر شکل داد. آخرین باری که چنین تغییر چشمگیری ایجاد کرد، ویندوز ۸ را دریافت کردیم، تلاشی ناموفق برای سازگار کردن تبلت و صفحه نمایش لمسی پرچمدار سیستم عامل آن.
اکنون، این شرکت هوش مصنوعی را مستقیماً به قلب ویندوز وارد میکند و من میپرسم: آیا مایکروسافت برای بهتر کردن محصولات خود به سمت هوش مصنوعی میرود؟ یا فقط تلاش میکند ادعای خود را بهعنوان یک مبتکر هوش مصنوعی مطرح کند و دعا کند که این فناوری واقعاً مطابق با تبلیغات تبلیغاتی باشد؟ در این مرحله، واقعاً تشخیص آن سخت است.
همانطور که Zune، WebTV و Windows Phone نشان دادهاند، مایکروسافت در زمانبندی چندان عالی نیست. محصولات آن اغلب یا خیلی زود فرود می آیند تا مفید باشند (مانند مورد وب سایت کند) یا خیلی دیر به مقصد می رسید (مانند واقعا عالی Zune HD). اما زمانی که این شرکت در اوایل سال جاری از Bing Chat مبتنی بر هوش مصنوعی خود رونمایی کرد، کاملاً در موقعیت مناسبی قرار گرفت تا موفقیت ChatGPT را که تا آن زمان موفق شده بود، حفظ کند. طبق گزارش ها به ۱۰۰ میلیون کاربر رسیده است فقط در دو ماه به گفته تحلیلگران UBS، این امر باعث می شد ChatGPT سریع ترین برنامه مصرف کننده در حال رشد در تاریخ باشد. چه زمانی بهتر برای تلفیق قدرت هوش مصنوعی مولد با یکی از محصولات بدنام محاصره شده آن؟ مایکروسافت چیزی برای از دست دادن نداشت.
پس از سرمایهگذاری ۱۳ میلیارد دلاری در OpenAI سازنده ChatGPT (و کسب ۴۹ درصد از سهام این فرآیند)، مایکروسافت احتمالاً مشتاق بود که اسباببازی جدید براق خود را جلوتر از گوگل و دیگران به نمایش بگذارد. معرفی بینگ چت رسما سال هوش مصنوعی مایکروسافت را آغاز کرد: Copilot در Edge راه اندازی شد. محصولات مایکروسافت ۳۶۵ مانند Word و Powerpoint و در نهایت به ویندوز ۱۱ راه پیدا کرد. حتی شگفتآورتر اینکه این شرکت اخیراً اعلام کرده است Copilot به ویندوز ۱۰ می آید – نشانهای که میخواهد ویژگیهای هوش مصنوعی را در جلوی هر چه بیشتر مردم داشته باشد. (گزارش شده است که ویندوز ۱۱ حساب می کند ۲۶ درصد از نصب ویندوزدر حالی که ویندوز ۱۰ هنوز ۶۹ درصد دارد. با هدف قرار دادن هر دو پلتفرم، Copilot به طور بالقوه می تواند به ۱٫۴ میلیارد کاربر برسد.)
شکی نیست که Copilot تاثیر اولیه خوبی بر جای می گذارد. چند کلمه تایپ کنید (یا با صدای بلند صحبت کنید)، و با پاسخ های مستقیم به سوالات شما، مانند دستیار هوشمند شلاقی، باز می گردد. هیچ تبلیغی وجود ندارد که بخواهید از آن عبور کنید و فقط در صورت تمایل باید با پیوندهای اضافی درگیر شوید. این نگاهی اجمالی به دنیایی فراتر از موتورهای جستجو است، دنیایی که در آن هوش مصنوعی میتواند به ما کمک کند در یک چشمانداز رسانهای که به طور فزایندهای آشفتهتر میشویم. Copilots مایکروسافت همچنین می تواند در برنامه های خاص کمک کند: در Edge می تواند صفحه وب مورد نظر شما را خلاصه کند. می تواند به رونویسی و ایجاد نقاط عمل در جلسات تیم کمک کند. و می تواند به سختی یافتن تنظیمات در ویندوز کمک کند (به عنوان مثال، فقط می توانید تایپ کنید "چگونه حالت شب را روشن کنم؟" برای ورق زدن آن).
اما روکش مطمئن Copilot این واقعیت را پنهان می کند که او اغلب اشتباه می کند و گاهی اوقات می تواند سؤالات شما را کاملاً اشتباه متوجه شود. این بسیار کمتر از استفاده از یک موتور جستجوی معمولی پاسخگو است، زیرا پردازشهای غیرشفاف هوش مصنوعی زیادی در پسزمینه اتفاق میافتد. و در آزمایش من، بیشتر از آنچه فکر میکنید خراب میشود، که به “راهاندازی مجدد” جلسه شما نیاز دارد (اما حداقل مانند ویندوز یک صفحه آبی چشمک نمیزند).
مایکروسافت در تلاشی برای تعدیل انتظارات ما یک یادداشت مفید در بالای چت هوش مصنوعی بینگ دارد: "بینگ از هوش مصنوعی پشتیبانی می کند، بنابراین ممکن است شگفتی ها و اشتباهات رخ دهد. لطفا بازخورد خود را به اشتراک بگذارید تا بتوانیم بهتر شویم!" به نظر میرسد مایکروسافت در اینجا با اذعان به اینکه چت هوش مصنوعی آن بینقص نیست، فروتنی نشان میدهد و سعی میکند با گفتن اینکه به بازخورد شما گوش میدهد، امتیازات عجیبی به دست آورد. با این حال، عمدتاً این هشدار به عنوان راهی برای مایکروسافت عمل می کند. این می تواند توانایی Copilot در نوشتن مقاله برای شما و برگزاری مکالمات مبهم واقع گرایانه را تبلیغ کند، اما به محض اینکه خراب شود، شرکت فقط می تواند بگوید: "این فقط یک بتا است، LOL!"
آزمون بزرگ برای Copilots مایکروسافت و سایر ابزارهای مولد هوش مصنوعی به یک چیز ختم می شود: اعتماد. آیا کاربر می تواند اطمینان داشته باشد که هنگام پرسیدن سؤال، اطلاعات مربوطه را ارائه می دهد؟ آیا می توانیم مطمئن باشیم که Copilow حتی پرس و جو ما را به درستی درک می کند؟ آرون وودمن، معاون بازاریابی ویندوز مایکروسافت، به ما می گوید که اعتماد در نهایت به کاربران کاهش می یابد. "لگد زدن به لاستیک ها" برای خودشان و دیدن اینکه Copilot چقدر خوب عمل می کند. "من فکر میکنم این نوع رشد ارگانیک یکی از مواردی است که در طول زمان شاهد آن خواهیم بود." او در مصاحبه ای با Engadget در مراسم راه اندازی Windows Copilot در ماه سپتامبر گفت. "و من شرط می بندم که انفجاری خواهد بود زیرا ارزش وجود دارد، و فکر می کنم مشتریان خیلی سریع آن را خواهند دید."
وودمن همچنین معتقد است که کاربران متوجه خواهند شد که Copilot همیشه کامل نخواهد بود، به خصوص در این روزهای اولیه. "من به طرز عجیبی فکر می کنم که ما احتمالاً با مردم همدل تر هستیم و درک می کنیم که آنها با رشد در کجا هستند تا ما با فناوری،" او گفت. "من فکر میکنم بهترین کاری که میتوانیم انجام دهیم این است که صادقانه مالک آن باشیم، در مورد آن شفاف باشیم. در برخی از سطوح، هر مکالمه ای که در آن هستیم، سعی می کنیم به آن متمایل شویم [that] این یک روند رشد است. ما می خواهیم مطمئن شویم که مواد مرجع را درک می کنید. من فکر می کنم مردم متوجه خواهند شد که ما در حال تلاش برای تسریع در آوردن هستیم [new] تکنولوژی به آنها"
من از زمان راهاندازی بینگ چت در اوایل سال جاری از راهحلهای هوش مصنوعی مایکروسافت استفاده میکنم، و اگرچه برای کارهای ساده مانند ایجاد جدول مشخصات با مقایسه دو محصول مفید است، اما دقیقاً نحوه کار من را تغییر نداده است. مایکروسافت نیز مجبور بود به طور جدی توانایی های Bing Chat را در همان ابتدا محدود کنید پس از شروع بحث با کاربران و ارائه پاسخ های نگران کننده. در ویندوز ۱۱، Copilot گاهی اوقات میتواند به من کمک کند تا تنظیماتی مانند حالت تاریک را پیدا کنم، اما همیشه نمیتواند کنترلهای داخل صفحه Copilot را بالا بکشد، و گاهی اوقات اگر نتواند بفهمد من چه چیزی را دارم، من را به منوی تنظیمات عمومی میفرستد. من درخواست می کنم
اخیراً، وقتی از بینگ پرسیدم که آیا زمان خوبی برای خرید یک نینتندو سوییچ است یا خیر، صحبتهای ناامیدکنندهای با بینگ داشتهام (مجبور شد تا شایعاتی مبنی بر احتمال آینده سوئیچ در سال آینده مطرح شود) و توانایی پاسخ دادن به سؤالات پیرامون تصاویر هنوز از جستجوی تصویر گوگل کمتر مفید است.
وقتی از مانیتور کودکم عکس گرفتم و پرسیدم این چیست؟ بینگ از عملکرد آن آگاه بود، اما مدل واقعی و سازنده را اشتباه گرفت. تکمیل آن پرس و جو نیز پنج ثانیه طول کشید. جستجوی تصویر گوگل نیم ثانیه طول کشید و به درستی آن را به عنوان مانیتور فضایی Eufy شناسایی کرد. امتیاز یک برای جستجوی سنتی (و بله، میدانم که از مجموعه مدلهای بینایی کامپیوتری خودش نیز پشتیبانی میشود).
ما می توانیم به مایکروسافت نگاه کنیم Github Copilot، که در نوامبر ۲۰۲۱ راه اندازی شد، به عنوان یکی از راه هایی که کاربران می توانند کار با هوش مصنوعی را یاد بگیرند. اساساً قرار است به عنوان یک شریک در کنار یک برنامه نویس باتجربه خدمت کند: به مشکلات احتمالی توجه می کند و حتی می تواند کدهای ساده ای را تولید کند.
مطابق با توسعه دهنده Aidan Tilgner، Github Copilot می تواند واقعاً برای برنامه نویسان مفید باشد، تا زمانی که انتظارات خود را کنترل کنید. در کاغذ "برنامه نویسی جفت هوش مصنوعی GitHub Copilot: دارایی یا بدهی؟" نویسندگان ارغوان مرادی دخیل، وحید مجدی نسب، امین نیکانجام، فوتس خومه، میشل سی. دزمرایس، و ژن مینگ جیانگ Github Copilot را به طور مشابه مفید دانستند، اما توجه داشته باشید "همچنین اگر توسط افراد تازه کار استفاده شود، کسانی که ممکن است با زمینه مشکل و روش های کدگذاری صحیح آشنا نباشند، می تواند به یک بدهی تبدیل شود."
"Copilot راه حل هایی را پیشنهاد می کند که ممکن است باگ و درک آن دشوار باشد، که ممکن است توسط تازه کارها به عنوان راه حل های صحیح پذیرفته شود." نویسندگان اضافه می کنند. "افزودن چنین کدهای باگ و پیچیده به پروژه های نرم افزاری می تواند بر کیفیت آنها تأثیر زیادی بگذارد."
مایکروسافت با تکیه بسیار بر Copilots در آینده، ممکن است خود را خیلی نزدیک به OpenAI، یک شرکت جوان که اخیراً یکی از این موارد را پشت سر گذاشته است، پیوند دهد. بی ثبات ترین تعطیلات آخر هفته در تاریخ سیلیکون ولی. هیئت مدیره OpenAI، مدیر عامل شرکت سام آلتمن را برکنار کرد، اما پس از فشارهای داخلی قابل توجهی (و برخی ناسزاگویی های مدیر عامل مایکروسافت ساتیا نادلا)، در نهایت چند روز بعد او را دوباره استخدام کرد. اگر OpenAI یک رویداد پر فراز و نشیب دیگر را پشت سر بگذارد، این فقط سرمایه گذاری ۱۳ میلیارد دلاری مایکروسافت در خطر نخواهد بود، بلکه برنامه های آینده این شرکت برای عملاً همه محصولاتش خواهد بود.
مطابق با Windows Centralبهروزرسانی بزرگ بعدی ویندوز مایکروسافت، “Hudson Valley” ممکن است سال آینده با تعدادی از پیشرفتهای هوش مصنوعی ارائه شود. این شامل توانایی تجزیه و تحلیل محتوای نمایش داده شده در چت های ویدیویی، یک Copilot بهبودیافته است که می تواند هر کاری را که در رایانه شخصی خود انجام داده اید به خاطر بسپارد، و جستجوی بهتر در سراسر سیستم. برخی از ویژگیها ممکن است به CPU با NPU نیاز داشته باشند، مانند آخرین دسته تراشههای AMD و سختافزار Core Ultra جدید اینتل. این شبیه به ویژگیهای Windows Studio Effects مانند محو کردن پسزمینه و کادربندی خودکار است که به NPU نیز نیاز دارند.
یک نکته ثابت در مورد هوش مصنوعی این روزها این است که همه چیز به سرعت در حال تغییر است. از زمانی که نوشتن این قطعه را شروع کردم، مایکروسافت اعلام کرد که Copilot ارتقا خواهد یافت با مدل های قدرتمندتر GPT-4 Turbo و Dall-E 3 که توانایی آنها را بیشتر می کند. شاید مایکروسافت و OpenAI در نهایت بتوانند تمام مشکلاتی را که تاکنون با Copilot دیدهام برطرف کنند و در نهایت یک ابزار هوش مصنوعی متحول کننده ارائه دهند که به راحتی در دسترس همه باشد. اما من هم من به بهترین ها امیدوارم وقتی نوبت به برنامههای Duo و Neo دو صفحهنمای این شرکت رسید، تنها چیزی که در ازای آن به دست آوردم ناامیدی بود.
این مقاله در ابتدا در Engadget در https://www.engadget.com/microsoft-bet-big-on-ai-in-2023-but-its-ai-future-is-still-unclear-143055721.html?src منتشر شد. = rss
منبع: https://www.engadget.com/microsoft-bet-big-on-ai-in-2023-but-its-ai-future-is-still-unclear-143055721.html?src=rss