این دلیل است که مردم می گویند GPT-4 “تنبل” می شود

OpenAI و فناوری‌های آن در بیشتر ماه نوامبر در میان رسوایی قرار داشتند. بین اخراج سریع و استخدام مجدد مدیرعامل سام آلتمن و ماجرای عجیب ChatGPT Plus متوقف شد اشتراک های پولی، OpenAI صنعت هوش مصنوعی را هفته ها در اخبار نگه داشته است.

اکنون، علاقه مندان به هوش مصنوعی موضوعی را دوباره مطرح کرده اند که بسیاری از آنها نمی پرسند که آیا GPT-4 با ادامه آموزش مدل زبان، “تنبل تر” می شود. بسیاری از کسانی که از آن استفاده می کنند کارهای فشرده تر را سرعت می بخشند، به X (توئیتر سابق) مراجعه کرده اند تا نارضایتی خود را در مورد تغییرات درک شده بیان کنند.

OpenAI به اندازه کافی دارای ایمنی GPT-4 است که تنبل و ناتوان می شود.

این فایل را تبدیل کنید؟ خیلی طولانی است. جدول بنویسیم؟ این سه خط اول است. این لینک را بخوانید؟ متاسفم نمیتونم این فایل py را بخوانید؟ اوه مجاز نیست.

خیلی ناامید کننده

— روهیت (@krishnanrohit) 28 نوامبر ۲۰۲۳

روهیت کریشنان در X به تفصیل چندین از اشتباهاتی که او در هنگام استفاده از GPT-4 تجربه کرد، که مدل زبان پشت ChatGPT Plus، نسخه پولی ChatGPT است. او توضیح داد که ربات چت چندین سؤال او را رد کرده یا نسخه‌های کوتاه‌شده درخواست‌هایش را در زمانی که قبلاً می‌توانست پاسخ‌های دقیق دریافت کند به او داده است. او همچنین خاطرنشان کرد که مدل زبان از ابزارهایی غیر از آنچه که برای استفاده از آن دستور داده شده است، استفاده خواهد کرد، مانند Dall-E هنگامی که یک درخواست مفسر کد می‌خواهد. کریشنان همچنین به طعنه اضافه کرد که “تجزیه و تحلیل خطا” روش مدل زبانی برای گفتن “AFK” است. [away from keyboard]یکی دو ساعت دیگر برگرد.»

مت ونسینگ در X آزمایش خود را به تفصیل شرح دادجایی که پرسید ChatGPT Plus برای تهیه فهرستی از تاریخ‌ها از هم‌اکنون تا ۵ مه ۲۰۲۴، و ربات چت قبل از اینکه بتواند کار اولیه را انجام دهد، به اطلاعات بیشتری مانند تعداد هفته‌های بین آن تاریخ‌ها نیاز داشت.

پروفسور وارتون، ایتان مولیک نیز به اشتراک گذاشته شده است مشاهدات او از GPT-4 پس از مقایسه توالی ها با مفسر کدی که در ماه ژوئیه اجرا کرد با جستارهای جدیدتر از سه شنبه. او به این نتیجه رسید که GPT-4 هنوز آگاه است، اما اشاره کرد که به او توضیح می‌دهد که چگونه کد خود را به جای اینکه کد را درست کند درست کند. در اصل، او باید کاری را که از GPT-4 می‌خواست انجام دهد. اگرچه مولیک قصد انتقاد از این زبان را نداشته است، مشاهدات او با آنچه دیگران به عنوان “گفتگوی پشت سر هم” از GPT-4 توصیف کرده اند مطابقت دارد.

ChatGPT شناخته شده است که برای اطلاعاتی که نمی داند پاسخ های توهم می دهد، اما به نظر می رسد این خطاها بسیار فراتر از گام های اشتباه رایج ربات چت هوش مصنوعی است. GPT-4 در ماه مارس معرفی شد، اما در اوایل ماه ژوئیه، گزارش هایی مبنی بر “گنگ تر شدن” مدل زبان شروع شد. مطالعه انجام شده با همکاری دانشگاه استنفورد و دانشگاه کالیفرنیا، برکلی مشاهده کردند که دقت GPT-4 تنها بین مارس و ژوئن از ۹۷٫۶٪ به ۲٫۴٪ کاهش یافته است. توضیح داد که نسخه پولی ChatGPT قادر به ارائه پاسخ صحیح به یک معادله ریاضی با توضیح دقیق نیست، در حالی که نسخه بدون پرداخت که هنوز یک مدل قدیمی GPT 3.5 را اجرا می کند، پاسخ صحیح و توضیح مفصلی از روند ریاضی ارائه می دهد.

در آن زمان، پیتر ولیندر، معاون تولید OpenAI، پیشنهادی که کاربران سنگین ممکن است یک پدیده روانشناختی را تجربه کنند که در آن کیفیت پاسخ‌ها ممکن است به مرور زمان کاهش یابد، زمانی که مدل زبان واقعاً کارآمدتر می‌شود.

بحث در مورد اینکه آیا GPT-4 اخیراً “تنبل” شده است وجود دارد. آزمایش حکایتی من نشان می دهد که ممکن است درست باشد.

دنباله ای از تحلیل های قدیمی را که با Code Interpreter انجام دادم تکرار کردم. GPT-4 هنوز می داند که چه کاری باید انجام دهد، اما به من می گوید که کار را انجام دهم. یک مرحله اکنون زیاد است و برخی از آنها عجیب و غریب هستند. pic.twitter.com/OhGAMtd3Zq

— اتان مولیک (@emollick) 28 نوامبر ۲۰۲۳

به گفته Mollick، مشکلات فعلی ممکن است به طور مشابه موقتی و به دلیل بارگذاری بیش از حد سیستم یا تغییر در سبک سریع که برای کاربران آشکار نشده است، باشد. قابل ذکر است که OpenAI اضافه بار سیستم را دلیلی برای خاموش شدن ثبت نام ChatGPT Plus پس از افزایش علاقه به این سرویس پس از افتتاحیه کنفرانس توسعه دهندگان DevDay معرفی کرد که تعداد زیادی عملکرد جدید برای نسخه پولی چت ربات هوش مصنوعی معرفی کرد. هنوز یک لیست انتظار برای ChatGPT Plus وجود دارد. پروفسور همچنین اضافه کرد که ChatGPT در تلفن همراه از سبک اعلان متفاوتی استفاده می کند که منجر به “پاسخ های کوتاه تر و دقیق تر” می شود.

یاسین در X به تفصیل آن غیرقابل اعتماد بودن آخرین مدل GPT-4 به دلیل کاهش پایبندی دستورالعمل ها باعث شده است که آنها به کدگذاری سنتی برگردند و اضافه کردند که آنها قصد دارند یک کد LLM محلی ایجاد کنند تا کنترل پارامترهای مدل را دوباره به دست آورند. سایر کاربران به انتخاب گزینه های منبع باز در میان کاهش مدل زبان اشاره کرده اند.

به طور مشابه، کاربر Reddit، Mindless-Ad8595 توضیح داد که به‌روزرسانی‌های جدیدتر GPT-4 آن را به نفع خود بیش از حد هوشمند کرده است. او گفت: «این با یک «مسیر» از پیش تعریف‌شده که رفتار آن را هدایت می‌کند، ارائه نمی‌شود، و آن را به‌طور باورنکردنی همه‌کاره می‌سازد، اما به طور پیش‌فرض تا حدودی بدون جهت می‌شود.

برنامه نویس به کاربران توصیه می کند که GPT های سفارشی ایجاد کنند که بر اساس کار یا برنامه تخصصی هستند تا کارایی خروجی مدل را افزایش دهند. او هیچ راه حل عملی برای کاربران باقی مانده در اکوسیستم OpenAI ارائه نمی دهد.

توسعه دهنده اپلیکیشن نیک دوبوس تجربه خود را به اشتراک گذاشت با اشتباهات GPT-4، اشاره کرد که زمانی که او ChatGPT را به این کار وادار کرد پونگ را در SwiftUI بنویسید، او متغیرهای مختلفی را در کد کشف کرد. او اضافه کرد که چت بات دستورات را نادیده می‌گیرد و به درج این مکان‌ها و کارهای انجام شده در کد ادامه می‌دهد، حتی اگر دستور دیگری انجام دهد. چندین کاربر X تجربه‌های مشابهی از این نوع را با نمونه‌های خود از کدهایی که دارای مکان‌ها و کارهای انجام شده است تأیید کردند. پست Dobos توجه یکی از کارمندان OpenAI را به خود جلب کرد و گفت که نمونه‌هایی را برای رفع مشکل به تیم توسعه شرکت ارسال می‌کنند و قول می‌دهند هر گونه به‌روزرسانی را در این مدت به اشتراک بگذارند.

به طور کلی، توضیح روشنی در مورد اینکه چرا GPT-4 در حال حاضر با عوارض مواجه است، وجود ندارد. کاربرانی که در مورد تجربیات خود به صورت آنلاین بحث می کنند، ایده های زیادی را پیشنهاد کرده اند. اینها از مدل‌های ادغام OpenAI گرفته تا اضافه بار سرور مداوم از اجرای GPT-4 و GPT-4 Turbo تا تلاش شرکت برای صرفه‌جویی در هزینه با محدود کردن نتایج و غیره را شامل می‌شود.

به خوبی شناخته شده است که OpenAI عملیات بسیار گرانی را اجرا می کند. در آوریل ۲۰۲۳، محققان نشان دادند که طول کشید ۷۰۰۰۰۰ دلار در روز، یا ۳۶ سنت در هر پرس و جو، برای فعال نگه داشتن ChatGPT. تحلیلگران صنعت در آن زمان توضیح دادند که OpenAI باید ناوگان GPU خود را ۳۰۰۰۰ واحد افزایش دهد تا عملکرد تجاری خود را برای باقی مانده سال حفظ کند. این امر مستلزم پشتیبانی از فرآیندهای ChatGPT، علاوه بر محاسبات برای همه شرکای آن است.

در حالی که منتظر تثبیت عملکرد GPT-4 بودند، کاربران چندین کنایه رد و بدل کردند و وضعیت X را روشن کردند.

“نکته بعدی که می‌دانی این است که بیمار است،” ساوتری گفت.

“پاسخ های زیادی با “و تو بقیه را انجام می دهی.” نه، بقیه را انجام دهید آقای گارنت گفت.

نادیده گرفتن تعداد پاسخ ها و پست های مربوط به این مشکل قطعا سخت است. باید منتظر بمانیم و ببینیم که آیا OpenAI می‌تواند در به‌روزرسانی آینده این مشکل را به طور مستقیم حل کند.

توصیه های سردبیران







روهیت کریشنان در X به تفصیل چندین از اشتباهاتی که او در هنگام استفاده از GPT-4 تجربه کرد، که مدل زبان پشت ChatGPT Plus، نسخه پولی ChatGPT است. او توضیح داد که ربات چت چندین سؤال او را رد کرده یا نسخه‌های کوتاه‌شده درخواست‌هایش را در زمانی که قبلاً می‌توانست پاسخ‌های دقیق دریافت کند به او داده است. او همچنین خاطرنشان کرد که مدل زبان از ابزارهایی غیر از آنچه که برای استفاده از آن دستور داده شده است، استفاده خواهد کرد، مانند Dall-E هنگامی که یک درخواست مفسر کد می‌خواهد. کریشنان همچنین به طعنه اضافه کرد که “تجزیه و تحلیل خطا” روش مدل زبانی برای گفتن “AFK” است. [away from keyboard]یکی دو ساعت دیگر برگرد.»


منبع: https://www.digitaltrends.com/computing/heres-why-people-are-saying-gpt-4-is-getting-lazy/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *