اگر یکی از مدلهای هوش مصنوعی برای دروغگفتن و فریبدادن آموزش دیده باشد، آیا میتوانیم مشکل دروغگوبودن آن را برطرف کنیم؟ آیا حتی متوجه دروغهایش میشویم؟ تحقیقاتی که شرکت Anthropic انجام داد، نشان میدهند که پاسخ هر دو پرسش منفی است. محققان از نسخهای از کلاد (دستیار هوش مصنوعی مولد آنتروپیک) استفاده کردند که برای…Read More