OpenAI و بزرگترین پشتیبان آن، مایکروسافت، با چندین پرونده قضایی مواجه هستند که آنها را متهم به استفاده از آثار دارای حق چاپ دیگران بدون مجوز برای آموزش مدل های زبان بزرگ (LLM) می کند. و بر اساس آنچه OpenAI به کمیته ارتباطات و انتخاب دیجیتال مجلس اعیان گفت، ممکن است در آینده شاهد شکایت های بیشتری علیه این شرکت ها باشیم. خواهد بود "آموزش مدل های پیشرو هوش مصنوعی امروزی بدون استفاده از مواد دارای حق چاپ غیرممکن است." OpenAI در خود نوشت شواهد مکتوب (PDF) ارسال برای تحقیق کمیته در مورد LLM ها، همانطور که برای اولین بار توسط سازمان گزارش شد روزنامه گاردین.
این شرکت توضیح داد که امروز به دلیل کپی رایت است "تقریباً هر نوع بیان انسانی را پوشش می دهد – از جمله پست های وبلاگ، عکس ها، پست های انجمن، تکه های کد نرم افزار و اسناد دولتی." اضافه کرد که "[l]تقلید از دادههای آموزشی به کتابها و نقاشیهای مالکیت عمومی که بیش از یک قرن پیش ایجاد شدهاند ممکن است آزمایش جالبی به همراه داشته باشد، اما سیستمهای هوش مصنوعی را که نیازهای شهروندان امروزی را برآورده میکند، ارائه نمیکند." OpenAI همچنین اصرار داشت که هنگام آموزش مدل های خود، قوانین کپی رایت را رعایت می کند. در یک مطلب جدید در وبلاگ خود ساخته شده در پاسخ به شکایت نیویورک تایمزاین سازمان گفت که استفاده از مواد اینترنتی در دسترس عموم برای آموزش هوش مصنوعی تحت دکترین استفاده منصفانه قرار می گیرد.
با این حال اعتراف کرد که وجود دارد "هنوز برای حمایت و توانمندسازی سازندگان کار باید انجام شود." این شرکت در مورد روش هایی صحبت کرد که به ناشران اجازه می دهد تا خزنده وب GPTBot را از دسترسی به وب سایت های خود مسدود کنند. همچنین گفت که در حال توسعه مکانیسمهای اضافی است که به دارندگان حقوق اجازه میدهد از آموزش انصراف دهند و در حال تعامل با آنها برای یافتن توافقهای سودمند متقابل است.
در برخی از شکایت های مطرح شده علیه OpenAI و مایکروسافت، شاکیان شرکت ها را متهم کنید امتناع از پرداخت پول به نویسندگان برای کارشان در حالی که یک صنعت میلیارد دلاری ایجاد می کند و از سود مالی هنگفتی از مطالب دارای حق چاپ برخوردار است. مورد اخیر توسط چند نویسنده غیرداستانی ثبت شده است استدلال کرد که شرکتها میتوانستند گزینههای تامین مالی جایگزین، مانند مشارکت در سود را بررسی کنند، اما این کار را نکردهاند "تصمیم به سرقت گرفت" بجای.
OpenAI به آن دعاوی خاص رسیدگی نکرد، اما پاسخی مستقیم به آنها ارائه کرد مجله نیویورک تایمز شکایتی که آن را متهم به استفاده از مقالات خبری منتشر شده خود بدون اجازه می کند. گفت که این نشریه داستان کامل را بیان نمی کند. قبلا در حال مذاکره با زمان در مورد الف "مشارکت با ارزش بالا" که به آن امکان دسترسی به گزارش های نشریه را می دهد. ظاهراً دو طرف تا ۱۹ دسامبر هنوز در تماس بودند و OpenAI فقط در دسامبر با مطالعه در مورد آن در مورد این دعوا در دسامبر متوجه شد. زمان.
در شکایتی که این روزنامه ارسال کرده است، به مواردی از ارائه ChatGPT به کاربران اشاره کرده است "گزیده های تقریباً کلمه به کلمه" از مقالات paywalled OpenAI انتشار را به دستکاری عمدی درخواستها متهم کرد، مانند گنجاندن گزیدههای طولانی از مقالات در تعامل خود با ربات چت برای وادار کردن آن به بازگرداندن محتوا. متهم هم هست زمان نمونه هایی از چیدن گیلاس از بسیاری از تلاش ها. OpenAI گفت که شکایتی که توسط زمان هیچ شایستگی ندارد، اما همچنان برای a "مشارکت سازنده" با انتشار.
این مقاله در ابتدا در Engadget در https://www.engadget.com/openai-admits-its-impossible-to-train-generative-ai-without-copyrighted-materials-103311496.html?src=rss ظاهر شد.
منبع: https://www.engadget.com/openai-admits-its-impossible-to-train-generative-ai-without-copyrighted-materials-103311496.html?src=rss