بزرگترین شرکتهای هوش مصنوعی علاقهای به پرداخت هزینه برای استفاده از مطالب دارای حق چاپ به عنوان دادههای آموزشی ندارند، و دلایل آنها در اینجا آمده است.
اداره کپی رایت ایالات متحده است گرفتن نظر عمومی در قوانین جدید بالقوه در مورد مولد استفاده هوش مصنوعی از مطالب دارای حق چاپو بزرگترین شرکت های هوش مصنوعی در جهان حرف های زیادی برای گفتن داشتند. ما استدلال ها را از متا، گوگل، مایکروسافت، Adobe، صورت در آغوش گرفته، StabilityAIو آنتروپیک در زیر، و همچنین پاسخ از سیب که روی کپی رایت کدهای نوشته شده با هوش مصنوعی متمرکز بود.
تفاوتهایی در رویکردهای آنها وجود دارد، اما پیام کلی برای اکثر آنها یکسان است: آنها فکر نمیکنند باید برای آموزش مدلهای هوش مصنوعی در مورد کارهای دارای حق چاپ، هزینه پرداخت کنند.
دفتر کپی رایت باز کردن دوره نظرات در ۳۰ آگوست، با تاریخ ۱۸ اکتبر برای نظرات کتبی در مورد تغییرات، در مورد استفاده از دادههای دارای حق نسخهبرداری برای آموزش مدل هوش مصنوعی، اینکه آیا مطالب تولید شده توسط هوش مصنوعی میتوان بدون دخالت انسان دارای حق نسخهبرداری باشد و مسئولیت حق نسخهبرداری هوش مصنوعی در نظر گرفت. در سال گذشته هیچ کمبودی در دعاوی حق چاپ وجود نداشته است، با هنرمندان، نویسندگان، توسعه دهندگانو شرکت ها به طور یکسان با ادعای نقض در موارد مختلف.
در اینجا چند قطعه از پاسخ هر شرکت آورده شده است.
تحمیل اولین رژیم مجوز در نوع خود در حال حاضر، پس از این واقعیت، باعث هرج و مرج خواهد شد زیرا توسعه دهندگان به دنبال شناسایی میلیون ها و میلیون ها دارنده حقوق هستند، با توجه به اینکه هر حق امتیاز عادلانه ای در نور بسیار ناچیز خواهد بود. از بی اهمیت بودن هر یک از کارها در میان مجموعه آموزشی Al.
اگر آموزش بدون ایجاد نسخه قابل انجام باشد، در اینجا هیچ مشکل کپی رایت وجود نخواهد داشت. در واقع آن عمل “برداشت دانش”. استفاده از استعاره دادگاه از هارپر و رو، مانند عمل خواندن یک کتاب «و یادگیری حقایق و ایده های موجود در آن، نه تنها نقض نمی شود، بلکه به هدف قانون کپی رایت نیز کمک می کند. صرف این واقعیت که به عنوان یک موضوع تکنولوژیک، برای استخراج آن ایده ها و حقایق از آثار دارای حق چاپ باید کپی تهیه شود، نباید این نتیجه را تغییر دهد.
هرگونه الزام برای کسب رضایت برای آثار در دسترس برای استفاده برای آموزش، نوآوری آل را سرد می کند. دستیابی به مقیاس داده های لازم برای توسعه مدل های Al مسئول حتی زمانی که هویت یک اثر و صاحب آن شناخته شده باشد امکان پذیر نیست. چنین طرحهای صدور مجوز همچنین مانع از نوآوری استارتآپها و شرکتهایی میشود که منابع لازم برای دریافت مجوز را ندارند، و توسعه Al را به مجموعه کوچکی از شرکتها با منابع برای اجرای برنامههای مجوز در مقیاس بزرگ یا توسعهدهندگان در کشورهایی واگذار میکند که دارای مجوز هستند. تصمیم گرفت که استفاده از آثار دارای حق چاپ برای آموزش مدل های Al تخلف نیست.
سیاست صحیح همیشه نیاز به محدودیتهای مناسب برای کپی رایت را به منظور حمایت از خلاقیت، نوآوری و سایر ارزشها تشخیص داده است، و ما معتقدیم که قوانین موجود و همکاری مستمر بین همه ذینفعان میتواند منافع متنوع در خطر را هماهنگ کند و ضمن رفع نگرانی، منافع هوش مصنوعی را باز کند. .
در Sega v. Accolade، Ninth Circuit اعلام کرد که کپی برداری متوسط از نرم افزار سگا استفاده منصفانه است. متهم هنگام مهندسی معکوس برای کشف الزامات عملکردی – اطلاعات محافظت نشده – برای سازگار کردن بازیها با کنسول بازی سگا، کپیهایی تهیه کرد. چنین کپی برداری میانی نیز به نفع عموم بود: منجر به افزایش تعداد بازی های ویدئویی طراحی شده مستقل (که حاوی ترکیبی از جنبه های کاربردی و خلاقانه است) در دسترس کنسول سگا شد. این رشد در بیان خلاق دقیقاً همان چیزی بود که قانون حق چاپ در نظر داشت ترویج کند.
برای کلود، همانطور که در بالا مورد بحث قرار گرفت، فرآیند آموزش، کپی هایی از اطلاعات را به منظور انجام تجزیه و تحلیل آماری داده ها ایجاد می کند. کپی کردن صرفاً یک مرحله میانی است که عناصر غیر قابل محافظت را در مورد کل مجموعه آثار استخراج می کند تا خروجی های جدیدی ایجاد کند. به این ترتیب، استفاده از اثر اصلی دارای حق چاپ غیر قابل بیان است. یعنی از عبارت دارای حق نسخه برداری برای انتقال آن به کاربران استفاده مجدد نمی کند.
در طول یک دهه گذشته یا بیشتر، سرمایهگذاری هنگفتی – میلیاردها و میلیاردها دلار – در توسعه فناوریهای هوش مصنوعی صورت گرفته است، بر اساس این درک که بر اساس قانون کپیرایت فعلی، هرگونه کپی برداری لازم برای استخراج حقایق آماری مجاز است. تغییر در این رژیم به طور قابل توجهی انتظارات حل شده در این زمینه را مختل خواهد کرد. این انتظارات عامل مهمی در سرمایه گذاری عظیم سرمایه خصوصی در شرکت های هوش مصنوعی مستقر در ایالات متحده بوده است که به نوبه خود، ایالات متحده را به یک رهبر جهانی در هوش مصنوعی تبدیل کرده است. تضعیف این انتظارات سرمایه گذاری آتی را همراه با رقابت اقتصادی و امنیت ملی ایالات متحده به خطر می اندازد.
استفاده از یک کار معین در آموزش یک هدف کلی سودمند است: ایجاد یک مدل آل متمایز و سازنده. این مدل به جای جایگزینی بیان ارتباطی خاص اثر اولیه، میتواند طیف گستردهای از انواع مختلف خروجیها را ایجاد کند که کاملاً به آن عبارت زیربنایی و دارای حق نسخهبرداری غیر مرتبط هستند. به این دلایل و دلایل دیگر، مدلهای Al مولد معمولاً زمانی که روی تعداد زیادی از آثار دارای حق چاپ آموزش میدهند، منصفانه استفاده میشوند. با این حال، ما از “به طور کلی” عمدا استفاده می کنیم، زیرا می توان الگوهایی از حقایق را تصور کرد که تماس های سخت تری را ایجاد می کند.
طیف وسیعی از حوزههای قضایی از جمله سنگاپور، ژاپن، اتحادیه اروپا، جمهوری کره، تایوان، مالزی و اسرائیل قوانین کپی رایت خود را اصلاح کردهاند تا بنادر امنی برای آموزش آل ایجاد کنند که اثرات مشابهی در استفاده منصفانه داشته باشد. در بریتانیا، مشاور ارشد علمی دولت توصیه کرده است که «اگر هدف دولت ارتقای صنعت آلی نوآورانه در بریتانیا است، باید امکان استخراج دادهها، متن و تصاویر موجود (ورودی) و استفاده از آن را فراهم کند. [sic] حمایت های موجود از قانون کپی رایت و IP در مورد خروجی هوش مصنوعی.
در شرایطی که یک توسعهدهنده انسانی عناصر بیانی خروجی و تصمیمهای اصلاح، افزودن، بهبود یا حتی رد کد پیشنهادی را کنترل میکند، کد نهایی که از تعامل توسعهدهنده با ابزارها حاصل میشود، دارای نویسندگی انسانی کافی برای کپیرایت خواهد بود.
منبع: https://www.theverge.com/2023/11/4/23946353/generative-ai-copyright-training-data-openai-microsoft-google-meta-stabilityai