اعترافات یک مبلغ دیپ جعلی هوش مصنوعی: استفاده از Eleven Labs برای شبیه سازی صدای جیل بایدن

VentureBeat ارائه می دهد: AI Unleashed – یک رویداد اجرایی انحصاری برای رهبران داده های سازمانی. شبکه و یادگیری با همتایان صنعت. بیشتر بدانید


اخیرا ویدیوی دیپ فیک از جیل بایدن بانوی اول ایالات متحدهجایی که او به سیاست‌های سیاسی بایدن، رئیس‌جمهور همسرش حمله می‌کند، هم پتانسیل گفتار قدرتمند و هم چالش‌های نوظهور فناوری‌های پیشرفته رسانه مصنوعی را برجسته می‌کند – به‌ویژه در پرتو انتخابات عمومی در حال انتظار و شکاف‌انگیز ۲۰۲۴ ایالات متحده.

این ویدئو که توسط فیلمساز و تهیه کننده کنت لورت ساخته شده است، جیل بایدن را در حال ایراد سخنرانی در انتقاد از سیاست رئیس جمهور بایدن در رابطه با درگیری اسرائیل-فلسطین و حماس به تصویر می کشد. لورت با استفاده از تکنیک‌های یادگیری ماشینی توانست صدایی واقعی برای جیل بایدن ایجاد کند که در آن سخنانی درباره حمله به رئیس‌جمهور به دلیل حمایت از حملات هوایی در غزه بیان می‌کرد.

ویدیو بود ارسال شده به X (قبلاً Twمن) جایی که در زمان انتشار این مقاله ۲۳۰۰۰۰ بازدید داشته است، Reddit’s r/Singularity subreddit جایی که بیش از ۱۵۰۰ رأی موافق یا تأیید جامعه دریافت کرد.

“هدف از استفاده از هوش مصنوعی جیل بایدن، خلق چیزی پوچ و سینمایی به اندازه کافی بود که مردم را وادار کند تا در واقع با واقعیت آنچه در فلسطین اتفاق می افتد درگیر شوند. درام یک بانوی اول تندرو که شوهرش را صدا می کند و در مقابل آن می ایستد. لورت در مصاحبه ای اختصاصی با VentureBeat گفت: امپراتوری آمریکا – خیلی آبدار است که نمی توان به آن نگاه کرد.

رویداد

هوش مصنوعی آزاد شد

یک شب انحصاری فقط دعوت از بینش و شبکه، که برای مدیران ارشد سازمانی که بر پشته‌های داده و استراتژی‌ها نظارت دارند، طراحی شده است.

بیشتر بدانید

برای ایجاد این صدای مصنوعی، لورت از ElevenLabs، یک استارتاپ متمرکز بر هوش مصنوعی صدا و صوتی استفاده کرد که دارای مدل های آن را آموزش داد در مقادیر زیادی از گفتار طبیعی برای شبیه سازی صداها. با نمونه‌برداری از صدای معتبر جیل بایدن از مصاحبه‌ها و ظاهر، هوش مصنوعی توانست گفتار کاملاً جدیدی را در الگوی و آهنگ صدای او ایجاد کند.

فراتر از آهنگ صوتی مصنوعی، لورت کلیپ‌های مدیریت شده از فیلم‌های مبارزات انتخاباتی بایدن، گزارش‌های خبری در مورد فلسطین و ویدئوهای رسانه‌های اجتماعی از درد و رنج در غزه را با هم ترکیب کرد. با ویرایش انتخابی و قرار دادن گفتار تولید شده توسط هوش مصنوعی بر روی این بخش‌های ویدیویی واقعی، لورت توانست روایتی سطحی قابل قبول ایجاد کند.

هوش مصنوعی عصر جدیدی از تبلیغات، کنش‌گری و تبلیغات را پیش می‌برد

استفاده از هوش مصنوعی و فناوری دیپ فیک در تبلیغات سیاسی به طور فزاینده ای رواج یافته است. در اوایل سال جاری، RNC آگهی منتشر کرد تصویرسازی مولد از پیروزی احتمالی آینده بایدن در سال ۲۰۲۴٫

چند ماه بعد، Never Back Down PAC خود را راه اندازی کرد خرید آگهی میلیون دلاری نسخه ای از ترامپ که توسط هوش مصنوعی تولید شده است در انتقاد از فرماندار رینولدز آیووا به نمایش گذاشته می شود. این آگهی مستقیماً نشان می‌دهد که چگونه می‌توان از رسانه‌های مصنوعی برای تبلیغ یا حمله به نامزدها استفاده کرد. سپس در سپتامبر ۲۰۲۳، طنزپرداز C3PMeme ویدیوی جعلی منتشر کرد ران دیسانتیس در حال انصراف خود از رقابت های انتخابات ریاست جمهوری ۲۰۲۴ را به تصویر می کشد.

اگرچه به عنوان طنز در نظر گرفته شده بود، اما نشان داد که دیپ‌فیک‌ها چقدر آسان و قانع‌کننده شده‌اند – و پتانسیل برای بیان سیاسی مشروع و همچنین اطلاعات غلط عمدی از طریق رسانه‌های دستکاری شده با استفاده از فناوری‌های نوظهور.

این نمونه‌ها به‌عنوان آزمایش‌های اولیه تبلیغات کمپین مصنوعی که برخی از کارشناسان نگران بودند که می‌تواند جریان‌های اطلاعاتی گمراه‌کننده را در انتخابات آتی افزایش دهد و تشدید کند، عمل کرد.

قابل ذکر است که لورت این ترکیب را با ابزارهای هوش مصنوعی در دسترس و نسبتاً ارزان انجام داد و تنها به یک هفته کار با استفاده از مهارت های تدوین و فیلمسازی نیاز داشت.

در حالی که او قصد داشت «خرده‌های نان» را که نشان‌دهنده داستان‌های تخیلی برای بیننده باهوش است بگذارد، می‌تواند بینندگان معمولی را فریب دهد.

تلاش و خلاقیت انسانی همچنان کلیدی است

از طرف دیگر، لورت معتقد است که اکثر ابزارهای هوش مصنوعی هنوز کیفیت محدودی را ارائه می‌دهند و مهارت‌های فیلم‌سازی انسانی برای جمع‌آوری چیزی متقاعدکننده ضروری است.

لورت توضیح داد: “بیشتر هر چیز هوش مصنوعی خسته کننده و بی فایده است، زیرا به عنوان یک کد تقلب ارزان برای خلاقیت، استعداد، تجربه و اشتیاق انسانی استفاده می شود.”

وی با تاکید بر نقش محوری پس از تولید و تجربه فیلمسازی گفت: اگر فیلمنامه، پست پروداکشن، تضاد واقعی را برمی داشتم و فقط صدا را می گذاشتم که حرف های تصادفی بزند، پروژه هیچ می شد.

همانطور که لورت تاکید کرد: “ویدئوی جیل بایدن برای من یک هفته طول کشید. مطالب دیگر برای من یک ماه زمان برد. می توانم به برخی هوش مصنوعی بگویم که به سرعت چیزها را تولید کند، اما این فیلم سازی خلاقانه است که در واقع باعث می شود آن را باورپذیر کنیم.”

به انگیزه اختلال

به گفته لورت، او می‌خواست «دنیای کمی بهتر» را نشان دهد و از طریق داستان‌گویی تحریک‌آمیز و از لحاظ احساسی، توجه گسترده‌ای را به درد و رنج واقعی انسان در فلسطین جلب کند.

به طور خاص، قصد لورت این بود که سناریوی دیگری را به تصویر بکشد که در آن «قهرمان قدرتمندی» مانند جیل بایدن علناً سیاست‌های همسرش و خشونت‌های جاری را محکوم کند. او امیدوار بود که این سناریوی پوچ، همراه با فیلم‌های واقعی از ویرانی در غزه، بینندگان را مجبور کند تا با واقعیت‌های خشن روی زمین دست و پنجه نرم کنند، به گونه‌ای که گزارش‌های معمولی نتوانسته بودند انجام دهند.

برای دستیابی به تعامل گسترده، لورت عمداً یک فرضیه را انتخاب کرد – یک سخنرانی مخالف بانوی اول – که او آن را بسیار تکان دهنده و بحث برانگیز درک کرد که نمی توان نادیده گرفت. استفاده از تکنیک های مدرن رسانه مصنوعی به او این امکان را داد که این مفهوم تحریک آمیز را به شیوه ای سطحی قابل قبول به فعلیت برساند.

پروژه لورت نشان می‌دهد که رسانه‌های ترکیبی نویدبخش گفتمان بدیع هستند، اما چالش‌هایی را در رابطه با حقیقت، اعتماد و مسئولیت‌پذیری که جوامع باید از آن عبور کنند، معرفی می‌کنند. با توجه به نگرانی‌ها در مورد اطلاعات غلط عمدی، لورت هم مزایا و هم محدودیت‌ها را تأیید کرد و گفت: «من هر نگرانی و دفاع از آن را همزمان دارم».

او گفت که “بارها به ما در جنگ ها دروغ گفته اند … این بسیار خطرناک تر از هر کاری است که من می توانم انجام دهم.” لورت به جای نسبت دادن این مشکل صرفا به کیفیت اطلاعات، تاکید کرد: “مشکل واقعی اطلاعات خوب یا بد نیست، قدرت است، چه کسی آن را دارد و چگونه از آن استفاده می کند.”

لورت نقش خود را بیشتر با رسانه های طنز مانند The Onion همسو می دید تا کمپین های اطلاعات نادرست. در نهایت، او چالش هایی را که محتوای تولیدی به همراه خواهد داشت اذعان کرد و گفت: “من فکر می کنم که مفهوم واقعیت مشترک تقریباً مرده است… من مطمئن هستم که بازیگران بد زیادی وجود دارند.”

تخفیف بدون سانسور

قانون‌گذاران و حامیان استراتژی‌های مختلفی را برای مهار تهدیدات دیپ‌فیک دنبال کرده‌اند، اگرچه چالش‌ها همچنان وجود دارد. در ماه اوت، FEC قدم برداشت به سمت نظارت با باز کردن نظر عمومی در مورد جعل هویت هوش مصنوعی در تبلیغات سیاسی. با این حال، کمیسر جمهوری خواه دیکرسون در مورد اختیارات FEC ابراز تردید کرد همانطور که قانون بلومبرگ گزارش دادو حزب گرایی ممکن است متوقف شود قانون پیشنهادی جامع

شرکت‌ها نیز با انتخاب‌های پیچیده درباره خط‌مشی‌های محتوا مواجه هستند که می‌تواند گفتار محافظت شده را محدود کند. ممنوعیت‌های صریح بیش از حد خطر را فرا می‌گیرد و اجرای آن چالش برانگیز است، در حالی که انفعال نیروی کار را آسیب‌پذیر می‌کند. تعدیل هدفمندی که آموزش و مسئولیت را متعادل می کند، مسیری مناسب به پیش می دهد.

به جای محدودیت‌های ارتجاعی، شرکت‌ها می‌توانند آموزش سواد رسانه‌ای را با برجسته کردن علائم دستکاری فنی ترویج کنند. همراه کردن آگاهی از تکنیک های در حال تکامل با شک و تردید نسبت به ادعاهای خارق العاده، تجزیه و تحلیل دقیق ترکیبات نوظهور بدون مطلق را تقویت می کند.

هشدار نسبت به تکیه بر واکنش‌های اولیه به تنهایی و ارجاع به بررسی‌کننده‌های حقایق هنگام ارزیابی ادعاهای مورد مناقشه، عادات شهروندی انعطاف‌پذیر را القا می‌کند که کمتر مستعد تحریک هستند. چنین آموزشی بر تجزیه و تحلیل بر سانسور برای دستیابی به انعطاف پذیری قانونی تأکید می کند.

مشارکت آگاهانه، نه مواضع محدودکننده پیشگیرانه، باید در اولویت این عصر پیچیده باقی بماند. بسیاری از نمونه‌های محتوای ترکیبی هنوز دیدگاه‌های جایگزین را از طریق تقلید به جای فریب آشکاری که خواستار فرصت‌ها و مسئولیت‌های مدیریتی در تکامل تکنولوژیکی میانه‌رو و نه ارتجاعی هستند، هدایت می‌کنند.

همانطور که مورد لورت نشان می دهد، مقررات ایالتی و نقش FEC بدون نظارت بر گروه های کمتر تنظیم شده مانند PAC نامشخص باقی می ماند. همکاری چندجانبه هماهنگ در حال حاضر مسیر بهینه را برای کاهش تهدیدهای نوظهور به طور سیستماتیک بدون دستیابی به قلمروهای حفاظت شده بیان سیاسی فراهم می کند.

چه کسی تاکتیک‌های لورت را مناسب بداند یا نه، توضیحات او بینش‌هایی را در مورد دیدگاه او در استفاده از چند رسانه‌ای مصنوعی برای هدایت گفتمان سیاسی تأثیرگذار به روش‌های بدیع ارائه می‌کند. این به عنوان یک مطالعه موردی در مورد دوراهی های وعده و اخلاقی ناشی از فناوری های مولد پیشرفته عمل می کند.

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.


منبع: https://venturebeat.com/ai/confessions-of-an-ai-deepfake-propagandist-using-elevenlabs-to-clone-jill-bidens-voice/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *