تا به حال با گیج کردن گرفتار شده اید هوش مصنوعی مقررات؟
در سال گذشته، محصولات و خدمات بیشماری با هوش مصنوعی در دسترس قرار گرفتهاند و ویژگیهای متنوعی را ارائه میدهند که اغلب در اصطلاحات غیرقابل تشخیص پیچیده شدهاند.
با استفاده از این واژه نامه مفید، اکنون تفاوت بین هوش مصنوعی و AGI را می دانید، واقعاً چه اتفاقی می افتد ChatGPT “توهم می کند” و وقتی می شنوید که GPT-4 به عنوان توصیف شده است، معنی آن چیست یک LLM با یک مدل ترانسفورماتور ساخته شده با استفاده از شبکه های عصبی عمیق. بیایید شیرجه بزنیم
عامل
یک عامل، در زمینه هوش مصنوعی، یک است مدل یا برنامه نرم افزاری که می تواند به طور مستقل نوعی کار را انجام دهد. نمونه هایی از عوامل از خانه هوشمند دستگاههایی که دما و روشنایی را کنترل میکنند تا سنسورهای داخل جاروبرقی ربات و ماشین های بدون راننده، به ربات های چت مانند ChatGPT که یاد می گیرند و به درخواست های کاربر پاسخ می دهند. عوامل مستقلی که وظایف پیچیده ای را انجام می دهند، اغلب به عنوان نمونه هایی از این که جهش بعدی در هوش مصنوعی چگونه به نظر می رسد ذکر می شود.
AGI (هوش عمومی مصنوعی)
AGI نوعی برنامه یا مدل که تمام توانایی های فکری یک انسان یعنی هوش عمومی را دارد. AGI توانایی هایی مانند استدلال، عقل سلیم، دانش انتزاعی و خلاقیت دارد. اساساً قادر است وظایف را به طور مستقل و بدون دستور انسان انجام دهد. AGI واقعی هنوز وجود ندارد، اما کارشناسان بر این باورند که میتوان در آینده نزدیک به آن دست یافت (اگرچه نظرات دقیقاً در چه زمانی متفاوت است). شرکت ها دوست دارند OpenAIDeepMind و Anthropic متعهد به تلاش برای ایجاد AGI هستند.
همچنین ببینید: هوش مصنوعی قوی
الگوریتم
یک الگوریتم مجموعه ای از قوانین یا دستورالعمل هایی است که یک برنامه کامپیوتری باید از آنها پیروی کند. در زمینه هوش مصنوعی، الگوریتم ها مبنایی برای ایجاد هوش آن هستند. به عملی در مغز انسان فکر کنید که به چند مرحله تقسیم می شود. الگوریتمها با ساختن مجموعهای از دستورات if-then آن فرآیند را تقلید میکنند.
هم ترازی
هم ترازی به این اشاره دارد که هوش مصنوعی چگونه با موفقیت می تواند به اهدافی دست یابد که به صراحت در الف گنجانده نشده اند سریع یا درخواست این موارد می تواند شامل دقت، امنیت و پیشگیری از آسیب باشد. اگر یک هوش مصنوعی نادرست باشد، کاربردها و کاربردهای مورد نظر خود را منحرف میکند، یعنی پاسخهای اشتباه یا نامناسبی میدهد. همسویی بخش بزرگی از گفتگوی اخلاقی است، زیرا مدلی که همسویی مناسبی ندارد، پتانسیل انتشار اطلاعات نادرست، ایجاد تهدیدات امنیت سایبری و به اشتراک گذاری اطلاعات خطرناک یا مضر را دارد.
سم آلتمن پس از اخراج OpenAI “آسیب دیده و عصبانی” است. اما دلیل بازگشت او به هر حال اینجاست.
هوش مصنوعی
هوش مصنوعی اصطلاحی عمومی برای فناوری است که می تواند وظایف خاصی را که توسط انسان طراحی شده است را خودکار یا اجرا کند. اخیراً، وقتی مردم در مورد هوش مصنوعی صحبت میکنند (“هوش مصنوعی بشریت را نابود میکند” یا “هوش مصنوعی جایگزین مشاغل ما خواهد شد”) آنها در مورد AGI و هوش مصنوعی مولد صحبت میکنند. اما هوش مصنوعی مفهوم بزرگی است که شامل بسیاری از فناوریهایی است که ما سالها از آن استفاده میکنیم، مانند الگوریتمهایی که محتوا یا محصولات را توصیه میکنند، خودروهای خودران یا دستیارهای صوتی.
جعبه سیاه
برخی از مدلهای هوش مصنوعی گاهی اوقات به عنوان جعبه سیاه شناخته میشوند، به این معنی که کاربران قادر به دیدن یا درک عملکرد درونی فناوری نیستند. مشکل جعبه سیاه به ویژه در مکالمه هوش مصنوعی مولد مهم شده است، زیرا شرکت هایی مانند OpenAI و گوگل در مورد نحوه کارشان به طور مشهور مخفی هستند. اما همچنین، از آنجایی که هوش مصنوعی مولد تا حدودی مستقل است، حتی توسعه دهندگان نیز به طور کامل درک نمی کنند که الگوریتم چگونه خروجی ها را تولید می کند. از آنجایی که اخلاق مداران و سیاست گذاران خواستار پاسخگویی و شفافیت بیشتر شرکت های هوش مصنوعی هستند، این امر اهمیت باز کردن جعبه های سیاه را افزایش داده است.
چت بات
چت بات نوعی برنامه یا مدل است که میتواند با یک انسان مکالمه داشته باشد، مانند ChatGPT، اما این اصطلاح میتواند به چتباتهای خدمات مشتری نیز اشاره داشته باشد که جایگزینهایی برای مکالمه با نماینده خدمات مشتری از طریق تلفن یا پیام متنی ارائه میدهند. چت بات ها دوست دارند ChatGPT، Bard، Bingو Character.AI همگی به دلیل توانایی خود در برقراری مکالمات پیچیده شبیه انسان با کاربران مورد توجه قرار گرفته اند، اما چت بات ها مدتی است که وجود داشته اند. ELIZA اولین چت بات در نظر گرفته می شود. در سال ۱۹۶۶ توسعه یافت توسط جوزف وایزنباوم، دانشمند MIT.
یادگیری عمیق
یادگیری عمیق زیر مجموعه ای از فراگیری ماشین که روشی را که انسان ها یاد می گیرند تقلید می کند. با استفاده از شبکه های عصبی، یادگیری عمیق از چندین لایه الگوریتم برای درک مفاهیم پیچیده و انتزاعی مانند مکالمات و تصاویر استفاده می کند. کاربردهای یادگیری عمیق شامل فناوری تشخیص چهرهچت ربات هایی مانند ChatGPT و ماشین های بدون راننده.
مدل انتشار
مدل انتشار یک مدل یادگیری ماشینی است که می تواند پاسخی مشابه آنچه که در آن آموزش دیده است ایجاد کند. از نظر فنی، یک است آموزش زنجیره مارکوف با استفاده از استنتاج متغیر. زنجیره مارکوف و استنتاج متغیر اصطلاحات ریاضی هستند که برای پیشبینی توالیها و اطلاعات تقریبی در مقادیر زیاد داده استفاده میشوند. اما چیزی که باید بدانید این است که مدلهای انتشار چیزی هستند که تولید تصویر هوش مصنوعی را ممکن میسازند. انتشار پایدارOpenAI به او بدهیدو میانه سفر همه نمونه هایی از محصولاتی هستند که از مدل های انتشار استفاده می کنند.
هوش مصنوعی مولد
به لطف راه اندازی ChatGPT توسط OpenAI، هوش مصنوعی مولد وارد جریان اصلی شده است. هوش مصنوعی مولد نوعی از هوش مصنوعی است که می تواند متن، تصویر، ویدئو، صدا و کد را بر اساس درخواست های کاربر ایجاد کند. هوش مصنوعی مولد چیزی است که به چت ربات های هوش مصنوعی مانند ChatGPT قدرت می دهد.
در ابتدا با یادگیری الگوها از داده ها کار می کند (نگاه کنید به آموزش در زیر)، و همچنان که بر اساس داده های جدید از دستورات ساخته می شود، به یادگیری ادامه می دهد. هوش مصنوعی مولد معمولاً در قالب یک رابط چت وجود دارد ChatGPT، Bing و Bard، بنابراین می تواند یک گفتگوی رفت و برگشت با کاربر داشته باشد. راه اندازی ChatGPT چنین دیوانگی ایجاد کرد زیرا این یک راه آسان و در دسترس برای مردم برای درک و استفاده از قابلیتهای هوش مصنوعی مولد بود. علیرغم تمام مزایایی که دارد، استفاده گسترده از هوش مصنوعی مولد خطراتی دارد زیرا تمایل دارد توهم داشتنیا با اطمینان همه چیز را درست کنید.
برخلاف اشکال سادهتر هوش مصنوعی، هوش مصنوعی مولد قادر است محتوای کاملاً جدیدی را از دادههای آموزشی ایجاد کند، برخلاف حسگرهایی با اهداف محدود یا یک دستیار صوتی که اطلاعات از قبل موجود را طوطیسازی میکند.
اخلاق مداران و سیاستگذاران خواستار این هستند تنظیم هوش مصنوعی مولد به دلیل پتانسیل آن برای انتشار اطلاعات نادرست، ایجاد تعصبات، یا فعال کردن جرایم سایبری. مدلهای هوش مصنوعی مولد همچنین از مجموعه دادههای خراشیده شده از وب استفاده میکنند که نگرانیهایی را در مورد حریم خصوصی و نقض کپی رایت. توانایی آن در تولید سریع محتوا و خودکارسازی وظایف نیز نگرانی هایی را در مورد جایگزینی مشاغل به ویژه در رسانه ها و رسانه ها ایجاد کرده است. سرگرمی صنایع.
پردازنده گرافیکی
GPU یک تراشه یا کارت گرافیک قدرتمند است که قادر به پردازش چندین محاسبات پیچیده است. پردازندههای گرافیکی در ابتدا برای پردازش تصاویر و گرافیکها، همانطور که از نام آن پیداست، توسعه داده شدند، اما به دلیل توانایی آنها در مدیریت حجم عظیمی از قدرت محاسباتی مورد نیاز یادگیری ماشین، برای هوش مصنوعی اقتباس شدهاند. این است تخمین زده که ChatGPT از ۲۰۰۰۰ پردازنده گرافیکی استفاده می کند و در نهایت برای تامین انرژی مدل خود به ۳۰۰۰۰ کارت گرافیک نیاز خواهد داشت.
توهم
هوش مصنوعی مولد، به ویژه چت ربات های مبتنی بر متن، تمایل به ساختن چیزها دارد. این به عنوان “توهم” توصیف می شود، زیرا هوش مصنوعی مولد گاهی اوقات می تواند در یک مماس کامل حرکت کند و با اطمینان در مورد چیزی صحبت کند که درست نیست.
به عنوان مثال، یک ربات چت هوش مصنوعی مولد ممکن است با گفتن اینکه استیو جابز یک شعبده باز از نمای نزدیک بود، در لاس وگاس در دوران Rat Pack، توهم ایجاد کند. اما معمولاً (و نگرانکنندهتر)، چترباتهای مولد هوش مصنوعی با آمیختن واقعیت با داستان، توهمسازی میکنند. به عنوان مثال، ممکن است بگوییم استیو جابز موسس اپل (درست) بود که بر عرضه آیفون (درست) نظارت داشت، که برای آن اعلام شد. زمان‘s شخص سال (درست نیست).
این به این دلیل اتفاق میافتد که مدلهای هوش مصنوعی مولد با پیشبینی کلمات بر اساس رابطه احتمالی با کلمه قبلی کار میکنند. قادر به درک آنچه که تولید می کند نیست. بگذارید این یادآوری باشد که ChatGPT ممکن است حساس عمل کند، اما این نیست.
جیلبریک کردن
جیلبریک کردن یک ربات چت آن را وادار به انجام کاری خارج از کاربردهای مورد نظر خود می کند. با استفاده از نوع خاصی از سریعجیلبریک کاربر را قادر میسازد قوانین یا نردههای محافظ را دور بزند و اساساً او را فریب دهد تا کاری را انجام دهد که قرار نیست طبق آن انجام دهد. هم ترازی. فرار از زندان می تواند از ساختن یک چت بات برای گفتن مطالب توهین آمیز یا نامناسب فقط برای سرگرمی تا به اشتراک گذاشتن اطلاعات خطرناک و کاربردی مانند نحوه ساخت ناپالم متغیر باشد.
مدل زبان بزرگ (LLM)
یک مدل زبان بزرگ یک برنامه نرم افزاری هوش مصنوعی است که بر روی مقادیر زیادی داده برای درک و تولید متن آموزش دیده است. LLM ها با پیش بینی کلمه بعدی بر اساس احتمال، جملات را به هم متصل می کنند. از آنجایی که LLM ها با داده های زیادی آموزش دیده اند – اساساً کل اینترنت – آنها در تولید متنی شبیه انسان با استفاده از این روش بسیار موفق هستند. مدلهای GPT OpenAI، مدلهای PalM Google و Meta’s لاما مدل ها همه نمونه هایی از LLM هستند. GPT-3.5 و GPT-4 قدرت ChatGPT و PalM 2 و برای Bard هستند.
داده های دارای مجوز
دادههای دارای مجوز، اطلاعاتی از وب هستند که توسط یک کسبوکار یا سازمان به این منظور خریداری یا به آن دسترسی پیدا میکند آموزش هوش مصنوعی ممکن است نمونههایی از شرکتها بشنوید که میگویند مدلهای خود را با استفاده از دادههای دارای مجوز آموزش دادهاند. یعنی داده ها به طور قانونی به دست آمده است.
موضوع داده های دارای مجوز اخیراً به دلیل حجم انبوه داده مورد نیاز برای آموزش مدل های هوش مصنوعی مانند ChatGPT بسیار مطرح شده است. می شود از نظر حقوقی مبهمبه دلیل بحث در مورد آنچه که مالکیت عمومی را تشکیل می دهد، قصد خالق اصلی، و اینکه چگونه شرکت ها باید اجازه استفاده از آن داده ها را داشته باشند.
فراگیری ماشین
یادگیری ماشینی روشی در هوش مصنوعی است که در آن یک مدل برای یادگیری و بهبود در طول زمان بر روی داده ها آموزش می بیند. مدلهای یادگیری ماشینی از دادهها برای تشخیص الگوها، طبقهبندی اطلاعات و پیشبینی استفاده میکنند. به عنوان مثال میتوان به فیلتر کردن ایمیلهای هرزنامه (آموزش طبقهبندی)، استفاده از دادههای مسکن برای پیشبینی قیمت خانه (آموزش رگرسیون)، یا شناسایی تصاویر سگها (یادگیری عمیق) اشاره کرد.
هوش مصنوعی و یادگیری ماشین اصطلاحاتی هستند که اغلب به جای یکدیگر استفاده می شوند، اما یادگیری ماشینی زیرمجموعه ای از هوش مصنوعی است که با آموزش داده ها برای ایجاد هوش آن تعریف می شود.
مدل
احتمالاً این اصطلاح را در رابطه با هوش مصنوعی زیاد شنیده اید. مدل یک برنامه یا الگوریتم است که برای یک هدف خاص طراحی شده است. یک مدل هوش مصنوعی یک اصطلاح کلی برای برنامه ای است که برای تکرار و/یا خودکار کردن وظایف خاص طراحی شده است.
پردازش زبان طبیعی (NLP)
دلیل اینکه چرا پاسخهای ChatGPT بسیار ترسناک انسانی خوانده میشوند، پردازش زبان طبیعی است. این اصطلاح به رشته تربیت الگویی در متن و گفتار اطلاق میشود که مانند یک نیروی انسانی خود را بفهمد و بیان کند. پردازش زبان طبیعی شامل تحقیقات زبان شناسی نیز می شود تا مدل ها بتوانند پیچیدگی ها و تفاوت های ظریف زبان را درک کنند.
شبکه عصبی
با الهام از نحوه عملکرد مغز انسان، شبکههای عصبی الگوریتمهایی هستند که از «نرونها» یا گرههای مصنوعی تشکیل شدهاند که با یکدیگر ارتباط برقرار میکنند. هر ارتباط بین دو نورون دارای مقدار یا «وزن» خاصی است. و در صورت رسیدن به آستانه معینی، نورون شلیک میکند، که اطلاعات را به سایر نورونهای شبکه منتقل میکند. قدرت شبکههای عصبی یادگیری عمیق.
متن باز
منبع باز به این معنی است که کد منبع یک برنامه نرم افزاری برای عموم آزاد و رایگان است (در حالی که الف جعبه سیاه بسته است). این بدان معناست که توسعه دهندگان می توانند محصولات خود را با آن استفاده کنند، تغییر دهند و بسازند. یک مدل AI منبع باز به عنوان راهی برای دموکراتیزه کردن توسعه هوش مصنوعی در نظر گرفته می شود که اغلب در رازداری پنهان می شود. برخلاف مدلهای Google و OpenAI که منبع بسته هستند، متا اخیراً یک LLM منبع باز منتشر کرده است.لاما ۲). سایر مدل های منبع باز عبارتند از شاهین، MPTو پیژامه قرمز.
مولفه های
یک پارامتر متغیری در یک LLM است که می تواند در طول آن وزن یا تنظیم شود آموزش برای تعیین یک نتیجه خاص ممکن است در مورد پارامترهای مربوط به قدرت LLM شنیده باشید – برای مثال، GPT-4 دارای ۱٫۷ تریلیون پارامتر است. هر چه یک LLM پارامترهای بیشتری داشته باشد، پیچیده تر است و ظرفیت یادگیری آن بیشتر می شود.
پارامترها را به عنوان تنظیمات یک دوربین با کیفیت بالا در نظر بگیرید. در دوربین میتوانید نور، سرعت فیلم، زوم، دیافراگم، تغییر لنز و غیره را تنظیم کنید و هر پیکربندی نتیجهای کمی متفاوت ایجاد میکند. حالا آن را در میلیاردها یا تریلیون ها ضرب کنید، و این کاری است که پارامترها انجام می دهند.
سریع
اعلان درخواست یا سوالی است که کاربر برای چت بات ارسال می کند. یک خرده فرهنگ کامل برای اطمینان از بهترین پاسخ از مدل های زبانی بزرگ اختصاص داده شده است. چه برای تولید کد باشد، جیلبریکیا فقط دریافت بهترین پاسخی که به دنبال آن هستید، اعلانها به وضوح، مختصر بودن، زمینه و هدف بستگی دارد.
همچنین ببینید: مهندس سریع.
مهندس سریع
با ظهور چت رباتهای هوش مصنوعی، تقاضای ناگهانی برای تخصص در ایجاد دستورات مناسب وجود دارد. آنجاست مهندسی سریع مهندس فوری کسی است که دانش عمیقی از LLM دارد که می تواند بهترین دستورات را برای اهداف مختلف بهینه کند. این می تواند حصول اطمینان از درک موفقیت آمیز ربات چت یا جستجو در مدل برای یافتن تهدیدها و آسیب پذیری ها باشد.
حمله سریع تزریق
ظهور LLM ها منجر به نوع جدیدی از حمله سایبری به نام حملات تزریقی سریع. تزریق سریع، مشابه جیلبریک، عمل استفاده از یک اعلان با دقت ساخته شده برای دستکاری مدل هایی مانند ChatGPT برای اهداف شرورانه است. از طریق تزریق سریع، هکرها از یک آسیبپذیری در ربات چت برای به اشتراک گذاشتن اطلاعات محرمانه یا دور زدن نردههای محافظ مدل سوء استفاده میکنند. مهاجمان از این به طور مستقیم، با تعامل با ربات چت، یا به طور غیرمستقیم با پنهان کردن یک درخواست در یک افزونه یا صفحه وب، برای دسترسی مخفیانه به اطلاعات شخصی یا پرداخت استفاده میکنند.
الگوریتم/سیستم توصیه
قبل از ظهور ChatGPT، هوش مصنوعی بخش بزرگی از زندگی ما بود. یکی از نمونه های همه جا حاضر در این مورد، الگوریتم (یا سیستم) توصیه است. این یک اصطلاح برای یک است فراگیری ماشین الگوریتمی که بر اساس داده ها و رفتار کاربر توصیه می کند. نمایش های پیشنهادی شما در نتفلیکسمحصولات در آمازون، ویدیوها در YouTube و TikTok، و پستها در اینستاگرام نمونه هایی از الگوریتم های توصیه در کار هستند.
هوش مصنوعی قوی
Strong AI اصطلاح دیگری برای AGI یا است هوش عمومی مصنوعی. این یک شکل نظری (در حال حاضر) از هوش مصنوعی است که می تواند به طور مستقل مانند یک انسان “فکر کند” و عمل کند.
رمز
توکن واحدی از اطلاعات در یک است مدل زبان بزرگ. این می تواند یک کلمه، بخشی از یک کلمه، علامت نقطه گذاری، یا بخشی از کد باشد – اساسا اساسی ترین شکل چیزی با معنی. وقتی می شنوید که یک LLM بر روی تعداد معینی توکن آموزش دیده است یا یک مدل قیمت گذاری تعداد معینی سنت در هر ۱۰۰۰ توکن هزینه دارد، این همان چیزی است که به آن اشاره می کند.
آموزش
آموزش فرآیند تغذیه داده ها به a فراگیری ماشین مدل. دو نوع آموزش وجود دارد: یادگیری تحت نظارت و یادگیری بدون نظارت. یادگیری نظارت شده آموزش مدلی با داده هایی است که قبلاً به نوعی برچسب گذاری یا طبقه بندی شده اند، در حالی که یادگیری بدون نظارت از داده های بدون برچسب استفاده می کند که آن را مجبور می کند الگوها و تداعی ها را به تنهایی یاد بگیرد. هر نوع تمرین نقاط قوت و ضعف خاص خود را دارد. LLM ها مانند GPT-4 از ترکیبی از یادگیری بدون نظارت و نظارت استفاده می کنند.
داده های آموزشی
دادههای آموزشی دادههایی هستند که برای آموزش یک مدل یادگیری ماشین استفاده میشوند. داده های آموزشی برای LLM ها شامل حجم عظیمی از داده ها به نام مجموعه داده ها است که عمدتاً از اینترنت حذف می شوند.
مجموعه دادههای عمومی مانند Common Crawl و پایگاه داده ویکیپدیا، و مجموعه دادههای خصوصی یا اختصاصی که توسط شرکتهایی مانند Google جمعآوری شدهاند که منابع لازم برای انجام این کار را دارند، وجود دارد. برای مثال مجموعه داده آن، MassiveWeb، توسط DeepMind متعلق به گوگل ایجاد شده است و شامل رسانه های اجتماعی و سایت های وبلاگ نویسی مانند Reddit، فیس بوک، یوتیوب و مدیوم است. بنابراین اگر تا به حال در یکی از آن سایتها پست گذاشتهاید، دادههای شما همین بوده است احتمالا استفاده شده برای آموزش بارد
تبدیل کننده
آیا می دانستید که GPT (مانند ChatGPT) مخفف ترانسفورماتور از پیش آموزش دیده مولد است؟ این فقط یک مخفف زبان بند نیست. ترانسفورماتور نوعی از شبکه عصبی که مدل یادگیری عمیق مورد استفاده برای هوش مصنوعی مولد را تقویت می کند. با جاسازی کلمات کار می کند (توکن ها) با زمینه، با استفاده از مکانیزم «توجه به خود»، که آن را قادر میسازد پیشبینی کند که کلمه بعدی چه خواهد بود. در غیر این صورت، مدل فقط کلمات را به عنوان بیت های داده بدون هیچ ارتباطی با یکدیگر درک می کند.
مدل ترانسفورماتور، که توسعه محصولاتی مانند ChatGPT را آغاز کرد، از a کاغذ توسط محققان گوگل و دانشگاه تورنتو در سال ۲۰۱۷٫
موضوعات
هوش مصنوعی
ChatGPT
منبع: https://mashable.com/article/ai-definitions-artificial-intelligence-glossary-terms