۱٫ مقدمه
این مقاله یک مدل جدید برای طبقهبندی تصاویر باینری ارائه میکند که از یک رویکرد ترکیبی کوانتومی-کلاسیک استفاده میکند. با ترکیب نقاط قوت هر دو حوزه، محدودیتهای سختافزار کوانتومی فعلی و نیازهای محاسباتی مدلهای CNN قابل رفع است. آثار اصلی این اثر به شرح زیر است:
-
ما یک مدل دو کیوبیت و شش لایه H-QNN را توسعه دادیم که به طور خاص برای برآورده کردن محدودیتهای کیوبیت دستگاههای NISQ برای طبقهبندی تصویر طراحی شده است. مدل پیشنهادی ما نشاندهنده پیشرفت قابلتوجهی در طبقهبندی تصاویر کوانتومی تقویتشده با وجود منابع کوانتومی محدود در دسترس است.
-
معماری کانولوشن کوانتومی پیشنهادی یک راه حل کارآمد از نظر دستیابی به دقت بالا با تعداد کمتری از تصاویر برای کارهای طبقه بندی باینری در مقایسه با معماری مشابه CNN ارائه می دهد. همچنین قدرت تمایز طبقه بندی تصاویر با دقت بالا را افزایش می دهد. علاوه بر این، معماری پیشنهادی انعطافپذیری را برای مدیریت طبقهبندی چند طبقه فراهم میکند.
-
مدل H-QNN ما محاسبات کوانتومی را با شبکههای عصبی کلاسیک ترکیب میکند تا منابع محاسباتی را در سراسر شکاف کوانتومی-کلاسیک بهینه کند. این یک رویکرد مقیاس پذیر و موثر به QML در عصر NISQ ارائه می دهد.
۲٫ پس زمینه
این بخش با ارائه مفاهیم اساسی، اطلاعات پس زمینه و کارهای مرتبط، بینشی در مورد QNN ها ارائه می دهد. این کتاب موضوعات اساسی مانند کیوبیتهای کوانتومی، دروازههای کوانتومی و مدارها را پوشش میدهد و یک نمای کلی از توسعه QNN، از جمله تاریخچه، تکامل و وضعیت فعلی آن ارائه میدهد. علاوه بر این، آخرین تحقیقات در زمینه QNN ها، از جمله پیشرفت در سخت افزار محاسبات کوانتومی، الگوریتم های کوانتومی، و ادغام QNN ها با شبکه های عصبی کلاسیک را مورد بحث قرار می دهد.
۲٫۱٫ مقدماتی
۲٫۱٫۱٫ کیوبیت ها، برهم نهی، دروازه های کوانتومی، درهم تنیدگی و اندازه گیری
-
کیوبیت ها: در محاسبات کلاسیک، واحد اصلی اطلاعات بیت است که می تواند هر یک را نشان دهد ۰ یا ۱. در محاسبات کوانتومی، واحد اساسی کیوبیت است که می تواند نشان دهد ۰، ۱یا ترکیبی از و به طور همزمان به دلیل خاصیتی به نام برهم نهی. این توانایی وجود در چندین حالت به طور همزمان چیزی است که به کامپیوترهای کوانتومی پتانسیل آنها را برای افزایش نمایی قدرت محاسباتی در مقایسه با کامپیوترهای کلاسیک می دهد. انواع مختلفی از فناوری های کیوبیت موجود است، مانند کیوبیت های ابررسانا، یون های به دام افتاده، اتم های خنثی و کیوبیت های اسپین سیلیکونی.
-
برهم نهی: برهم نهی یک اصل اساسی در مکانیک کوانتومی است که به کیوبیت ها اجازه می دهد در چندین حالت به طور همزمان وجود داشته باشند. به عنوان مثال، در حالی که یک بیت کلاسیک می تواند هر دو باشد ۰ یا ۱یک کیوبیت می تواند در برهم نهی هر دو حالت باشد، به این معنی که هر دو را نشان می دهد ۰ و ۱ در همان زمان تا اندازه گیری شود. این ویژگی کامپیوترهای کوانتومی را قادر میسازد تا محاسبات زیادی را به طور همزمان انجام دهند و به سرعت انواع خاصی از محاسبات را افزایش میدهند.
-
دروازه های کوانتومی: دروازههای کوانتومی بلوکهای سازنده مدارهای کوانتومی هستند که مشابه دروازههای منطقی کلاسیک هستند. آنها بر روی کیوبیت ها عمل می کنند تا عملیاتی مانند چرخاندن وضعیت یک کیوبیت، درهم تنیدگی کیوبیت ها یا ایجاد برهم نهی ها را انجام دهند. دروازه های کوانتومی رایج شامل دروازه Pauli-X (شبیه به دروازه کلاسیک NOT)، دروازه هادامارد (برهم نهی) و دروازه CNOT (دو کیوبیت را در هم می بندد). این گیت ها حالت های کوانتومی کیوبیت ها را برای انجام محاسبات دستکاری می کنند. یک مدار کوانتومی اغلب شامل عملیات گیت های مختلفی است.
-
درهم تنیدگی: درهم تنیدگی یکی دیگر از ویژگیهای منحصربهفرد مکانیک کوانتومی است که به کیوبیتها اجازه میدهد به گونهای همبستگی داشته باشند که وضعیت یک کیوبیت به حالت دیگری بستگی داشته باشد، حتی زمانی که آنها با فواصل زیاد از هم جدا شوند. این پدیده کامپیوترهای کوانتومی را قادر می سازد تا محاسبات خاصی را بسیار سریعتر از کامپیوترهای کلاسیک انجام دهند.
-
اندازه گیری ها: اندازه گیری در محاسبات کوانتومی به فرآیند استخراج اطلاعات از یک کیوبیت اشاره دارد. هنگامی که یک کیوبیت اندازه گیری می شود، برهم نهی آن فرو می ریزد و حالت معینی به خود می گیرد (یا ۰ یا ۱) با احتمال معینی که توسط ضرایب برهم نهی آن تعیین می شود. عمل اندازه گیری به طور غیر قابل برگشتی وضعیت کیوبیت را تغییر می دهد. در رایانههای کوانتومی فیزیکی، اندازهگیریها معمولاً به یک مبنای محاسباتی، مانند پایه Z، محدود میشوند. به عنوان مثال، در رایانه های کوانتومی IBM، اندازه گیری ها معمولاً در امتداد محور Z کره بلوخ انجام می شود. این اندازهگیری مبتنی بر Z تعیین میکند که آیا حالت کیوبیت به هم میرسد یا خیر یا . پایه های دیگر، مانند پایه X یا Y، نیز می توانند مورد استفاده قرار گیرند، اما آنها به دروازه های کوانتومی اضافی نیاز دارند تا حالت های کیوبیت را قبل از اندازه گیری به پایه محاسباتی بچرخانند. این رویکرد اجرای اندازه گیری را ساده می کند اما اندازه گیری مستقیم را به مبنای محاسباتی محدود می کند.
۲٫۱٫۲٫ شبکه عصبی کوانتومی
یک QNN شامل بهینه سازی پارامتر یک مدار کوانتومی پارامتر شده برای به دست آوردن یک رابطه ورودی-خروجی مورد نظر است. یک QNN به طور کلی از سه بخش تشکیل شده است: (۱) یک مدار رمزگذاری (یا جاسازی) داده کلاسیک به کوانتومی، (۲) یک مدار پارامتری، و (iii) عملیات اندازه گیری.
۲٫۲٫ کار مرتبط
مدل H-QNN پیشنهادی ما بر اساس پیشرفتهایی در زمینه QML است که به صراحت برای طبقهبندی تصاویر باینری طراحی شدهاند. برخلاف مدلهای قبلی، H-QNN پیشنهادی ما از یک مدار کوانتومی فشرده ادغام شده با معماری کانولوشن کلاسیک استفاده میکند که آن را برای دستگاههای NISQ کارآمد میکند. این طراحی محدودیتهای کیوبیت را برطرف میکند، دقت طبقهبندی را افزایش میدهد و با بیش از حد برازش در مجموعههای داده کوچک مقابله میکند.
۳٫ روش شناسی
این بخش روش های ترکیبی ترکیبی کلاسیک و محاسبات کوانتومی را ارائه می دهد. به طور خاص، ما تا حدی یک شبکه عصبی کلاسیک را به یک شبکه عصبی کوانتومی تبدیل می کنیم تا یک شبکه عصبی کوانتومی-کلاسیک ترکیبی ایجاد کنیم.
۳٫۱٫ نمای کلی
۳٫۲٫ مدار کوانتومی (مدار پارامتری)
الگوریتم ۱ یک رابط ساده برای ایجاد و اجرای مدارهای کوانتومی پارامتری شده فراهم می کند. این مدار کوانتومی کلاس از دو رویه اصلی تشکیل شده است: IITALIZE و اجرا کنید.
با مراجعه به الگوریتم ۱، IITALIZE این روش یک مدار کوانتومی با تعداد مشخصی کیوبیت ایجاد می کند که در مورد ما ۲ کیوبیت است باطن (شبیه ساز) که مدار روی آن اجرا می شود و تعداد تکرارها برای اجرای مدار (عکس ها). گزینه های مختلفی از وجود دارد باطن شبیه سازهای موجود، مانند قاسم_شبیه ساز، statevector_simulatorو aer_simulator. با این حال، در مدل H-QNN خود، از آن استفاده کردیم aer_simulator باطن
الگوریتم ۱ ماژول مدار کوانتومی |
|
The rotation gate rotates the qubit state around the Y-axis of the Bloch sphere by an angle , which is determined during the training process. The parameter enables the quantum circuit to learn and adapt based on the data, effectively parameterizing the quantum neural network. Finally, all qubits are measured (line 8) following the backend, and the number of shots (repetitions) is set (line 9).
The RUN procedure builds a quantum circuit for a set of parameter values (lines 12–۳۷). Initially, the circuit is optimized for the specified backend through a process called transpilation (line 13). This involves mapping the circuit to the backend’s topology, optimizing gate operations, and reducing the overall complexity. Then, the circuit is parameterized and executed on the backend for each parameter value in the list (lines 15–۱۶). This allows us to observe how the quantum circuit behaves under various parameter settings. The parameter is dynamically assigned different values from the list . Each time, the circuit is executed with a different parameter value during each iteration of the loop. The results of these executions are collected for further analysis. An empty list () (line 18) is initialized to store the expectation values computed from the results.
Each result is processed to compute the expectation values () (line 25). If the results are in the form of a list (indicating multiple results), the procedure iterates over each result, converting the measurement counts into a NumPy array and the binary state strings into integers. The probabilities of each state are calculated by normalizing the counts by the total number of shots. The expectation value () is then computed as the weighted sum of states and their respective probabilities, and this value is appended to the expectations list () (line 26). If the results are a single dictionary (indicating a single result), a similar process is followed: the counts are converted to a NumPy array, states are decoded, probabilities are computed, and the expectation value is calculated and appended to the list.
The RUN procedure concludes by returning the list of expectation values () as a NumPy array, providing a comprehensive output of the quantum circuit’s behavior for the given parameter set (line 36). This structured approach can be used to create a quantum circuit efficiently.
۳٫۳٫ Hybrid Module
The proposed hybrid module integrates the quantum layer with classical layers. It also comprises two classes: the Hybrid class and the Gradient Calculation (GradCalc) class. Algorithm ۲ illustrates the proposed hybrid module that integrates a quantum circuit within a neural network architecture.
Algorithm ۲ provides the forward and backward pass methods for gradient calculation (lines 1–۸). The GradCalc class handles the integration of the quantum circuit into the gradient computation graph (line 2). Following this, a forward pass computes the expectation values using the quantum circuit (lines 3–۵). Similarly, the backward pass computes the gradients of the expectation values (lines 6–۸).
Algorithm 2 Hybrid quantum–classical module. |
|
|
۳٫۴٫ محاسبه گرادیان
کجا جی مولد هرمیتی است و الف یک ثابت واقعی است تابع هدف مربوط به این مدار را می توان به صورت
جایی که پارامتر shift r به عنوان تعریف شده است و و مقادیر ویژه مولد هستند جی. قانون تغییر پارامتر برای پیاده سازی گیت های تک و چند کیوبیتی در زیر مورد بحث قرار گرفته است.
۳٫۴٫۱٫ دروازه های تک کیوبیت
دروازههای تک کیوبیتی، مانند دروازههای چرخشی پائولی، در محاسبات کوانتومی اساسی هستند. این گیت ها را می توان تعریف کرد و شیب آنها را می توان با استفاده از قانون تغییر پارامتر محاسبه کرد:
-
این Xدروازه چرخش به صورت تعریف شده است
با یک جابجایی ثابت .
-
این Y– دروازه چرخشی
همچنین یک تغییر ثابت دارد .
-
این ز– دروازه چرخشی
به طور مشابه استفاده می کند .
این دروازههای چرخشی، حالتهای کوانتومی را با چرخاندن آنها حول محورهای مربوطه در کره بلوخ، دستکاری میکنند.
۳٫۴٫۲٫ دروازه های چند کیوبیت
برای عملیات کوانتومی پیچیدهتر که شامل چند کیوبیت است، مانند دروازه متعارف دو کیوبیتی، قانون تغییر پارامتر را میتوان با تجزیه گیت به برهمکنشهای سادهتر اعمال کرد:
-
دروازه متعارف دو کیوبیتی را می توان به صورت بیان کرد
کجا ، و ضرایبی هستند که قدرت عبارات برهمکنش را در یک دروازه چند کیوبیتی برای تعیین می کنند ، و به ترتیب. این دروازه می تواند به تعاملات شامل تجزیه شود ، و .
این تجزیه امکان ارزیابی گرادیانها را برای هر جزء دروازه فراهم میکند و بهینهسازی مدارهای کوانتومی را که عملیات درهمتنیدگی را شامل میشوند، تسهیل میکند.
۳٫۵٫ رسیدگی به خطا
مدارهای کوانتومی ذاتاً مستعد انواع مختلفی از خطاها از جمله ناهمدوسی، خطاهای دروازه و خطاهای اندازه گیری هستند. این خطاها می توانند به طور قابل توجهی بر عملکرد و قابلیت اطمینان QNN ها تأثیر بگذارند. با این حال، مدل H-QNN با ترکیب چندین تکنیک کاهش خطا به این چالش ها می پردازد.
۳٫۵٫۱٫ انتقال و بهینه سازی گیت
ترانسپیلاسیون با استفاده از تابع transpile Qiskit قبل از اجرای مدارهای کوانتومی انجام می شود. این فرآیند با نگاشت کارآمد عملیات کوانتومی به کیوبیت ها و گیت های موجود، مدار کوانتومی را برای باطن خاص بهینه می کند. ترانسپیلاسیون اغلب منجر به کاهش تعداد کلی گیت و عمق مدار می شود که احتمال خطاهای ناشی از عیوب گیت و عدم انسجام را به حداقل می رساند.
کجا مدار بهینه شده برای سخت افزار کوانتومی خاص است و تابع هزینه است که برای ارزیابی و بهینه سازی مدار کوانتومی استفاده می شود.
۳٫۵٫۲٫ تصحیح اندازه گیری
پس از اجرای مدارهای کوانتومی، نتایج اندازه گیری جمع آوری شده و برای محاسبه مقادیر مورد انتظار پردازش می شود. این مرحله شامل تبدیل تعداد خام به احتمالات و محاسبه مقادیر مورد انتظار حالت های اندازه گیری شده است. برای رسیدگی به اختلافات احتمالی در نتایج اندازهگیری، از یک قالب ثابت برای پردازش نتایج استفاده میشود که در زیر مورد بحث قرار میگیرد.
این رویکرد تفسیر دقیق نتایج اندازه گیری را حتی در حضور نویز و خطا از طریق تمرین میانگین گیری در چندین شات و به کارگیری روش های آماری برای استخراج مقادیر مورد انتظار تضمین می کند.
۳٫۶٫ معماری مدل پیشنهادی
-
ورودی: مرحله اولیه شامل پیش پردازش داده های تصویر است، که در آن اندازه همه تصاویر به اندازه استاندارد تغییر داده می شود. برای معماری H-QNN، ما از اندازه تصویر ۷۲۰ × ۷۲۰ استفاده کردیم. این تغییر اندازه یکنواختی در ابعاد ورودی را تضمین می کند. علاوه بر این، مقادیر پیکسل نرمال می شوند تا در محدوده خاصی از اطراف قرار بگیرند [−۱, ۱].
-
اجزای شبکه عصبی کلاسیک: پس از پیش پردازش داده ها، یک CNN با شش لایه کانولوشن (Conv2d) شروع می شود (شکل ۲). این لایه ها داده های پیکسلی تصاویر را با اعمال فیلترهای مختلف (هسته) پردازش می کنند. فیلترها سلسله مراتب فضایی و ویژگی هایی مانند لبه ها، بافت ها و اشکال را ثبت می کنند. هر لایه کانولوشن با یک تابع فعال سازی ReLU دنبال می شود. این امر غیرخطی بودن را معرفی می کند که به مدل در یادگیری الگوهای پیچیده تر کمک می کند. بعد از هر لایه کانولوشن، لایه های max-pooling (MaxPool2d) اعمال می شود. ادغام ابعاد هر نقشه ویژگی را کاهش می دهد و در عین حال مهم ترین اطلاعات را حفظ می کند. این کمک می کند تا بدون توجه به تغییرات در اندازه و جهت اشیاء در تصویر، ویژگی های ثابت را شناسایی کنید. علاوه بر این، ابعاد نقشههای ویژگی را کاهش میدهد که به نوبه خود بار محاسباتی را کاهش میدهد و پردازش را سریعتر و کارآمدتر میکند. پس از لایه کانولوشنال نهایی، یک لایه ادغام میانگین تطبیقی (AdaptiveAvgPool2d) اعمال می شود. این ابعاد فضایی را به اندازه (۱، ۱) کاهش می دهد، و به طور موثر ویژگی های استخراج شده توسط پیچیدگی ها را در یک عدد واحد برای هر نقشه ویژگی خلاصه می کند.
-
لایه های کاملا متصل: سپس شبکه از لایه های کانولوشن به سه لایه کاملا متصل (خطی) تبدیل می شود. این لایه ها نمایش ویژگی های آموخته شده را به اندازه خروجی مورد نظر ترسیم می کنند. خروجی آخرین دنباله لایه کانولوشن مسطح می شود و از لایه های کاملاً متصل عبور می کند تا یک بردار ویژگی ایجاد شود.
-
جزء مدار کوانتومی/مدار پارامتری شده: بعد از لایههای کاملاً متصل، لایههای پنهان مدل H-QNN هستند که فقط از یک جزء کوانتومی تشکیل شدهاند. ورودی تولید شده توسط آخرین لایه کلاسیک (یعنی لایه کلاسیک کاملاً متصل) از طریق یک مدار کوانتومی پردازش میشود که شامل گیتهای هادامارد، دروازههای چرخشی پارامتری شده است.) و اندازه گیری ها مدار ورودی ها را از طریق حالت های کوانتومی پردازش می کند و خروجی تولید می کند که اطلاعات یکپارچه را از ورودی می گیرد.
در مدل H-QNN ما (شکل ۲)، مدار پارامتری شامل ۲ کیوبیت و دارای ۴ گیت کوانتومی است. برای ادغام مدار کوانتومی در گذر رو به جلو شبکه، آن را با کلاس تابع PyTorch از طریق یک ادغام می کنیم. اتوگراد تابع روش فوروارد مقادیر مورد انتظار مدار کوانتومی را با اجرای عملیات کوانتومی و سپس اندازهگیری حالتهای نهایی برای تولید یک خروجی کلاسیک محاسبه میکند. این مقادیر انتظاری به عنوان ورودی لایه بعدی یا خروجی نهایی شبکه عمل می کنند.در طول گذر به عقب، ما از انتشار پسانداز برای آموزش شبکه با جابجایی جزئی ورودیها با استفاده از قانون تغییر پارامتر، همانطور که در بخش ۳٫۴ توضیح داده شد، استفاده میکنیم. ما گرادیان مدار کوانتومی را با توجه به پارامترهای ورودی محاسبه میکنیم و شبکه را قادر میسازیم تا این پارامترها را یاد بگیرد و بهروزرسانی کند. پس از محاسبه گرادیانها، مدار را مجددا اجرا میکنیم تا پارامترها را تأیید و تنظیم کنیم و گذر به عقب را تکمیل کنیم. -
ترکیب اجزای کلاسیک و کوانتومی: ماژول هیبریدی مدار کوانتومی را با عملکردهای شبکه عصبی کلاسیک که در بخش ۳٫۳ توضیح داده شده است، ترکیب می کند. در یکی از لایه های نهایی مدل، به ویژه پس از آخرین لایه کاملا متصل معماری کلاسیک CNN، ادغام شده است. این لایه کلاسیک نهایی مسئول تبدیل ویژگی های سطح بالا استخراج شده توسط لایه های کانولوشن به فرمتی مناسب برای پردازش توسط مدار کوانتومی است.
لایه هیبریدی این ورودی ها را از طریق مدار کوانتومی پردازش می کند و خروجی حاصل مانند هر خروجی لایه دیگر در یک شبکه عصبی رفتار می شود. پس از فرآیندهای مدار کوانتومی، ورودیها و اندازهگیریها گرفته میشوند و خروجی از این اندازهگیریها در صورت وجود، به لایههای بعدی منتقل میشود. در این تنظیمات ترکیبی، اندازهگیریهای مدار کوانتومی اساساً خروجیهای نهایی لایه هیبریدی هستند. این خروجی ها می توانند به لایه های بیشتر در یک شبکه پیچیده تر وارد شوند یا به طور مستقیم به پیش بینی نهایی مدل کمک کنند.
-
خروجی: لایه خروجی مدل H-QNN نتایج مدار کوانتومی را با نتایج شبکه عصبی کلاسیک ادغام میکند تا خروجی طبقهبندی نهایی را تولید کند. ویژگیهای تقویتشده کوانتومی از مدار کوانتومی پارامتری شده در فرآیند کلی تصمیمگیری ادغام میشوند که دقت و عملکرد نهایی مدل را بهبود میبخشد.
۴٫ نتایج
این بخش نتایج تجربی مدل H-QNN پیشنهادی ما را ارائه میکند. ما آزمایشهایی را روی رایانهای انجام دادیم که مجهز به پردازنده Intel(R) Core i7-13700 با فرکانس پردازنده ۳٫۵۰ گیگاهرتز، ۳۲٫۰ گیگابایت حافظه دسترسی تصادفی (RAM) و اجرای اوبونتو ۲۲٫۰۴٫۴، نسخه LTS بود.
۴٫۱٫ تجزیه و تحلیل عملکرد مقایسه ای
ما اثربخشی مدل ترکیبی خود را با استفاده از سه مجموعه داده مجزا که از Kaggle تهیه شده بود، ارزیابی کردیم. ما از ۲۰۰۰ تصویر برای هر کلاس در مجموعه داده ماشین در مقابل دوچرخه، ۵۰۰۰ تصویر برای هر کلاس در مجموعه داده Dump vs. Recycle Waste، و ۱۵۰۰ تصویر برای هر کلاس در مجموعه داده فوتبال در مقابل راگبی استفاده کردیم. ما تصاویر را به طور تصادفی از مجموعه داده ها انتخاب کردیم.
در آزمایشات با ۱۰۰۰ تصویر در هر کلاس، H-QNN به طور مداوم از CNN در تمام مجموعه داده ها بهتر عمل می کند و استحکام خود را با داده های آموزشی بزرگتر نشان می دهد. به طور مشابه، هنگامی که تعداد تصاویر در هر کلاس به ۵۰۰ کاهش می یابد، H-QNN عملکرد پایدارتری نسبت به CNN حفظ می کند. این پایداری نشاندهنده قابلیتهای تعمیم برتر H-QNN است و آن را برای برنامههایی با دادههای آموزشی محدود مناسبتر میکند. در مقابل، CNN تمایل دارد با دادههای کاهشیافته بیشازحد تناسب داشته باشد، که بر مزایای استفاده از H-QNN برای عملکرد قابل اعتماد و ثابت در وظایف طبقهبندی تصویر تأکید میکند.
۴٫۲٫ تجزیه و تحلیل منحنی ضرر
۴٫۳٫ استخراج ویژگی t-SNE
۴٫۴٫ تجزیه و تحلیل عملکرد بازیابی تصویر
۵٫ بحث و محدودیت
با وجود مزایای ارائه شده توسط مدل H-QNN، محدودیت هایی وجود دارد که باید در نظر گرفته شوند. پیاده سازی فعلی مدل H-QNN با قابلیت های دستگاه های NISQ که دارای تعداد محدودی کیوبیت هستند و مستعد نویز و خطا هستند، محدود شده است. وفاداری گیت و نویز کوانتومی عوامل مهمی هستند که بر عملکرد مدارهای کوانتومی تأثیر می گذارند. وفاداری پایین دروازه می تواند خطاهایی را در محاسبات ایجاد کند، در حالی که نویز کوانتومی، از جمله خطاهای ناهمدوسی و عملیاتی، می تواند دقت مدل را کاهش دهد. مشاهدات تجربی ما نشان میدهد که خطاهای گیت و نویز میتواند منجر به کاهش قابل توجه عملکرد شود.
برای کاهش محدودیتهای دستگاههای NISQ، ما از چندین استراتژی، از جمله تکنیکهای کاهش خطا مانند تصحیح اندازهگیری و انتقال استفاده کردیم. این تکنیک ها به مقابله با اثرات نامطلوب نویز کمک می کند و به مدل H-QNN ما اجازه می دهد تا به نتایج قابل اعتمادتری دست یابد. پیشرفتهای مداوم در سختافزار کوانتومی، بهویژه در افزایش وفاداری گیت و کاهش نویز، برای استقرار عملی شبکههای عصبی کوانتومی بسیار مهم خواهد بود. در حالی که مدل H-QNN بهبود قابل توجهی را در طبقه بندی تصاویر باینری نشان می دهد، مقیاس پذیری آن برای طبقه بندی چند طبقه و مجموعه داده های بزرگتر همچنان باید به طور کامل بررسی شود. کارایی و دقت مدل H-QNN در مدیریت وظایف پیچیده تر با تعداد کلاس های بالاتر و حجم داده های بزرگتر نیاز به بررسی بیشتر دارد.
طراحی مدار کوانتومی در مدل H-QNN نسبتا ساده است و فقط یک مدار دو کیوبیتی را شامل می شود. طراحیهای پیچیدهتر مدار کوانتومی میتواند عملکرد مدل را افزایش دهد، اما به سختافزار کوانتومی پیشرفتهتر و تکنیکهای بهینهسازی نیاز دارد. آموزش مدل H-QNN مستلزم منابع محاسباتی و زمان قابل توجهی است، به ویژه هنگام شبیه سازی مدارهای کوانتومی بر روی سخت افزار کلاسیک. این می تواند مانعی برای پذیرش گسترده QML باشد، زیرا نیاز به دسترسی به منابع محاسباتی با کارایی بالا و شبیه سازهای کوانتومی کارآمد دارد.
مطالعه حاضر بر وظایف طبقه بندی تصاویر باینری متمرکز است. تعمیم مدل H-QNN به سایر حوزهها و انواع دادهها، مانند پردازش زبان طبیعی یا تجزیه و تحلیل سریهای زمانی، هنوز مورد بررسی قرار نگرفته است و همچنان یک سؤال باز است. محاسبات کوانتومی به دلیل عدم پیوستگی و نقص دروازه مستعد خطا هستند. استراتژی های موثر کاهش خطا برای بهبود قابلیت اطمینان و دقت مدل H-QNN بسیار مهم است. راهبردهای کاهش خطای مدارهای کوانتومی هنوز حوزه تحقیقات در حال انجام است. پرداختن به این محدودیتها برای پیشبرد کاربردهای عملی مدلهای H-QNN در حوزههای مختلف و تحقق کامل پتانسیل یادگیری ماشینی تقویتشده کوانتومی ضروری است. کار آینده در این زمینه باید بر توسعه مدارهای کوانتومی قویتر، بهبود تکنیکهای کاهش خطا، و بررسی مقیاسپذیری و تعمیم مدلهای H-QNN به کاربردهای گستردهتر متمرکز شود.
۶٫ نتیجه گیری و کار آینده
شبکههای عصبی کوانتومی (QNN) نوید قابل توجهی برای پیشبرد وظایف طبقهبندی تصویر با استفاده از ویژگیهای منحصربهفرد مکانیک کوانتومی دارند. این مطالعه پتانسیل QNN های ترکیبی (H-QNN) را در پیشبرد طبقه بندی تصاویر باینری نشان می دهد. مدل پیشنهادی H-QNN ما، که به طور خاص برای وظایف طبقهبندی تصاویر باینری طراحی شده است، به طور یکپارچه مزایای محاسباتی مکانیک کوانتومی را با تکنیکهای یادگیری ماشین سنتی ادغام میکند. مدل پیشنهادی به طور قابلتوجهی دقت طبقهبندی را در دستگاههای NISQ بهبود میبخشد، و به نرخ دقت چشمگیر ۹۰٫۱% در مجموعه دادههای ماشین در مقابل دوچرخه دست مییابد که از عملکرد مدل کلاسیک CNN 1.9% پیشی میگیرد.
مدل پیشنهادی H-QNN ما شامل یک معماری دو کیوبیت و شش لایه است که برای رسیدگی به محدودیتهای کیوبیت دستگاههای NISQ، همراه با یک معماری کانولوشن کوانتومی جدید طراحی شده است که با تعداد کمتری از تصاویر به دقت بالایی دست مییابد. رویکرد ترکیبی کوانتومی-کلاسیک، منابع محاسباتی را در سراسر طیف کوانتومی-کلاسیک بهینه میکند و راهحلی مقیاسپذیر و مؤثر در عصر NISQ ارائه میدهد. سازگاری معماری پیشنهادی ما برای رسیدگی به طبقه بندی چند کلاسه، پتانسیل آن را در کاربردهای مختلف دنیای واقعی بیشتر نشان می دهد.
این کار همچنین بر استحکام مدل H-QNN ما نسبت به نویز کوانتومی و توانایی آن در تعمیم خوب حتی با دادههای آموزشی محدود تأکید میکند، برخلاف تمایل CNN سنتی به بیش از حد برازش. این یافتهها نشان میدهد که مدلهای ترکیبی نشاندهنده یک تغییر پارادایم در هوش مصنوعی تقویتشده با کوانتومی است، که امکانهای بیشتری را برای پرداختن به محدودیتهای رویکردهای کلاسیک یا کوانتومی صرفاً در برنامههای پرمخاطره و دنیای واقعی باز میکند.
علیرغم نتایج امیدوارکننده برای مدلهای H-QNN، حوزههای مختلفی برای کار آینده وجود دارد که میتواند کاربرد و عملکرد مدلهای H-QNN را بهبود بخشد. تحقیقات آینده میتواند بر توسعه طرحهای پیچیدهتر مدار کوانتومی متمرکز شود که از سختافزار کوانتومی پیشرفته و تکنیکهای بهینهسازی برای افزایش بیشتر عملکرد مدل بهره میبرد. علاوه بر این، گسترش مدل H-QNN برای دسته بندی چند طبقه و مجموعه داده های بزرگتر می تواند کاربرد آن را به طور قابل توجهی گسترش دهد.
بررسی تعمیم مدل H-QNN به سایر حوزهها، مانند پردازش زبان طبیعی و تحلیل سریهای زمانی، میتواند بینشی در مورد تطبیق پذیری آن ارائه دهد. علاوه بر این، پیشبرد استراتژیهای کاهش خطا برای مدارهای کوانتومی برای بهبود قابلیت اطمینان و دقت مدلهای H-QNN بسیار مهم خواهد بود. در نهایت، بررسی مقیاسپذیری مدلهای H-QNN برای سیستمهای کوانتومی بزرگتر و ادغام آنها با فناوریهای کوانتومی نوظهور (به عنوان مثال، بازپخت کوانتومی و کیوبیتهای توپولوژیکی) میتواند به کاربردهای عملیتر و گستردهتر در یادگیری ماشین کوانتومی پیشرفته منجر شود.
منبع: https://www.mdpi.com/2673-2688/5/3/70