تشخیص ناهنجاری شبکه مبتنی بر یادگیری ماشین: طراحی، اجرا و ارزیابی

این بخش به تشریح پیکربندی آزمایشی مورد استفاده برای ارزیابی تشخیص ناهنجاری شبکه می‌پردازد. در ابتدا، ما از یک محیط شبکه شبیه سازی شده استفاده کردیم که سناریوهای دنیای واقعی را منعکس می کرد، و سپس یک بررسی آماری از معیارهای شبکه ضروری انجام دادیم. در نهایت، ما از t-Distributed Stochastic Neighbor Embedding (t-SNE) برای تجسم الگوهای داده ها و همبستگی ها استفاده کردیم که توسعه مدل را تسهیل می کند.

۴٫۱٫ عملکرد محیط شبکه شبیه سازی شده

این شبکه برای تکرار شرایط مختلف دنیای واقعی، مانند محدودیت‌های پهنای باند، تأخیر و از دست دادن بسته‌ها، که شاخص‌های کلیدی سلامت شبکه هستند، طراحی شده است. با این حال، برخی محدودیت‌های ذاتی در محیط مجازی‌شده بر عملکرد شبکه تأثیر می‌گذارد، به ویژه پهنای باند ثابت ۲ مگابیت در ثانیه، که حداکثر ظرفیت پیکربندی شبیه‌سازی شده است. مجموعه داده توسعه یافته شامل ویژگی های کلیدی زیر است.

در طول شبیه سازی، ترافیک شبکه در یک محیط مدیریت شده تولید شد و داده ها هر ۱۵ ثانیه در سناریوهای مختلف ثبت شدند. این فرآیند یک مجموعه داده شامل ۱۰۰۰ ورودی به دست داد که جزئیات عملکرد آن در جدول ۲ نشان داده شده است. به عنوان مثال، مقادیر توان عملیاتی به طور متوسط ​​۱٫۹۱ مگابیت در ثانیه بود، اما بسته به سناریو از ۰٫۹۰ مگابیت در ثانیه تا ۷٫۱۴ مگابیت در ثانیه متغیر بود. این تغییر توانایی شبکه برای مدیریت بارهای مختلف را برجسته می کند، اگرچه محدوده بالایی به دلیل شرایط شبیه سازی شده از پهنای باند مورد انتظار فراتر می رود.

ازدحام یکی دیگر از معیارهای مهم بود که دامنه وسیعی را از ۰٫۰۳ درصد در حداقل ترافیک تا بیش از ۱۳۴٫۳۷ درصد در زمانی که شبکه به شدت بارگذاری می‌کرد، نشان می‌داد. این نشان می‌دهد که شبکه تحت شرایط خاصی ازدحام شدید را تجربه کرده است، که برای آزمایش استحکام مدل‌های تشخیص ناهنجاری ضروری است. میانگین از دست دادن بسته ۵٫۴۳% با پیک های تا ۵۰% ثبت شد که نشان می دهد شبکه برای حفظ یکپارچگی داده در حجم بالای ترافیک تلاش می کند.

اندازه گیری تأخیر نیز به طور قابل توجهی متفاوت بود، از ۴٫۴۸ میلی ثانیه تا مقادیر شدید مانند ۳۰۵۱ میلی ثانیه، به ویژه در سناریوهایی با ترافیک سنگین و ازدحام. چنین تأخیر بالایی نشان‌دهنده کاهش شدید عملکرد است که احتمالاً بر برنامه‌های حساس به زمان تأثیر می‌گذارد.

جیتر، معیار تغییرپذیری در تاخیر بسته، کمترین تغییر را بین سناریوها نشان داد، که نشان می‌دهد، علی‌رغم سایر مسائل عملکرد، ثبات زمانی تحویل بسته نسبتاً پایدار بود. این یک ملاحظات مهم است، به ویژه برای برنامه هایی مانند پخش ویدیو، که در آن لرزش می تواند به طور قابل توجهی بر کیفیت تأثیر بگذارد.

علاوه بر این، شبکه برای توانایی آن در مدیریت بارهای مختلف با تغییر درصد سربار شبکه، که از ۰٪ تا ۱۲۰٪ متغیر بود، آزمایش شد. این امر با پخش محتوای چندرسانه‌ای با نرخ بیت‌های مختلف، با تعداد پخش‌های ویدئویی همزمان از ۰ تا ۶ به دست آمد. نتایج این سناریوها محدودیت‌های شبکه، به‌ویژه محدودیت‌های پهنای باند و حساسیت به تراکم و از دست دادن بسته‌ها تحت بار بالا را نشان می‌دهد. . شرایط

۴٫۲٫ تجزیه و تحلیل آماری

تجزیه و تحلیل داده های اکتشافی (EDA) برای بررسی ویژگی ها و توزیع داده های ترافیک شبکه جمع آوری شده انجام شد. این تحلیل بر ارزیابی همبستگی بین معیارهای مختلف شبکه برای کشف الگوها و روندهای اساسی متمرکز بود. شکل ۲ یک ماتریس همبستگی را نشان می دهد که روابط بین معیارهای شبکه را نشان می دهد. توان عملیاتی همبستگی منفی متوسطی با تراکم (-۰٫۴۲) و درصد اشغال ویدیو (-۰٫۴۴) نشان داد، که نشان می دهد افزایش ازدحام و اشغال ویدیو با توان عملیاتی کمتر مرتبط است. علاوه بر این، ازدحام یک همبستگی مثبت قوی با از دست دادن بسته (۰٫۴۵) و درصد اشغال ویدیو (۰٫۷۰) نشان می دهد، به این معنی که با افزایش ازدحام، از دست دادن بسته و اشغال ویدیو نیز افزایش می یابد، که می تواند بر عملکرد شبکه تأثیر منفی بگذارد.

علاوه بر این، همانطور که انتظار می‌رفت، درصد اشغال ویدیو و نرخ بیت کاملاً همبستگی داشتند (۱٫۰۰)، زیرا نرخ بیت مستقیماً بر اشغال ویدیو تأثیر می‌گذارد. تعداد ویدیوها همبستگی متوسطی را با تراکم (۰٫۳۶) و از دست دادن بسته (۰٫۲۲) نشان می‌دهد که نشان می‌دهد تعداد بیشتری از جریان‌های ویدیویی همزمان ممکن است به افزایش ازدحام و از دست دادن بسته کمک کند.

علاوه بر این، شکل ۳ تجزیه و تحلیل دقیقی از معیارهای شبکه ارائه می دهد، که تغییرات در توان عملیاتی، تأخیر و لرزش را در ۱۰ سناریو برجسته می کند. زیرمجموعه اول توزیع توان عملیاتی را برای هر خوشه نشان می‌دهد و نشان می‌دهد که سناریوهایی با حداقل ترافیک شبکه – به ویژه سناریوهای پایه ۱، ۲، و ۷ – به بالاترین سطح توان دست یافتند. این مورد انتظار بود زیرا کاوشگر از حداکثر ظرفیت کانال زمانی که ترافیک ثانویه حداقل است استفاده می کند. در مقابل، سناریوهایی با ترافیک ثانویه بالاتر به دلیل محدودیت های اشتراک پهنای باند، توان عملیاتی را کاهش می دهند. علاوه بر این، توان عملیاتی در مسیرهای با بهترین تلاش (سناریوهای ۱ تا ۶) و مسیرهای بازگشتی (سناریوهای ۷ تا ۱۰) ثابت باقی ماند، که نشان می‌دهد نوع مسیر کمترین تأثیر را بر عملکرد توان دارد.

زیرمجموعه دوم تغییرات تأخیر را به تصویر کشید. تجزیه و تحلیل نشان داد که هر روتر تقریباً ۲ میلی ثانیه تأخیر ایجاد می کند. برای بهترین مسیرها، تأخیر مشاهده شده بین ۶ تا ۷ میلی ثانیه بود، در حالی که مسیرهای توسعه یافته تأخیر بین ۱۰ تا ۱۲ میلی ثانیه را نشان دادند. علاوه بر این، داده‌ها بسته به سروری که ترافیک ایجاد می‌کند، اختلاف تأخیر حدود ۲ میلی‌ثانیه را نشان می‌دهد که با افزودن یا حذف یک روتر در طول مسیر مطابقت دارد.

زیرمجموعه سوم رفتار جیتر را بررسی کرد. ماتریس همبستگی بالا نشان داد که بین جیتر و سایر متغیرها همبستگی معناداری وجود ندارد. مطابق با این مشاهدات، نمودارهای جیتر افزایش قابل توجهی را در سناریوهای ۴ و ۸ نشان دادند، که با دوره‌های بالاترین میانگین لرزش مشاهده‌شده در نمودار جیتر کلی همسو هستند. این افزایش‌ها در سناریوهایی با تعداد پرش‌های بالاتر رخ می‌دهد، و نشان می‌دهد که گره‌های اضافی در امتداد مسیر انتقال، احتمال نوسانات تاخیر را افزایش می‌دهند، بنابراین جیتر را افزایش می‌دهند. هر گره اضافی تاخیرهای بالقوه ای را معرفی می کند که به تغییرات لرزش مشاهده شده کمک می کند.

با توجه به تعداد بالای ویژگی‌ها در مجموعه داده، یک نمایش دوبعدی تنها با تکنیک‌های کاهش ابعاد، مانند t-SNE، عملی می‌شود. این روش کاهش ابعاد داده را امکان پذیر می کند، تجسم توزیع داده ها و روابط بین نقاط داده را تسهیل می کند، که از تجزیه و تحلیل عمیق تر الگوهای عملکرد شبکه و تعاملات ویژگی پشتیبانی می کند.

شکل ۴ تجسم های t-SNE مجموعه داده را نشان می دهد که توزیع نقاط داده را برای معیارهای مختلف شبکه نشان می دهد: توان عملیاتی، ازدحام، از دست دادن بسته، تأخیر، جیتر و برچسب های روتر. نمودار t-SNE برای توان عملیاتی، خوشه‌های مختلفی از نقاط داده را نشان می‌دهد، که نشان‌دهنده گروه‌بندی واضح بر اساس مقادیر توان است. بالاترین مقادیر در قسمت پایین سمت چپ نمودار قرار دارد، در حالی که کمترین مقادیر توان در ناحیه بالا دسته بندی می شود. این جداسازی نشان می‌دهد که عملکرد به‌طور قابل‌توجهی بر توزیع داده‌ها تأثیر می‌گذارد، با داده‌های توان عملیاتی بالاتر، خوشه‌های جداگانه‌ای را از داده‌های توان کمتر تشکیل می‌دهند.

نمودار تراکم نشان می دهد که مقادیر بالای تراکم شبکه در ناحیه بالای نمودار جمع شده اند. این خوشه بندی با الگوهای مشاهده شده در نمودارهای خروجی و از دست دادن بسته سازگار است، که در آن توان عملیاتی کم و تلفات بسته بالا با ازدحام زیاد همراه است. جداسازی واضح مقادیر تراکم نشان می دهد که تراکم شبکه یک عامل مهم در توزیع داده است.

نمودار از دست دادن بسته نشان می دهد که نقاط داده با بالاترین مقادیر از دست دادن بسته در ناحیه بالای نمودار قرار دارند. این الگو با نمودار توان منطبق است، جایی که نواحی با کمترین توان با مناطقی که بیشترین تلفات بسته را دارند مطابقت دارد. در مقابل، مقادیر تلفات بسته کمتر از ۳۰ درصد عمدتاً در ناحیه پایین سمت چپ یافت می‌شود، که نشان‌دهنده رابطه واضح بین تلفات بسته کم و توان عملیاتی بالاتر است.

نمودار t-SNE برای تأخیر نشان می دهد که نقاط داده به طور گسترده در سراسر نمودار توزیع شده اند، با مقادیر تأخیر بالاتر متمرکز در سمت راست، در حالی که مقادیر تأخیر کمتر عمدتاً در سمت چپ قرار دارند. در ناحیه میانی، هر دو مقدار زمان تاخیر بالا و پایین با هم مخلوط می شوند، که نشان دهنده توزیع متنوع تری در مقایسه با سایر معیارها است.

نمودار جیتر همان الگوهای خوشه بندی متمایز مشاهده شده در نمودارهای قبلی را نشان نمی دهد. این مورد انتظار بود زیرا جیتر با سایر متغیرهای مجموعه داده همبستگی معنی‌داری نداشت. توزیع مقادیر جیتر بالا پراکنده‌تر به نظر می‌رسد، که نشان می‌دهد جیتر تحت تأثیر عواملی غیر از عوامل مؤثر بر توان عملیاتی، از دست دادن بسته‌ها و ازدحام است.

آخرین نمودار مربوط به مسیر نقاط داده مطابق با دو مسیر اصلی در مجموعه داده است: مسیر بهترین تلاش (آبی) و مسیر توسعه یافته یا بازگشت (نارنجی). همانطور که در نمودار مشاهده می شود، مقادیر جیتر در مناطقی که تعداد روترهای بیشتری دارند بیشتر است، که با این استدلال که گره های اضافی تنوع تاخیر بیشتری ایجاد می کنند، در نتیجه جیتر را افزایش می دهد، سازگار است.


منبع: https://www.mdpi.com/2673-2688/5/4/143

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *