۱٫ مقدمه
اطلاعات اجتماعی و جمعیت شناختی مشتریان برای ارتقای کیفیت سیاست گذاری، بازاریابی و عملکرد سیستم شبکه های هوشمند مهم است. به عنوان مثال، خرده فروشان خدمات شهری می توانند از این اطلاعات برای تصمیم گیری آگاهانه در مورد برنامه های پاسخگویی به تقاضا و بهره وری انرژی استفاده کنند. مطالعات قبلی نشان دادهاند که ویژگیهای اجتماعی-دموگرافیک خانوارها میتواند بر استفاده از لوازم خانگی تأثیر بگذارد [۱]. درک اطلاعات اجتماعی و جمعیت شناختی خانوارها همچنین می تواند دقت پیش بینی بار منطقه را بهبود بخشد. [۲]. بر اساس اطلاعات اجتماعی و جمعیتی، برنامههای مقرون به صرفه انرژی و سیاستگذاران میتوانند علل بار بالای انرژی بر خانوارهای کمدرآمد را شناسایی کرده و برنامهها و سیاستها را بر این اساس برای کاهش بار آنها تنظیم کنند. [۳,۴].
به طور سنتی، نظرسنجی ها برای به دست آوردن اطلاعات اجتماعی و جمعیت شناختی مشتریان به کار گرفته می شدند، اما زمان بر و مقرون به صرفه هستند. با این حال، الگوی مصرف برق می تواند به طور قابل توجهی تحت تأثیر ویژگی های اجتماعی و اقتصادی مصرف کنندگان باشد. توسعه زیرساخت اندازهگیری پیشرفته (AMI) امکان جمعآوری مقادیر زیادی از دادههای مصرف برق بلادرنگ را فراهم میکند که منجر به افزایش روشهای مبتنی بر داده در سالهای اخیر برای استنباط اطلاعات اجتماعی و جمعیتشناختی از دادههای مصرف برق شده است. [۵,۶,۷,۸,۹,۱۰,۱۱,۱۲,۱۳,۱۴].
روشهای معمول شناسایی اطلاعات اجتماعی-دموگرافیک مبتنی بر دادهها شامل استخراج ویژگی، انتخاب ویژگی، و طبقهبندی یا رگرسیون است. به عنوان مثال، بکل و همکاران. [۵] یک سیستم تخمین خصوصیات خانوار به نام CLASS را پیشنهاد کرد که ویژگیها را استخراج و انتخاب میکند و ویژگیهای خانوار را بر اساس آنها شناسایی میکند. بکل و همکاران [۶] کار قبلی را با رگرسیون برای تخمین مقادیر پیوسته خصوصیات خانوار از طریق استخراج و انتخاب ویژگی گسترش داد. هاپف و همکاران [۷] یک سیستم کلاس پیشرفته به نام eClass را پیشنهاد کرد که تعداد ویژگیهای سیستم کلاس را چهار برابر میکند و از روشهای فیلتر ویژگی برای بهبود عملکرد طبقهبندی استفاده میکند. فهیم و سیلیتی [۱۰] چارچوبی برای استنباط ویژگیهای خانوار ایجاد کرد که ویژگیها را از دادههای مصرف انرژی سری زمانی استخراج میکند و از جنگل تصادفی (RF) برای طبقهبندی استفاده میکند. در [۹]تجزیه و تحلیل تطابق درجه (GCA) با خوشهبندی و تجسم خلفی برای استخراج ویژگیهای مهم از دادههای مصرف انرژی و تغذیه ویژگیها در سه طبقهبندی مختلف، از جمله شبکه عصبی مصنوعی (ANN)، نزدیکترین همسایه k (kNN) و بردار پشتیبانی استفاده شد. ماشین (SVM)، برای شناسایی ویژگی های خانوار. یان و همکاران [۱۱] یک رویکرد کارآمد برای شناسایی ویژگیهای خانوار با استفاده از دادههای کنتور هوشمند با ترکیب ویژگیهای زمان-فرکانس و استفاده از الگوریتم RF برای انتخاب ویژگی، به دنبال طبقهبندیکننده SVM، که منجر به بهبود عملکرد در مقایسه با روشهای مرسوم میشود، پیشنهاد کرد.
اخیراً، یادگیری عمیق به عنوان یک راه حل امیدوارکننده برای استخراج خودکار اطلاعات متمایز از داده های سری زمانی، از جمله داده های مصرف انرژی ظاهر شده است. [۱۵,۱۶]. چندین مطالعه پتانسیل یادگیری عمیق را در شناسایی اطلاعات اجتماعی و جمعیت شناختی مبتنی بر داده بررسی کرده اند. به عنوان مثال، وانگ و همکاران. [۸] یک شبکه عصبی کانولوشنال (CNN) را برای خودکارسازی فرآیند استخراج ویژگی برای شناسایی اطلاعات اجتماعی-جمعیتشناختی، با استفاده از فراوانی دادههای ریز دانه مصرف برق در زمان واقعی توسعه داد. در مطالعه ای توسط وانگ و همکاران. [۱۳]مدلهای سیانان مبتنی بر عملیات پیچش ۱ بعدی یا ۲ بعدی برای استخراج ویژگیها از دادههای کنتور هوشمند برای شناسایی اطلاعات اجتماعی و جمعیتشناختی مصرفکنندگان مورد بررسی قرار گرفتند. علاوه بر این، Xu و همکاران. [۱۴] یک مدل عمیق ارائه شده است که نقاط قوت CNN و حافظه کوتاه مدت بلند مدت (LSTM) را برای گرفتن ویژگیهای زمانی و مکانی از دادههای مصرف انرژی برای شناسایی اطلاعات اجتماعی – جمعیتی ترکیب میکند. این آثار اثربخشی روشهای مبتنی بر یادگیری عمیق را در استخراج ویژگیهای متمایز در مقایسه با روشهای مبتنی بر مهندسی ویژگیهای دستی سنتی نشان میدهند.
یکی از محدودیتهای اولیه روشهای مبتنی بر یادگیری عمیق فعلی که برای شناسایی اطلاعات اجتماعی و جمعیتشناختی مبتنی بر داده استفاده میشود، در وابستگی آنها به معماریهای شبکه عصبی عمیق (DNN) طراحیشده دستی نهفته است، که تواناییهای آنها را در گرفتن الگوهای زمانی و مکانی ضروری مورد نیاز محدود میکند. . برای شناسایی دقیق اطلاعات اجتماعی و جمعیت شناختی مختلف. برای غلبه بر این اشکال، ما یک رویکرد جدید را در این مقاله پیشنهاد میکنیم که از قدرت جستجوی معماری عصبی (NAS) برای کشف خودکار معماریهای DNN که بهطور خاص برای شناسایی اطلاعات مختلف اجتماعی-دموگرافیک طراحی شدهاند، استفاده میکند. NAS یک تکنیک یادگیری ماشین خودکار (AutoML) است که فرآیند طراحی را برای یافتن معماریهای DNN قوی و با کارایی بالا برای کاربردهای مختلف علمی و مهندسی خودکار میکند. [۱۷,۱۸,۱۹,۲۰]. ما یک معماری DNN کشف شده را SEACAT-Net نام گذاری می کنیم که این است دریااز فضای جستجویی که بر اساس یک رمان طراحی شده است جتجارت درکاملا کانولوشنال مبتنی بر قصد خالصمعماری کار (CAFCN).
تحقیق ما سه مشارکت اصلی دارد. در مرحله اول، ما یک فضای جستجو را با استفاده از یک معماری جدید CAFCN طراحی کردیم، که امکان ثبت موثر الگوهای زمانی و مکانی موجود در دادههای متر هوشمند را برای شناسایی اطلاعات اجتماعی-جمعیتی فراهم میکند. ثانیا، ما یک استراتژی جستجوی مبتنی بر بهینهسازی بیزی (BO) را برای کاوش و انتخاب معماری با عملکرد بالا برای یک تحقیق اطلاعات اجتماعی-جمعیتی معین ایجاد کردیم. در نهایت، ما عملکرد روش پیشنهادی خود را با استفاده از مجموعه دادههای متر هوشمند به طور گسترده مورد ارزیابی قرار دادیم و آن را با مجموعهای از خطوط پایه پیشرفته مقایسه کردیم و عملکرد برتر آن را در شناسایی اطلاعات اجتماعی و جمعیتشناختی مبتنی بر دادهها نشان دادیم.
بقیه این مقاله به شرح زیر سازماندهی شده است: بخش ۲ روش پیشنهادی مبتنی بر NAS را برای کشف معماریهای SEACAT-Net با عملکرد بالا، شامل طراحی فضای جستجو، استراتژی جستجوی مبتنی بر BO، و استراتژی ارزیابی معماری ارائه میکند. بخش ۳ ابتدا مجموعه دادههای متر هوشمند مورد استفاده در آزمایشهای ما را تشریح میکند و سپس جزئیات پیادهسازی و مدلهای پایه را برای مقایسه عملکرد توضیح میدهد. در بخش ۴، نتایج تجربی برای نشان دادن اثربخشی و عملکرد برتر روش پیشنهادی ارائه شده است. در نهایت، این مقاله را در بخش ۵ به پایان میرسانیم.
۵٫ نتیجه گیری
در این مقاله، ما یک روش مبتنی بر NAS را برای طراحی خودکار معماریهای DNN با عملکرد بالا پیشنهاد میکنیم تا به چالش شناسایی اطلاعات اجتماعی-جمعیتشناختی مشتری با استفاده از دادههای متر هوشمند پرداخته شود. فضای جستجو بر اساس معماری جدید CAFCN ساخته شده است که ترکیبی از FCN و مکانیسم توجه کانال است. ما یک الگوریتم جستجوی مبتنی بر BO را برای کشف موثر معماریهای با کارایی بالا در این فضای جستجو ایجاد کردیم. معیار ارزیابی به کار رفته در الگوریتم جستجو عبارت است از امتیاز، که برای پرداختن به داده های نامتعادل که معمولاً در مشکلات شناسایی اطلاعات اجتماعی و جمعیت شناختی با آن مواجه می شوند، مناسب است.
ارزیابی عملکرد و آزمایشهای مقایسه با استفاده از مجموعه دادههای متر هوشمند که به طور گسترده در جامعه تحقیقاتی شناخته شده است، انجام شد. نتایج نشاندهنده برتری روش پیشنهادی ما نسبت به رویکردهای مبتنی بر یادگیری ماشین و روشهایی است که از معماریهای DNN طراحیشده دستی استفاده میکنند. با این حال، شناسایی اطلاعات اجتماعی-دموگرافیک مشتری صرفاً از دادههای کنتور هوشمند همچنان یک چالش بزرگ است، همانطور که نتایج ما نشان میدهد که فضای قابل توجهی برای بهبود عملکرد نشان میدهد. کار آینده ما شامل ترکیب تکنیکهای پیشرفتهتر یادگیری عمیق در فضای طراحی و در نظر گرفتن الگوهای فصلی در دادههای مصرف انرژی برای افزایش بیشتر عملکرد شناسایی است.
منبع: https://www.mdpi.com/2673-2688/6/1/9