هوش مصنوعی | متن کامل رایگان | نظارت بر سلامت ساختار ترکیبی موثر از طریق مطالعه پارامتریک GoogLeNet

۱٫ مقدمه

سیستم‌های نظارت بر سلامت سازه همیشه نیازمند تشخیص کاستی‌های سازه‌ای مانند خوردگی، کاهش کشش یا ترک بوده‌اند. برای چند دهه، بازرسی بصری توسط متخصصان ماهر، روش اصلی شناسایی مشکلات ساختاری بوده است. این روش اغلب وقت گیر، پرخطر و پرهزینه است. در نتیجه، محققان به طور فزاینده‌ای به حسگرهای مبتنی بر بینایی کامپیوتری برای تشخیص آسیب‌های ساختاری به دلیل مزایای بزرگ آن‌ها نسبت به ارزیابی بصری دستی علاقه‌مند می‌شوند. این حسگرها استفاده از آستانه های کالیبره شده مناسب را در عملیات پردازش تصویر مانند تشخیص لبه و شناسایی ترک امکان پذیر می کنند.

تشخیص عیوب ساختاری، به‌ویژه ترک‌ها، در حال حاضر با استفاده از دو تکنیک اصلی پردازش تصویر به دست می‌آید: پردازش تصویر متوالی و دوتایی کردن تصویر. تصاویر می توانند طیف کافی از اطلاعات را ارائه دهند [۱]. لیو [۲] یک تکنیک باینریزه کردن تصویر را پیشنهاد کرد که برای یافتن ترک ها به اندازه کافی دقیق بود. تکنیک پردازش متوالی تصویر برای شناسایی موفقیت آمیز ترک ها در عکس های سطوح بتنی توسط ابراهیم خانلو استفاده شد. [۳]. با این حال، اکثر تکنیک‌های تشخیص لبه از طریق فیلترهای مختلف، از جمله رابرتز، پریویت، سوبل، و گاوسیان، در رویکردهای تشخیص شکست مبتنی بر دید برای سازه‌های بتنی استفاده شده‌اند. [۴]. این رویکردها معمولاً زمان‌بر هستند و فقط می‌توانند وجود ترک‌ها را در یک تصویر تشخیص دهند. آنها نمی توانند شدت ترک ها را به طور مستقیم ارزیابی کنند.

تحقیقات اخیر با هدف طبقه‌بندی و تجزیه و تحلیل عیوب ساختاری مانند ترک‌ها و خوردگی با استفاده از الگوریتم‌های یادگیری عمیق جدید برای غلبه بر کاستی‌های روش‌های تشخیص ترک مبتنی بر دید انجام شد. یک روش CNN توسط راوات و وانگ پیشنهاد شد [۵] برای طبقه بندی تصاویر چن و جهانشاهی با استفاده از رویکرد تلفیق داده های ساده بیز [۶] یک سیستم تشخیص شکستگی مبتنی بر CNN را پیشنهاد کرد و ترک‌هایی را از فریم‌های ویدئویی ضبط‌شده برای یک سازه با دقت در سطح پیکسل استخراج کرد. دورافشان و همکاران [۷] یک مدل CNN سریعتر با باینریزه کردن تصویر را پیشنهاد کرد. برای شناسایی و مکان یابی ترک ها، Soloviev و همکاران. [۸]لی و همکاران [۹]تانگ و همکاران [۱۰]و فن و همکاران [۱۱] مدل های عمیق CNN را برای شناسایی ترک ها و تعیین اندازه آنها ایجاد کرد.

از سوی دیگر، ویژگی‌های دینامیکی یک سازه، مانند فرکانس طبیعی، نسبت میرایی، و شکل حالت نیز ممکن است برای ارزیابی سلامت سازه و تعیین محل وقوع آسیب استفاده شود. تخریب سازه توزیع جرم و سختی سازه ها را تغییر می دهد و خواص دینامیکی آنها را تغییر می دهد. [۱۲,۱۳,۱۴]. روش‌های تشخیص آسیب ساختاری مبتنی بر ارتعاش با شناسایی سیستم می‌تواند برای ایجاد ارتباط بین ویژگی‌های ارتعاش و اطلاعات آسیب استفاده شود. [۱۵,۱۶,۱۷]به جز فرکانس های طبیعی به آسیب های جزئی حساس نیستند و به راحتی می توانند توسط عوامل محیطی آلوده شوند. به دنبال فرآیند فکری مشابه ارزیابی وضعیت ساختاری مبتنی بر تصویر، برخی از محققان همچنین شناسایی آسیب را از طریق مدل‌های یادگیری عمیق با ورودی داده‌های ارتعاشی بررسی کردند. لین، نی و ما [۱۸] یک تکنیک یادگیری عمیق مبتنی بر CNN را پیشنهاد کرد که دارای سه لایه حداکثر و شش لایه کانولوشن است. پس از آن، داده های ارتعاش خام از یک پرتو المان محدود برای آموزش این سیستم مبتنی بر CNN استفاده شد و آسیب به طور موثر با دقت بالای ۹۴٫۵۷٪ شناسایی شد. برخی از محققان با استفاده از روش مبتنی بر CNN توانستند آسیب های ناشی از گم شدن پیچ های یک خرپا فولادی را با دقت زیادی پیدا کنند. [۱۹,۲۰] و با استفاده از ورودی های شبکه حسگر بی سیم [۲۱].

هوش مصنوعی (AI) با امکان مدیریت دقیق تر، کارآمدتر و فعال تر زیرساخت ها، نقشی دگرگون کننده در پایش سلامت ساختاری ایفا می کند. از طریق الگوریتم‌های پیشرفته و تکنیک‌های یادگیری ماشین، هوش مصنوعی می‌تواند مقادیر وسیعی از داده‌های حسگرهای تعبیه‌شده در سازه‌ها (مانند پل‌ها، ساختمان‌ها و سدها) را تجزیه و تحلیل کند تا علائم اولیه مشکلات احتمالی را شناسایی کند. این قابلیت امکان ارزیابی بی‌درنگ یکپارچگی سازه، شناسایی ناهنجاری‌ها یا الگوهایی را که ممکن است نشان‌دهنده سایش، استرس یا آسیب باشد، می‌دهد. بسیاری از محققان از هوش مصنوعی و یادگیری ماشینی در بهینه سازی و نظارت بر فعالیت های ساخت و ساز استفاده کردند [۲۲,۲۳,۲۴]. مدل‌های هوش مصنوعی می‌توانند به نظارت بر ایمنی ساخت‌وساز و برنامه‌ریزی فعالیت‌های ساخت و ساز بسیار کمک کنند، که به کاهش حوادث ساخت‌وساز و کوتاه‌تر شدن زمان ساخت کمک کرده است. [۲۵].

در این تحقیق، هدف اصلی ما حول افزایش عملکرد GoogLeNet در هنگام ادغام تصاویر ترکیبی حاصل از داده‌های ارتعاشی مختلف و تصاویر آسیب است. با ادغام این داده های متمایز، می تواند یک چارچوب قوی و موثر ایجاد کند که قادر به تشخیص و تشخیص آسیب های سازه ای با دقت و کارایی بالا باشد. از طریق این رویکرد تلفیقی، ما تلاش می‌کنیم تا از اطلاعات تکمیلی موجود در هر دو نوع داده بهره‌برداری کنیم و از ویژگی‌های فضایی و طیفی تصاویر آسیب‌دیده همراه با علائم دینامیکی گرفته‌شده توسط داده‌های ارتعاشی استفاده کنیم. در عین حال، هدف ما بهینه سازی معماری GoogLeNet برای ادغام یکپارچه این ورودی های ناهمگن است. بر اساس منطق فوق، دستنوشته به شرح زیر سازماندهی شده است: در بخش ۱، مرور ادبیات و پیشینه پایش سلامت ساختاری با استفاده از داده های ترکیبی از منابع مختلف خلاصه شده است. در بخش ۲، GoogLeNet دقیق و پتانسیل آن در SHM گنجانده شده است. در بخش ۳، یک مطالعه پارامتری برای شناسایی کارآمدترین GoogLeNet انجام شد و عملکرد آنها بر روی داده های ترکیبی مقایسه شد. بخش ۴ نتیجه گیری مطالعه را ارائه می دهد.

۲٫ روش تحقیق

۲٫۱٫ تشخیص آسیب مبتنی بر یادگیری عمیق با استفاده از ترکیب داده های لرزش و تصاویر نقص

به طور معمول، سه بخش اصلی در یک شبکه عصبی کانولوشن برای شناسایی آسیب ساختاری از طریق داده های همجوشی وجود دارد، همانطور که در شکل ۱ نشان داده شده است، شامل (۱) مجموعه داده ها، (۲) آموزش مدل CNN، و (۳) اعتبار سنجی و پیش بینی. ارتعاشات در نقاط اندازه گیری تحت بارهای دینامیکی ابتدا در مدل ABAQUS بدست آمده و به تصاویر تبدیل می شوند. سپس این تصاویر ارتعاشی با تصاویر آسیب ساختار جفت می شوند تا به عنوان ورودی مدل GoogLeNet استفاده شوند.

پس از آن، تصاویر جفت شده با توجه به موارد آسیب های مختلف به عنوان الگوهای مختلف طبقه بندی می شوند و به طور تصادفی به سه گروه تقسیم می شوند که ۷۰ درصد آن برای آموزش، ۱۵ درصد برای اعتبار سنجی و ۱۵ درصد برای آزمایش است.

سه لایه‌ای که مدل پیشنهادی CNN را تشکیل می‌دهند، لایه پیچیدگی، لایه جمع‌آوری و لایه کاملاً متصل هستند. نورون های مصنوعی بر اساس سه بعد عمق، عرض و ارتفاع در این لایه ها قرار می گیرند. بخش شناسایی آسیب از تصاویر جفت شده در مکان های مختلف سازه استفاده می کند که به عنوان یک ماتریس دو بعدی به عنوان داده های ورودی آن نمایش داده می شود. سپس مدل CNN به طور مکرر از هر لایه عبور می کند تا ماتریس دو بعدی را به یک بردار تک بعدی مطابق با دسته تبدیل کند.

مؤلفه اساسی مدل CNN لایه کانولوشن است. هر بلوک کانولوشن دارای متغیرهایی است که می توان آنها را یاد گرفت، مانند بایاس ها و وزن ها (فیلترها). عمق فیلتر یکسان است، اما عرض و ارتفاع آن از نظر مکانی کمتر از ورودی است. به عنوان مثال، از آنجایی که تصویر RGB شامل سه لایه است، لایه کانولوشن باید دارای سه عمق برای بررسی هر یک از سه سطح جداگانه باشد. ویژگی های لایه قبلی با استفاده از فیلترها برای ایجاد خروجی درگیر است، که سپس با استفاده از تابع فعال سازی به ویژگی های جدید در لایه فعلی نگاشت می شود. لایه کانولوشن برای یک پیکسل از معادله زیر استفاده می کند:

$ج_{x y} = ص (\sum_{من = ۱}^{ساعت} \sum_{جی = ۱}^{w} \sum_{ک = ۱}^{د} f_{من جی ک} * X_{x + من ، y + جی - ۱ ، ک} + ب)$

(۱)

کجا X بردار ورودی مقادیر شدت تصویر است، ب بردار سوگیری است، ص تابع فعال سازی است و f ماتریس وزن است، و کجا ساعت و w اندازه های فیلتر هستند و د تعداد کانال های ورودی است.

شکل ۲ فرآیند پیچیدگی را بر روی یک ماتریس ۴×۴ به طور تصادفی انتخاب شده نشان می دهد. یک ماتریس ۳ × ۳ به عنوان فیلتر انتخاب می شود که به طور تصادفی در حالت اولیه تولید می شود و توسط یک الگوریتم انتشار به عقب از مدل به روز می شود.

چهار آرایه فرعی هم اندازه با لغزش در طول ماتریس ورودی و عرض و ارتفاع با گام ۱ ایجاد می شود. هر زیر آرایه در ماتریس فیلتر ضرب می شود. سپس مقدار خروجی که حاصل جمع مقادیر ضرب شده و بایاس است به دست می آید. به دلیل گام برداشتن، خروجی کمتر از لایه قبلی است. تابع فعال‌سازی غیرخطی که برای افزودن غیرخطی به شبکه استفاده می‌شود، بعد از لایه کانولوشن قرار می‌گیرد. واحد خطی اصلاح شده (ReLU)، softplus، tanh و Elu برخی از توابع فعال سازی هستند که اغلب در شبکه های عصبی به کار می روند. توابع مربوطه آنها به صورت زیر بیان می شود:

$f {(x)}_{من} = ل O g (۱ + ه^{x})$

(۳)

$f (x) = \frac{ه^{x} - ه^{- x}}{ه^{x} + ه^{- x}}$

(۴)

$f (x) = حداکثر (ه^{x} - ۱ ، x)$

(۵)

کجا f(x) تابعی است که می تواند نشان دهنده احتمال شلیک یا فعال شدن نورون ها در لایه اولیه بعدی باشد و x وضعیت نورون فعلی را نشان می دهد. این توابع در شکل ۳ نشان داده شده است.

بهینه ساز یکی از اجزای حیاتی فرآیند آموزش در نظر گرفته می شود. بهینه ساز وظیفه تنظیم پارامترهای شبکه را در طول فرآیند آموزش برای به حداقل رساندن عملکرد تلفات بر عهده دارد. بسیاری از بهینه سازها را می توان در آموزش استفاده کرد، مانند نزول گرادیان تصادفی (Sgdm)، تخمین تکانه تطبیقی (آدام)، و انتشار میانگین مربع ریشه (RmsProp). انتخاب بهینه ساز می تواند به طور قابل توجهی بر سرعت همگرایی و عملکرد مدل در کار مورد نظر تأثیر بگذارد. بنابراین، انتخاب یک بهینه ساز مناسب و تنظیم پارامترهای آن گام های اساسی در توسعه یک مدل موفق CNN است.

لایه نهایی قبل از لایه خروجی شبکه، لایه کاملا متصل است. تمام نورون های این لایه به ویژگی های ایجاد شده در لایه قبلی متصل هستند. ویژگی های تولید شده در این لایه از طریق وزن ها و بایاس ها به دسته های مربوطه تبدیل می شوند. معادله خروجی y^من به صورت زیر نشان داده شده است:

$y^{ل} = ص (y^{ل - ۱} * w + ب)$

(۶)

کجا ص تابع فعال سازی است. w و ب به ترتیب وزن ها و بردارهای سوگیری را در این لایه نشان می دهد. من مرحله تکرار است.

۲٫۲٫ روش یادگیری انتقالی استفاده شده است

GoogLeNet نوع خاصی از شبکه عصبی کانولوشن است که بر اساس مدل اولیه ساخته شده است. با استفاده از ماژول های آغازین، شبکه می تواند از بین انواع اندازه های فیلتر کانولوشن برای هر بلوک انتخاب کند. این ماژول ها با استفاده از یک شبکه کانولوشن روی هم قرار می گیرند، که گهگاه از لایه های max-pooling با گام ۲ برای کاهش وضوح شبکه به نصف استفاده می کند.

GoogLeNet بر روی بیش از یک میلیون تصویر آموزش دیده است و می تواند تصاویر را در ۱۰۰۰ دسته شی (مانند صفحه کلید، لیوان قهوه، مداد و بسیاری از حیوانات) طبقه بندی کند. این شبکه نمایش ویژگی های غنی را برای طیف وسیعی از تصاویر آموخته است. شبکه یک تصویر را به عنوان ورودی با ابعاد ۲۲۴ × ۲۴۴ می گیرد و سپس یک برچسب برای شیء موجود در تصویر همراه با احتمالات برای هر یک از دسته بندی های شیء خروجی می گیرد.

معماری GoogLeNet از ۲۲ لایه (۲۷ لایه شامل لایه های ادغام) تشکیل شده است که در جدول ۱ نشان داده شده است، و بخشی از این لایه ها در مجموع ۹ ماژول اولیه هستند، همانطور که در شکل ۴ نشان داده شده است. هر دایره قرمز یک لایه اولیه را نشان می دهد.

۲٫۳٫ میدان زاویه ای گرمیان (GAF)

الگوریتم GAF در حوزه داده‌های سری زمانی توسعه داده شد تا ویژگی‌ها را هنگام رمزگذاری سری‌های زمانی ۱ بعدی به تصاویر دو بعدی حفظ کند. دو روشی که می توان برای تکمیل GAF استفاده کرد، فیلد اختلاف زاویه ای گرمین (GADF) و فیلد مجموع زاویه ای گرمین (GASF) است. داده های ارتعاش هستند X = {x₁، x₂…، x_من…، x_n}، کجا n تعداد کل نقاط جابجایی و x_من مقدار جابجایی است. داده های طیفی ابتدا باید نرمال سازی شوند، تا محدوده ای از [۰, ۱]و به عنوان ثبت شد x_من_،n.

${x_{من}}_{n} = \frac{x_{من} - متر من n (X)}{متر الف x (X) - متر من n (X)}$

(۷)

سپس، با استفاده از فرمول زیر، دنباله طیفی ۱ بعدی در سیستم مختصات دکارتی به یک سیستم مختصات قطبی تبدیل می‌شود:

$f = الف r ج ج O س (x_{من ، n})$

(۸)

وابستگی زمانی در ماتریس گرمین حفظ می شود. بعد زمان در هندسه ماتریس کدگذاری می شود زیرا زمان با جابجایی موقعیت از گوشه سمت چپ بالا به گوشه سمت راست پایین افزایش می یابد. معادله (۸) نشان می دهد که زاویه تبدیل شده است ϕ دارای محدوده ارزشی است [۰, π] و اینکه مقدار کسینوس به طور یکنواخت در این محدوده کاهش می یابد. افزایش زمان مطابق با شعاع در سیستم مختصات قطبی است، در حالی که x_من در هر سیستم مختصات دکارتی به مقدار زاویه در سیستم مختصات قطبی پاسخ می دهد و خمش مربوطه بین نقاط مختلف زاویه روی دایره مختصات قطبی صورت می گیرد. بنابراین، میدان جمع زاویه ای گرمین (GASF) را می توان با محاسبه مقدار کسینوس مجموع زوایای بین نقاط مختلف، به صورت زیر بدست آورد (معادله (۹)):

$جی الف اس اف = [\cos (φ_{i} + φ_{j})] = (\begin{matrix} \cos (φ_{۱} + φ_{۱}) & \dots & \cos (φ_{۱} + φ_{n}) \\ ⋮ & ⋱ & ⋮ \\ \cos (φ_{n} + φ_{۱}) & \dots & \cos (φ_{n} + φ_{n}) \end{matrix}] = {\tilde{x}}_{i} . {\tilde{x}}_{j} - \sqrt{۱ - {\tilde{x}}_{i}^{۲}} \sqrt{۱ - {\tilde{x}}_{j}^{۲}} = {\tilde{X}}^{T} \tilde{X} - {\sqrt{۱ - {\tilde{X}}^{۲}}}^{T} \sqrt{۱ - {\tilde{X}}^{۲}}$

(۹)

where I is the unit vector. ${\tilde{X}}_{i}$ is the normalized vibration data, and φ is the angle of the point.

An example employing vibration data from the steel truss model’s ABAQUS model is shown in Figure 5a. The suggested GASF is used to transform the vibration into images, and the resulting images include several distinct elements, including the lines and points that are indicated in Figure 5b. Red color indicates higher value locations while blue colors stand for the low value locations and green colors stand for the intermediate value locations.

۵٫ Conclusions

In conclusion, this paper aimed to enhance the efficiency and accuracy of a new structure health monitoring method that utilizes infused images from vibrations and visual inspections through a parametric study of the GoogLeNet architecture. By leveraging deep learning techniques, this study sought to optimize the performance of the network by manipulating four key parameters: the number of inception modules, activation function, optimizer, and learning rate. Notably, employing eight inception modules achieved superior performance with less computational time compared to using nine inception layers. Additionally, the Rectified Linear Unit (ReLU) activation function emerged as the most effective choice, while the Stochastic Gradient Descent with Momentum (SGDM) optimizer and a learning rate of 0.001 showed superior performance. By integrating these findings, an efficient and effective new structural health monitoring method was found through optimization of the GoogLeNet model. This study not only provides valuable insights into structural health monitoring techniques but also underscores the importance of deep learning models to achieve superior model performance.

In future work, case studies with real structures of different damage conditions will be conducted. The effects of paired image sizes, other hyperparameters of the GoogLeNet model, and different sizes of training data set are not studied in this manuscript, and we hope to explore them.

منبع: https://www.mdpi.com/2673-2688/5/3/75