۱٫ معرفی
تحلیلگران عملکرد در تیم های ورزشی حرفه ای به طور فزاینده ای ملزم به تجزیه و تحلیل مجموعه های بزرگی از داده های ورزشکاران برای بدست آوردن بینشی هستند که منجر به مزیت رقابتی نسبت به رقیب می شود. [۱]. تجزیه و تحلیل عمیق ورزش های تیمی به دلیل پیشرفت در فناوری حسگر و قدرت محاسباتی در حال افزایش است [۲,۳,۴]. اولین مرحله از همه آنالیزها ردیابی دقیق بازیکنان در زمین است. این را می توان با داده های حسگر مانند GPS، LPS، یا IMU یا استفاده از ویدئو به دست آورد [۳]. مفهوم ردیابی داده ها به داده های مکانی – زمانی اشاره دارد که موقعیت توپ و/یا بازیکن را در طول یک رویداد ورزشی توصیف می کند. [۵]. استفاده از داده های ویدئویی با دسترسی آسان برای استخراج داده های مکانی-زمانی دوبعدی به طور فزاینده ای محبوب است. برای این منظور، روشهای بینایی کامپیوتری در ورزشهای متعدد به کار گرفته شده است که بیشترین کاربرد آن در فوتبال و بسکتبال است. [۲]. هدف محققان و متخصصان ورزش تنها با استفاده از داده های ویدئویی، درک بهتر رفتار تاکتیکی و تعاملات یک تیم یا فرد است. [۵,۶] یا برای حمایت از تصمیم گیری مربوط به عملکرد و خطر آسیب [۴].
برای نتایج معنی دار، مهم است که خواسته ها و محدودیت های ورزش های تیمی خاص را در نظر بگیرید [۴]. قوانین استرالیا فوتبال (AF) چالشهایی را فراهم میکند که نمیتوان آنها را در ورزشهای تیمی که بیشتر مورد بررسی قرار میگیرند، مانند فوتبال و بسکتبال پیدا کرد: در AF، ۳۶ بازیکن در زمینی هستند که اندازه آن در استادیومهای مختلف یکسان نیست، که یک محدودیت منحصربهفرد برای این ورزش است. . ابعاد زمین های مورد استفاده در لیگ حرفه ای فوتبال استرالیا (AFL) از ۱۷۵ متر طول و ۱۴۵ متر عرض (ورزشگاه دانشگاه تاسمانی) تا ۱۵۵ متر در ۱۳۶ متر (زمین کریکت سیدنی) متغیر است. میانگین طول و عرض زمین های AFL به ترتیب ۵٫۹ ± ۱۶۳٫۶ متر و ۶٫۹ ± ۱۳۲٫۱ متر است. [۴]. برای ارائه اطلاعات موقعیت مکانی بازیکنان، همه بازیکنان به یک واحد GPS تجاری مجهز هستند، اما تیم های حرفه ای فقط می توانند به داده های GPS تیم خود دسترسی داشته باشند، در حالی که اطلاعات محدود یا بدون هیچ یک از تیم های AF مخالف در دسترس است. بنابراین، تجزیه و تحلیل تاکتیکی پیشرفته کنونی را نمی توان به راحتی انجام داد، زیرا مکان تیم AF مخالف نامشخص است. در نتیجه، علیرغم فراگیر بودن دادههای GPS، تجزیه و تحلیل رفتار جمعی مخالف در AF در حال حاضر به تجزیه و تحلیل ویدیوی دوبعدی معمولی، یک فرآیند دستی و زمانبر محدود شده است. بنابراین، فناوری بینایی کامپیوتر فرصتی هیجان انگیز برای غلبه بر این مشکل در AF ارائه می دهد [۷,۸,۹].
چالشهای عمده روشهای مبتنی بر بینایی، وابستگی آنها به محیط است – آنها مستعد تغییرات مکرر در سرعت ورزشکاران و انسداد در بازیهای شلوغ، تغییر در نور زمین و شباهتهای ظاهری هم تیمیها هستند. [۲,۳]. علاوه بر این، چالش منحصر به فرد اندازههای مختلف میدان در ترکیب با اندازه میدان بزرگ که نیاز به دوربینهای متعدد دارد، استفاده از روشهای مرسوم ردیابی بازیکن را غیرممکن میکند. [۴]. بنابراین، مراحل مختلف پیش پردازش برای ردیابی موفقیت آمیز ورزشکاران ضروری است [۱۰,۱۱]. تکنیک های توصیه شده شامل موارد زیر است: (۱) حذف سایه ها برای مبارزه با تغییرات در شرایط نوری [۱۲]; (۲) استفاده از تنظیمات دوربین متعدد برای اطمینان از اینکه همه ورزشکاران در حین فیلمبرداری در میدان دید هستند [۱۳]; (۳) استفاده از مدل های تشخیص اشیا از قبل آموزش دیده [۱۴,۱۵,۱۶]; (۴) و مدل های تشخیص شماره پیراهن برای تشخیص و شناسایی ورزشکاران فردی [۱۷].
دو روش مبتنی بر بینایی کامپیوتری به طور منظم برای به دست آوردن مکان ورزشکاران در زمین استفاده می شود تشخیص ردیابی تعبیه شده و ردیابی با تشخیص [۱۱]. شناسایی ورزشکاران بخشی از خط لوله ردیابی است تشخیص ردیابی تعبیه شده [۷,۱۸,۱۹]در مقایسه با پیاده سازی های یادگیری عمیق مدرن، به عنوان یک روش دستی پرهزینه در نظر گرفته می شود [۸,۲۰]. فرآیند ردیابی با استخراج زمین بازی با استفاده از ترکیبی از تکنیکهای بینایی رایانهای اولیه، مانند تفریق پسزمینه، تشخیص لبهها و استخراج کانتور آغاز میشود. [۷,۸,۲۱] تا اطمینان حاصل شود که استخراج ویژگی های بعدی سوژه های ردیابی (معمولاً رنگ، شکل و ویژگی های مسیر) بدون تغییرات در ظاهر زمین بازی و سر و صدای تماشاگران و بنرهای تبلیغاتی است. یکی از نمونههای این رویکرد، ردیابی ورزشکاران در فوتبال در فریمهای ویدیویی با استفاده از ویژگیهای Haar مانند است [۱۹]به عنوان تفاوت در شدت پیکسل مجموع مناطق مستطیلی مختلف در سراسر موضوعات ردیابی تعریف شده است. [۲۲]. یک مثال جدیدتر که بر اساس این رویکرد ساخته شده است، استفاده از فیلترهای ذرات به عنوان روش استخراج ویژگی است که تفاوت در شدت پیکسل بین مناطق کوچکتر را در مقایسه با ویژگی های Haar مانند در نظر می گیرد. [۲۳]. تشخیص لکه [۲۴,۲۵]آشکارسازهای اوتسو [۱۲]و بردارهای حرکتی [۲۶] همچنین معمولاً از روشهای استخراج ویژگی استفاده میشود تشخیص ردیابی تعبیه شده. ورزشکاران با مرتبط کردن ویژگیهای مشابه در فریمها، مانند تشخیص لبه، ردیابی میشوند [۱۲]ویژگی های توپوگرافی سه بعدی [۲۵]و الگوریتم های ردیابی اپراتور پیچیدگی کارآمد (ECO). [27,28].
ردیابی با تشخیص تفاوت با رویکردهای فوق در این است که ابتدا ورزشکاران را در تصویر ورودی قبل از ارسال تشخیص به ردیابهای شی مستقل تشخیص میدهد. [۱۴,۱۵]. این رویکرد منجر به بهبود دقت می شود زیرا ظاهر و مکان ورزشکار قبل از استفاده از الگوریتم ردیابی شناخته شده است. با این حال، دقت روشهای ردیابی مستقل به شدت به دقت آشکارساز بستگی دارد، به این معنی که استفاده از آشکارساز شی که برای کار مورد نظر بهینه شده است تا بهترین نتایج ردیابی را به دست آورد، بسیار مهم است. تکنیکهای یادگیری عمیق مبتنی بر شبکههای عصبی کانولوشن نتایج امیدوارکنندهای را در تشخیص اشیا نشان دادهاند [۲۹]و آشکارسازهای افراد از قبل آموزش دیده شکل محبوبی از آشکارسازهای شی هستند زیرا از نیاز به آموزش از ابتدا جلوگیری می کنند. به عنوان مثال، هیستوگرام آشکارسازهای فرد مبتنی بر گرادیان گرا [۳۰]شبکه عصبی کانولوشنال سریعتر بازگشتی (یک معماری پیشرفته آشکارساز شی [۳۱]) و یک آشکارساز شی سریعتر به نام You Only Look Once (YOLO) [32,33] که برای تشخیص افراد در تصاویر و فیلم ها آموزش دیده اند، همگی برای شناسایی ورزشکاران در زمینه های ورزشی استفاده شده اند. شناساییها متعاقباً به الگوریتمهای ردیابی تعیینشده، مانند ماشینهای بردار پشتیبان، شبکههای عصبی حافظه کوتاهمدت منتقل شدند. [۳۴]و ردیابی ساده آنلاین و بلادرنگ با متریک ارتباط عمیق (DeepSORT) [35]برای ردیابی ورزشکاران در فریم های ویدئویی [۹,۱۵,۳۶].
پیشرفت های قبلی در ردیابی حرکات ورزشکاران با استفاده از روش های مبتنی بر بینایی کامپیوتری، ورزش هایی را مورد بررسی قرار داده است که در آن ابعاد زمین بازی در سراسر عرصه های مسابقه ثابت می ماند. علاوه بر این، مرزهای زمین بازی در تحقیقات قبلی همگی به شکل مستطیل هستند، مانند زمینهای بازی و زمینهایی که در فوتبال، بسکتبال و اسکواش با آن مواجه میشوند. [۲۵,۳۷,۳۸,۳۹,۴۰]به منظور ساده سازی تا حد زیادی فرآیندهای فنی مورد نیاز برای تعیین موقعیت نسبی میدان ورزشکاران شناسایی شده [۴]. اکثر آثار موجود نیز از دوربینهای ثابت استفاده میکنند که مسائل مربوط به تغییر پسزمینه، اعوجاجهای ظاهری و حرکت دوربین را که از عملکردهای پان، شیب و زوم اپراتور ناشی میشود، به حداقل میرساند و در برخی موارد حذف میکند. [۱۰]. این چالشها در AF به دلیل تفاوتهای مجاز در شکل و اندازه زمین در استادیومها تقویت میشوند. [۴۱]و استفاده از دوربین های متحرک، شیب، و زوم متعددی که به صورت دستی کار می کنند که در آنها کل زمین بازی به ندرت در میدان دید کامل قرار می گیرد. انسداد مکرر ورزشکاران نیز به دلیل ماهیت تماس کامل این ورزش یکی از ویژگی های رایج فیلم های ویدئویی است. این محدودیتها بهشدت بر عملکرد روشهای ردیابی فوقالذکر تأثیر میگذارد و مانع از کاربرد روشهای تشخیص و ردیابی ورزشکار در AF میشود. [۴]. یک مطالعه از یک آشکارساز شخصی سفارشی و طبقهبندی تیم برای تشخیص استفاده کرد و سپس ورزشکاران را در فریمهای ویدیوی پخش شده با ترکیبی از فیلترهای کالمن و تکنیکهای به حداقل رساندن انرژی ردیابی کرد. [۴۲]. نتایج این بررسی برای غلبه بر تغییرات در شرایط نوری و انسداد مکرر ورزشکاران تلاش کرد.
دادههای ردیابی ورزشکاران، از سیستم موقعیتیابی جهانی (GPS) گرفته تا دستگاههای سیستم موقعیتیابی محلی (LPS)، بر چالشهای فوقالذکر غلبه میکنند که فیلمهای ویدیویی مسابقات AF را تحت تأثیر قرار میدهند. [۴۳]. با این حال، دادههای خام ردیابی ورزشکاران از تیمهای مخالف برای تیمهای حرفهای AF در دسترس نیست، به این معنی که برای به دست آوردن این اطلاعات به یک روش جایگزین نیاز است. منحصر به فرد برای حرفه ای AF، در دسترس بودن تجاری انیمیشن های داده های GPS ورزشکاران از تمام مسابقات حرفه ای AF، که شامل تیم های مخالف است، توسط Champion Data، ارائه دهنده آمار رسمی لیگ فوتبال استرالیا است. ورزشکاران به صورت دایره هایی از دید پرنده از زمین بازی نشان داده می شوند (شکل ۱، سمت راست بالا)، که کار ردیابی ورزشکاران را ساده می کند زیرا مسائل مربوط به تغییرات نور، تغییر در ظاهر ورزشکاران، تفاوت های مبهم بین هم تیمی ها، مناطق مسدود شده را حذف می کند. زمین بازی و اعوجاج دوربین. در نتیجه، داده های ردیابی ورزشکاران متحرک فرصت منحصر به فردی را برای کاربرد مدرن فراهم می کند ردیابی با تشخیص تکنیک.
هدف از این مطالعه فنی توسعه یک ردیابی با تشخیص تکنیک برای به دست آوردن موقعیت های مربوط به میدان ورزشکاران AF با استفاده از انیمیشن های پخش کننده بر اساس سیگنال های GPS. ما بیشتر ضرایب تبدیل مختصات پیکسل به دکارتی را منحصر به فرد برای هر استادیوم ایجاد خواهیم کرد. این نرم افزار جدید از ردیابی با تشخیص تجزیه و تحلیل تاکتیکی رفتار تیم جمعی مخالف و توسعه ابزارهای طراحی بازی تعاملی در AF را امکان پذیر می کند.
۴٫ بحث
هدف از این تحقیق توسعه یک ردیابی با تشخیص تکنیکی برای به دست آوردن موقعیت های مربوط به میدان ورزشکاران AF بر اساس انیمیشن های تجاری مبتنی بر GPS موجود در بازیکنان و ایجاد معادلات تبدیل مختصات پیکسل به دکارتی منحصر به فرد برای هر استادیوم AF. با توجه به اندازه های گسترده زمین در AF، روش های استاندارد ردیابی نوری را نمی توان در AF اعمال کرد [۳]. بنابراین سیستمهای ردیابی ورزشکاران تا حد زیادی به دادههای GPS محدود شدهاند که برای تیم مقابل در دسترس نیست. از این رو، روش جدید با استفاده از داده های متحرک GPS ارائه شده در این تحقیق اولین گام ارزشمند برای تجزیه و تحلیل رفتار تاکتیکی هر دو تیم بازی کننده است.
دقت بالای آشکارساز ورزشکار سفارشی (mAP 0.94، دقت ۰٫۹۵، فراخوانی ۰٫۹۷، F1-score 0.96) با تلاش های موفقیت آمیز قبلی برای کارهای مشابه قابل مقایسه بود. [۳,۹,۱۴,۱۷,۵۳]. این نتایج از این موضع حمایت می کند که تنظیم دقیق یک آشکارساز چند شی برای تشخیص فوکوس خودکار ورزشکار در انیمیشن ها کافی است. با توجه به حجم داده ها و زمان مورد نیاز برای آموزش یک آشکارساز شی چندگانه کاملاً سفارشی شده از ابتدا، مناسب ترین رویکرد استفاده از یک آشکارساز شی از پیش آموزش دیده و تنظیم دقیق مدل در مجموعه داده سفارشی ما بود. [۱۶]. به این ترتیب، زمان آموزش کاهش یافت و همچنین نتایج مطلوبی با کاهش حجم داده به دست آورد. کار آینده در این زمینه ممکن است آشکارسازهای چند شی مختلف را مقایسه کند، به عنوان مثال، [۵۴,۵۵,۵۶,۵۷]، برای بهبود دقت تشخیص و کاهش زمان صرف شده برای استنتاج. علاوه بر این، مدل توسعهیافته در این مطالعه ممکن است برای تولید مجموعه دادههای تشخیص ورزشکار بزرگتر مورد استفاده قرار گیرد تا بتواند یک آشکارساز شی چندگانه را از ابتدا به عنوان وسیلهای برای مقایسه آموزش دهد. مجموعه داده همچنین باید به گونه ای گسترش یابد که تیم های متعددی را شامل شود تا کاربرد روش آشکارساز ورزشکار ارائه شده در اینجا افزایش یابد.
استفاده از یک عدد خوان دو رقمی سفارشی برای شناسایی شماره بازیکنان هر ورزشکار ردیابی شده، مشابه رویکرد یون و همکاران (۲۰۱۹) [۱۷]تفاوت اساسی با قبلی داشت ردیابی با تشخیص روش های مورد استفاده در ورزش [۹,۱۵,۳۶] و به دقت بالای ۰٫۹۸ دست یافت. اگرچه ترکیبی از استفاده از چندین معماری یادگیری عمیق جداگانه در خط لوله ردیابی ورزشکار، فرآیند کارآمدی نیست، عملکرد خوب امکان تعیین ضرایب تبدیل مختصات پیکسل به دکارتی مخصوص استادیوم را فراهم میکند که میتواند در تحقیقات آینده مورد استفاده قرار گیرد. مدلهای ردیابی از پیش آموزشدیدهشده قبلی [۱۵,۳۵] به دلیل منحصر به فرد بودن مجموعه داده (یعنی ورزشکاران به صورت نقاط با اعداد بازی نمایش داده می شوند) در مقایسه با داده های مورد استفاده برای توسعه روش های ردیابی منبع باز (یعنی تصاویر دنیای واقعی از انسان) برای پیاده سازی در مطالعه فعلی مناسب نبودند. . کاربرد مدلهای ردیابی از پیش آموزشدیده شده باید با استفاده از روش فعلی برای تولید دادههای مورد نیاز برای آموزش مدلهای ردیابی سفارشی ویژه AF مورد بررسی قرار گیرد. با انجام این کار، کار آینده ممکن است جایگزین و کارآمدتر شود ردیابی با تشخیص مواد و روش ها.
ضرایب گروهبندی استادیوم معادلات تبدیل پیکسل به مختصات دکارتی (جدول ۱) تغییرپذیری کم را نشان میدهد، در نتیجه یک روش مخصوص استادیوم برای تبدیل مختصات پیکسل به مختصات دکارتی مربوط به میدان ایجاد میکند. تفاوتهای جزئی در مقیاسبندی و ضرایب ترجمه بین استادیومها، استحکام رویکرد را در محاسبه اندازههای مختلف میدان مورد استفاده در AF نشان داد. [۴۱].
میانگین دقت موقعیتی رویکرد فعلی (۲٫۶۳ متر) در مقایسه با دقت گزارش شده دستگاه های GPS و LPS رایج در نظر گرفته می شود (به ترتیب ۰٫۴۹ ± ۰٫۹۶ متر و ۰٫۰۷ ± ۰٫۲۳ متر). [۴۳]). با این حال، مشاهده شد که تفاوتهای موقعیتی بین مختصات پیکسل تبدیلشده و مختصات دکارتی GPS از نظر ماهیت سیستماتیک بودند (یعنی بزرگی و جهت برای هر ورزشکار شناساییشده سازگار بود). این مشاهدات نشان می دهد که فاصله اقلیدسی بین مختصات پیکسل تبدیل شده و مختصات دکارتی GPS را می توان با تنظیم دقیق معادلات تبدیل کاهش داد. علاوه بر این، بدیهی است که رویکرد جدید منجر به موارد پرت قابل توجهی می شود (شکل ۴) که به اشتباهات روش تشخیص و متعاقب آن شناسایی اشتباه ورزشکاران مربوط می شود. این خطا ممکن است با اتخاذ پروتکلهای پیچیدهتر پس از پردازش و فیلتر کردن، یا از طریق استفاده از مدلهای ردیابی سفارشی کاهش یابد. فیلتر مشروط اعمال شده نقاط پرت بزرگ را حذف کرد اما در عین حال شکاف های بزرگی را بدون هیچ اطلاعاتی معرفی کرد. مدلهای ردیابی سفارشی یا فیلترهایی مانند فیلتر کالمن میتوانند برای به حداقل رساندن شکافهای تشخیص بزرگ و در نتیجه، شناسایی اشتباه ورزشکاران استفاده شوند. [۳۵]. نمایش نابرابر مسابقات انجام شده در هر استادیوم بر روی کار حاضر تأثیر گذاشت، که میتوان آن را به ویژگیهای خاص قرعهکشی فصل بازی AF نسبت داد، که باعث شد شریک تحقیقاتی صنعت در طول فصل ۲۰۱۹ در هر استادیوم AF بازی نکرده باشد. این محدودیت را میتوان با استفاده از دادههای تیمها و فصلهای متعدد در کارهای آینده برطرف کرد، که با این حال، به دلیل در دسترس بودن دادههای محدود دادههای GPS تیمهای مختلف AF حرفهای چالش برانگیز است. بنابراین، روش پیشنهادی فرصتی را برای ایجاد مجموعه داده بزرگتری ارائه میدهد که میتواند در آینده برای آموزش مدلهای یادگیری ماشینی پیچیدهتر و کارآمدتر برای تشخیص و ردیابی بازیکن بر اساس انیمیشنهای AF منحصربهفرد استفاده شود.
این تحقیق اولین قدم به سوی ابزاری خودکار برای تعیین موقعیت در زمین بازیکنان هر دو تیم در AF است. این اطلاعات به متخصصان ورزش اجازه می دهد تا رفتار تاکتیکی و تعاملات یک تیم یا فرد را بهتر درک کنند [۵,۶] و از تصمیم گیری در مورد عملکرد و خطر آسیب حمایت می کند [۴].
منبع: https://www.mdpi.com/2673-2688/5/2/38