ارائه‌ی یک معماری جدید از شبکه‌های باور عمیق برای شناسایی عمل در ویدئو

Authorsمجید جودکی,حسین ابراهیم پور کومله
Journalماشین بینایی و پردازش تصویر
IFثبت نشده
Paper TypeFull Paper
Published At۱۴۰۳/۰۱/۰۹
Journal GradeScientific - research
Journal TypeElectronic
Journal CountryIran, Islamic Republic Of
Journal IndexISC

Abstract

استفاده از یادگیری عمیق در حل مسایل مربوط به تحلیل داده‌های پیچیده و حجیم مانند ویدئوها گسترش یافته است. از جمله پردازش-هایی که روی ویدیوها انجام می¬گیرد، تشخیص عمل‌های انسانی است که کاربردهای مهمی در حوزه نظارت خودکار، تعامل انسان با رایانه و بررسی رفتارهای سالمندان دارد. شبکه‌های باور عمیق از میان انواع مختلف شبکه‌های عمیق، به خاطر ویژگی‌های خاص خود، به ویژه توانایی همگرایی سریع نسبت به دیگر روش‌ها و ساختار یکسان لایه‌ها، مورد توجه قرار گرفته‌اند. لیکن، قدرت شبکه های باور عمیق پایه در پردازش داده¬های پیچیده که مبتنی بر زمان نیز هستند جای تامل دارد. در این مقاله، یک روش بازگشتی جدید بر مبنای شبکه‌های باور عمیق ارائه شده است. در روش پیشنهادی، توانایی پردازش و تفسیر فریم‌های دوبعدی ویدئو و درک مفهوم زمان به وسیله پیاده¬سازی بازگشتی به شبکه¬های باور عمیق اضافه شده است. این روش قادر به درک مفاهیم کوتاه مدت زمانی با استفاده از ماشین¬های بولتزمن محدود و بلند مدت زمانی بر مبنای پیاده¬سازی بازگشتی می‌باشد. روش پیشنهادی بر روی سه پایگاه داده شناخته‌شده در این حوزه با نام¬های KTH، UCF و HMDB51 ارزیابی شده و به ترتیب به دقت‌های برابر با 95.02، 93.14 و 74.28 دست یافته و با سایر روش¬های محبوب در شرایط مختلف مقایسه گردیده است.

tags: یادگیری عمیق، شبکه های باور عمیق، ماشین های بولتزمن محدود، شناسایی عمل، شبکه‌ های عصبی بازگشتی