Authors | مجید جودکی,حسین ابراهیم پور کومله |
---|---|
Journal | ماشین بینایی و پردازش تصویر |
IF | ثبت نشده |
Paper Type | Full Paper |
Published At | ۱۴۰۳/۰۱/۰۹ |
Journal Grade | Scientific - research |
Journal Type | Electronic |
Journal Country | Iran, Islamic Republic Of |
Journal Index | ISC |
Abstract
استفاده از یادگیری عمیق در حل مسایل مربوط به تحلیل دادههای پیچیده و حجیم مانند ویدئوها گسترش یافته است. از جمله پردازش-هایی که روی ویدیوها انجام می¬گیرد، تشخیص عملهای انسانی است که کاربردهای مهمی در حوزه نظارت خودکار، تعامل انسان با رایانه و بررسی رفتارهای سالمندان دارد. شبکههای باور عمیق از میان انواع مختلف شبکههای عمیق، به خاطر ویژگیهای خاص خود، به ویژه توانایی همگرایی سریع نسبت به دیگر روشها و ساختار یکسان لایهها، مورد توجه قرار گرفتهاند. لیکن، قدرت شبکه های باور عمیق پایه در پردازش داده¬های پیچیده که مبتنی بر زمان نیز هستند جای تامل دارد. در این مقاله، یک روش بازگشتی جدید بر مبنای شبکههای باور عمیق ارائه شده است. در روش پیشنهادی، توانایی پردازش و تفسیر فریمهای دوبعدی ویدئو و درک مفهوم زمان به وسیله پیاده¬سازی بازگشتی به شبکه¬های باور عمیق اضافه شده است. این روش قادر به درک مفاهیم کوتاه مدت زمانی با استفاده از ماشین¬های بولتزمن محدود و بلند مدت زمانی بر مبنای پیاده¬سازی بازگشتی میباشد. روش پیشنهادی بر روی سه پایگاه داده شناختهشده در این حوزه با نام¬های KTH، UCF و HMDB51 ارزیابی شده و به ترتیب به دقتهای برابر با 95.02، 93.14 و 74.28 دست یافته و با سایر روش¬های محبوب در شرایط مختلف مقایسه گردیده است.
tags: یادگیری عمیق، شبکه های باور عمیق، ماشین های بولتزمن محدود، شناسایی عمل، شبکه های عصبی بازگشتی