Authors | محمدجواد نصری لوشانی,جواد سلیمی سرتختی,حسین ابراهیم پور کومله |
---|---|
Conference Title | ششمین کنفرانس بینالمللی بازشناسی الگو و تحلیل تصویر |
Holding Date of Conference | ۲۰۲۳-۰۲-۱۴ - ۲۰۲۳-۰۲-۱۶ |
Event Place | 1 - قم |
Presented by | دانشگاه تهران-پردیس فارابی |
Presentation | SPEECH |
Conference Level | International Conferences |
Abstract
ساخت سامانههای گفتگوگر در سالهای اخیر توجه زیادی به خود جلبکرده است. دستهای از این سامانهها، سامانههای گفتگوگر وظیفهگرا هستند که هدفشان رساندن انسان به مقصودش با انجام گفتگو در یک حوزه خاص میباشد؛ مثلاً رستوران. این سامانهها از بخشهای مختلفی تشکیل میشوند که اگر دو یا چند بخش، همزمان توسعهداده شوند، سامانهی مشترک (Joint) نامیده میشود. یکی از روشهایی که برای توسعه این سامانهها استفاده میشود، روش یادگیری تقویتی عمیق است. در یادگیری تقویتی عمیق، عامل که شبکه عصبی است با تعامل با محیط (کنش) در حالتهای مختلف و دریافت پاداش از آن، آموزش میبیند. همچنین، در شروع یادگیری، عامل تعدادی کنش بصورت تصادفی انجام میدهد و به مرور زمان از دانشی که بدست آورده، استفاده میکند. در این مقاله، برای اینکه حالت مناسبی از محیط گفتگو ایجاد شود، از چسباندن نمایش جمله آخرین پیام ربات و انسان، استفادهشده است. همچنین، تابعی جدید برای کاهش احتمال انجام کنش تصادفی، بکارگرفتهشده است. برای ارزیابی و مقایسه عملکرد روش ارائهشده با دو سامانه گفتگوگر دیگر، از شبیهساز گفتگو در حوزه رستوران استفاده شدهاست. روش ارائهشده، بیشینه پاداش 0.29937 را در 27,900 گام گفتگو بدست میآورد که نسبت به دو روش دیگر، با تعداد گفتگوهای کمتر، پاداش بیشتری بدست آورده است.
tags: نمایش جمله، حوزه رستوران، مدیریت گفتگو، DQL