طراحی یک سامانه گفتگوگر وظیفه‌گرا مشترک مبتنی بر یادگیری تقویتی عمیق

Authorsمحمدجواد نصری لوشانی,جواد سلیمی سرتختی,حسین ابراهیم پور کومله
Conference Titleششمین کنفرانس بین‌المللی بازشناسی الگو و تحلیل تصویر
Holding Date of Conference۲۰۲۳-۰۲-۱۴ - ۲۰۲۳-۰۲-۱۶
Event Place1 - قم
Presented byدانشگاه تهران-پردیس فارابی
PresentationSPEECH
Conference LevelInternational Conferences

Abstract

ساخت سامانه‌های گفتگوگر در سال‌های اخیر توجه زیادی به خود جلب‌کرده است. دسته‌ای از این سامانه‌ها، سامانه‌های گفتگوگر وظیفه‌گرا هستند که هدفشان رساندن انسان به مقصودش با انجام گفتگو در یک حوزه خاص می‌باشد؛ مثلاً رستوران. این سامانه‌ها از بخش‌های مختلفی تشکیل می‌شوند که اگر دو یا چند بخش، همزمان توسعه‌داده شوند، سامانه‌ی مشترک (Joint) نامیده می‌شود. یکی از روش‌هایی که برای توسعه این سامانه‌ها استفاده می‌شود، روش یادگیری تقویتی عمیق است. در یادگیری تقویتی عمیق، عامل که شبکه عصبی است با تعامل با محیط (کنش) در حالت‌های مختلف و دریافت پاداش از آن، آموزش می‌بیند. همچنین، در شروع یادگیری، عامل تعدادی کنش بصورت تصادفی انجام می‌دهد و به مرور زمان از دانشی که بدست آورده، استفاده می‌کند. در این مقاله، برای اینکه حالت مناسبی از محیط گفتگو ایجاد شود، از چسباندن نمایش جمله آخرین پیام ربات و انسان، استفاده‌شده است. همچنین، تابعی جدید برای کاهش احتمال انجام کنش تصادفی، بکارگرفته‌شده است. برای ارزیابی و مقایسه عملکرد روش ارائه‌شده با دو سامانه گفتگوگر دیگر، از شبیه‌ساز گفتگو در حوزه رستوران استفاده شده‌است. روش ارائه‌شده، بیشینه پاداش 0.29937 را در 27,900 گام گفتگو بدست می‌آورد که نسبت به دو روش دیگر، با تعداد گفتگوهای کمتر، پاداش بیشتری بدست آورده است.

Paper URL

tags: نمایش جمله، حوزه رستوران، مدیریت گفتگو، DQL