طراحی یک سامانه گفتگوگر وظیفه‌گرا مشترک مبتنی بر یادگیری تقویتی عمیق

محمدجواد نصری لوشانی,جواد سلیمی سرتختی,حسین ابراهیم پور کومله

نویسندگان	محمدجواد نصری لوشانی,جواد سلیمی سرتختی,حسین ابراهیم پور کومله
همایش	ششمین کنفرانس بین‌المللی بازشناسی الگو و تحلیل تصویر
تاریخ برگزاری همایش	۲۰۲۳-۰۲-۱۴ - ۲۰۲۳-۰۲-۱۶
محل برگزاری همایش	1 - قم
ارائه به نام دانشگاه	دانشگاه تهران-پردیس فارابی
نوع ارائه	سخنرانی
سطح همایش	بین المللی

چکیده مقاله

ساخت سامانه‌های گفتگوگر در سال‌های اخیر توجه زیادی به خود جلب‌کرده است. دسته‌ای از این سامانه‌ها، سامانه‌های گفتگوگر وظیفه‌گرا هستند که هدفشان رساندن انسان به مقصودش با انجام گفتگو در یک حوزه خاص می‌باشد؛ مثلاً رستوران. این سامانه‌ها از بخش‌های مختلفی تشکیل می‌شوند که اگر دو یا چند بخش، همزمان توسعه‌داده شوند، سامانه‌ی مشترک (Joint) نامیده می‌شود. یکی از روش‌هایی که برای توسعه این سامانه‌ها استفاده می‌شود، روش یادگیری تقویتی عمیق است. در یادگیری تقویتی عمیق، عامل که شبکه عصبی است با تعامل با محیط (کنش) در حالت‌های مختلف و دریافت پاداش از آن، آموزش می‌بیند. همچنین، در شروع یادگیری، عامل تعدادی کنش بصورت تصادفی انجام می‌دهد و به مرور زمان از دانشی که بدست آورده، استفاده می‌کند. در این مقاله، برای اینکه حالت مناسبی از محیط گفتگو ایجاد شود، از چسباندن نمایش جمله آخرین پیام ربات و انسان، استفاده‌شده است. همچنین، تابعی جدید برای کاهش احتمال انجام کنش تصادفی، بکارگرفته‌شده است. برای ارزیابی و مقایسه عملکرد روش ارائه‌شده با دو سامانه گفتگوگر دیگر، از شبیه‌ساز گفتگو در حوزه رستوران استفاده شده‌است. روش ارائه‌شده، بیشینه پاداش 0.29937 را در 27,900 گام گفتگو بدست می‌آورد که نسبت به دو روش دیگر، با تعداد گفتگوهای کمتر، پاداش بیشتری بدست آورده است.

لینک ثابت مقاله

کلیدواژه‌ها: نمایش جمله، حوزه رستوران، مدیریت گفتگو، DQL