نویسندگان | محمدجواد نصری لوشانی,جواد سلیمی سرتختی,حسین ابراهیم پور کومله |
---|---|
همایش | ششمین کنفرانس بینالمللی بازشناسی الگو و تحلیل تصویر |
تاریخ برگزاری همایش | ۲۰۲۳-۰۲-۱۴ - ۲۰۲۳-۰۲-۱۶ |
محل برگزاری همایش | 1 - قم |
ارائه به نام دانشگاه | دانشگاه تهران-پردیس فارابی |
نوع ارائه | سخنرانی |
سطح همایش | بین المللی |
چکیده مقاله
ساخت سامانههای گفتگوگر در سالهای اخیر توجه زیادی به خود جلبکرده است. دستهای از این سامانهها، سامانههای گفتگوگر وظیفهگرا هستند که هدفشان رساندن انسان به مقصودش با انجام گفتگو در یک حوزه خاص میباشد؛ مثلاً رستوران. این سامانهها از بخشهای مختلفی تشکیل میشوند که اگر دو یا چند بخش، همزمان توسعهداده شوند، سامانهی مشترک (Joint) نامیده میشود. یکی از روشهایی که برای توسعه این سامانهها استفاده میشود، روش یادگیری تقویتی عمیق است. در یادگیری تقویتی عمیق، عامل که شبکه عصبی است با تعامل با محیط (کنش) در حالتهای مختلف و دریافت پاداش از آن، آموزش میبیند. همچنین، در شروع یادگیری، عامل تعدادی کنش بصورت تصادفی انجام میدهد و به مرور زمان از دانشی که بدست آورده، استفاده میکند. در این مقاله، برای اینکه حالت مناسبی از محیط گفتگو ایجاد شود، از چسباندن نمایش جمله آخرین پیام ربات و انسان، استفادهشده است. همچنین، تابعی جدید برای کاهش احتمال انجام کنش تصادفی، بکارگرفتهشده است. برای ارزیابی و مقایسه عملکرد روش ارائهشده با دو سامانه گفتگوگر دیگر، از شبیهساز گفتگو در حوزه رستوران استفاده شدهاست. روش ارائهشده، بیشینه پاداش 0.29937 را در 27,900 گام گفتگو بدست میآورد که نسبت به دو روش دیگر، با تعداد گفتگوهای کمتر، پاداش بیشتری بدست آورده است.
کلید واژه ها: نمایش جمله، حوزه رستوران، مدیریت گفتگو، DQL