نویسندگان | محمدجواد نصری لوشانی,مهدی ناهیدیان لنبانی,مهسا کریمی,مهدی وحیدی پور |
---|---|
همایش | ششمین کنفرانس ملی انفورماتیک ایران، |
تاریخ برگزاری همایش | ۲۰۲۵-۰۲-۲۶ - ۲۰۲۵-۰۲-۲۷ |
محل برگزاری همایش | 1 - تهران |
ارائه به نام دانشگاه | پژوهشگاه دانشهای بنیادی، پژوهشکدهی علوم کامپیوتر |
نوع ارائه | سخنرانی |
سطح همایش | ملی |
چکیده مقاله
در این مقاله، چالش تولید متنهای چند جملهای از گرافهای دانش، مورد بررسی قرار گرفته است. گرافهای دانش، نمایشی از اطلاعات به صورت گرهها و یالها هستند که روابط بین این اطلاعات را نمایش میدهند. به دلیل ساختار پیچیده و تنوع زیاد، تولید متن از گراف دانش امری دشوار است. در این مقاله، روشی جدید به نام گراف رایتر+ معرفی میشود که با استفاده از گراف دانشِ استخراجشده از خلاصههای مقالات علمی، با دریافت عنوان مقاله به عنوان ورودی، متن مرتبط را تولید و خلاصه مقاله را بازتولید میکند. گراف رایتر+، رمزگذار گراف دارد تا ساختار گراف را بدون نیاز به تبدیل آن به یک رشته خطی یا سلسله مراتبی درک کند. همچنین، روش خوشهبندی برای پردازش عنوان مقالهها به کار گرفته شده است. روش پیشنهادی در مقایسه با روشهای موجود، دقت و کیفیت بهتری در تولید متنهای چند جملهای از گرافهای دانش نشان میدهد و میتواند به فرآیند دسترسی و بهرهبرداری از اطلاعات علمی و پژوهشی کمک کند.
کلیدواژهها: تولید متن، سیستم استخراج اطلاعات ، گراف دانش، مدل زبانی BERT