توسعه شبکههای عصبی گرافی با ترکیب اطلاعات ساختاری و موقعیتی مبتنی بر مکانیزم توجه
چکیده:
روشهای یادگیری بازنمایی گراف، در حل مسائل تحلیلی گوناگون مانند طبقهبندی گره، پیشبینی پیوند و دستهبندی گراف محبوبیت زیادی پیدا کردهاند. با این حال، بیشتر این روشها صرفا اطلاعات محلی اطراف گرهها را در نظر میگیرند. علاوه بر این، اطلاعات مربوط به موقعیت نسبی و کلی هر گره بهطور کامل لحاظ نمیشود. اخیراً، شبکههای عصبی گرافی موقعیتمحور پیشنهاد شدهاند که برای محاسبه تعبیه یک گره، اطلاعات موقعیت گره را در نظر میگیرند. هدف این کار، تفکیک گرههایی است که از نظر ساختاری شبیه به یکدیگر هستند. این روشها در وظایفی که موقعیت گرهها اهمیت زیادی دارد، عملکرد بسیار خوبی دارند. با این حال، اگر در مسئلهای علاوه بر موقعیت گرهها، همسایگی محلی آنها نیز اهمیت داشته باشد و ساختار گرهها در تصمیمگیری نقش مهمی ایفا کند، نمیتوانند این عامل را به درستی در محاسبات خود برای یادگیری تعبیه لحاظ کنند. بنابراین برای این نوع مسائل، کارایی مطلوبی نخواهند داشت. با توجه به این مشکل، در این پایاننامه، سه چارچوب نوآورانه برای یادگیری بازنمایی گراف معرفی میشود که با ادغام اطلاعات ساختاری و موقعیتی گرهها، محدودیتهای روشهای پیشین را برطرف میسازند. چارچوب اول با نام چارچوب ادغام ویژگیهای موقعیت و ساختار از طریق توجه متقابل (PSFuse-CA)، ویژگیهای ساختاری و موقعیتی را بر اساس مکانیزم توجه متقابل ترکیب میکند. چارچوب دوم با نام چارچوب توجه گرافی آگاه از موقعیت و ساختار (PS-GAT)، با توسعه یک شبکه توجه گرافی چندسری، یادگیری اطلاعات ساختاری و موقعیتی را به صورت موازی امکانپذیر میسازد. در نهایت، چارچوب سوم با نام چارچوب توجه گرافی غنیشده با موقعیت (PE-GAT)، با بازسازی گراف بر اساس اطلاعات موقعیتی، عملکرد شبکههای توجه گرافی را بهبود میبخشد. نتایج آزمایشها نشان میدهد که چارچوبهای پیشنهادی، در مقایسه با برخی روشهای یادگیری بازنمایی گراف، عملکرد بهتری در مسائل مختلف ارائه میدهند