رزومه
QR


سید مهدی وحیدی پور

سید مهدی وحیدی پور

استادیار

عضو هیئت علمی تمام وقت

دانشکده: دانشکده مهندسی برق و کامپیوتر

گروه: هوش مصنوعی

مقطع تحصیلی: دکترای تخصصی

سال تولد: ۱۳۵۶

رزومه
QR
سید مهدی وحیدی پور

استادیار سید مهدی وحیدی پور

عضو هیئت علمی تمام وقت
دانشکده: دانشکده مهندسی برق و کامپیوتر - گروه: هوش مصنوعی مقطع تحصیلی: دکترای تخصصی | سال تولد: ۱۳۵۶ |

رایانشانی و شناسه اسکایپ:  vahidipour[ATSIGN]kashanu[DOT]ac[DOT]ir

شناسه تلگرام و واتساپ: [ATSIGN]Mvahidipour

لینکهای مرتبط با من

Google Scholar | ORCID | Scopus | ResearchGate | Publon | Dijsktra number (CSAuthor) | Mendely | DBLP 

نمایش بیشتر

Employing a novel content-based similarity measure for a machine learning-driven focused crawler

نویسندگانعطیه جبل عاملی, محمد مهدی محمدی
همایشthe 6th National Conference on Applied Research in Computer Engineerinag and Informmation Technology
تاریخ برگزاری همایش2020-02-13 - 2020-02-14
محل برگزاری همایش1 - تهران
ارائه به نام دانشگاهدانشگاه خواجه نصیرالدین طوسی
نوع ارائهسخنرانی
سطح همایشملی

چکیده مقاله

The volume of the World Wide Web is growing rapidly, reaching a point where governing data is challenging. Search engines are used to collect data across the web for users. Web crawlers as the major part of search engines are then used to retrieve relevant data on the web according to the user requests. Accordingly, a focused crawler considers a predefined subject and retrieves corresponding relevant pages. In this paper, we propose an efficient focused web crawling approach, which uses a combination of a content-based similarity measure and a Naive Bayes learning classifier in order to find relevant pages to a particular subject. Our first experimental studies show satisfactory improvements where accuracy and recall are increased by 4% and 1% respectively.