نویسندگان | زهرا ناصریان اصل، هدی قاسمیه، دانیال صیاد |
---|---|
همایش | سومین کنفرانس ملی دادهکاوی در علوم زمین |
تاریخ برگزاری همایش | ۲۰۲۳-۰۲-۰۱ - ۲۰۲۳-۰۲-۰۱ |
محل برگزاری همایش | 1 - اراک |
ارائه به نام دانشگاه | صنعتی اراک |
نوع ارائه | سخنرانی |
سطح همایش | ملی |
چکیده مقاله
استفاده از الگوریتم¬های داده کاوی به منظور پیش¬بینی و تهیه نقشه¬ حساسیت سیل به دلیل دقت بالایی که دارند، امری ضروری است. پژوهش حاضر با هدف مروری بر پژوهش¬های مرتبط با داده کاوی در ارتباط با ارزیابی خطر سیل انجام شده است. به این منظور با مطالعه در پژوهش¬های مرتبط، به مزیت استفاده از این سه الگوریتم داده کاوی (جنگل تصادفی، رگرسیون لجستیک و ماشین بردار پشتیبان) پرداخته شد. نتایج پژوهش حاضر نشان داد که الگوریتم جنگل تصادفی دسته-بندی را برای مجموعه¬ای داده¬ها با سرعت بالایی انجام داده و ترکیبی از چند درخت تصمیم است و همچنین الگوریتم ماشین بردار پشتیبان ریسک ساختاری را به حداقل رسانده و خطای تجربی را کاهش می¬دهد. از دیگر نتایچ پژوهش حاضر می¬توان به امکان استفاده از متغیرهای گسسته و پیوسته و یاترکیبی از این دو متغیر در الگوریتم رگرسیون لجستیک اشاره کرد. پیشنهاد می¬شود برای افزایش دقت و کیفیت پیش بینی خطر سیل از ترکیبی از این الگوریتم¬ها استفاده شود زیرا این الگوریتم¬ها نیاز به تعداد زیاد داده¬های ثبت شده نداشته و از دقت بالای پیش¬بینی برخوردارند.
کلید واژه ها: جنگل تصادفی، رگرسیون لجستیک، ماشین بردار پشتیبان، یادگیری ماشین