مبانی داده کاوی
درس مبانی داده کاوی اطلاعات
زمان کلاس: یکشنبه و سه شنبه، ساعت 12:30 تا 14
امتحان میانترم: یکشنبه 12 آذر شامل قواعد انجمنی و روشهای دسته بندی (مباحث مرتبط با Ensemble در میانترم نخواهد بود)
محل امتحان سالن اجتماعات (متحانات) دانشکده مهندسی طبقه سوم
--------------------------------------------------------------------------------------------------------------------
پروژه درس: تعریف پروژه (جدید، زمان بارگزاری 9 دی)
مهلت تحویل تمرین حداکثر تا ساعت 24:00 مورخه 20 بهمن 1396 میباشد (غیر قابل تمدید). به ازای هر لحظه تاخیر پس از مهلت مقرر تا 24 ساعت اول از مهلت مقرر 30% از نمره، از 24 ساعت تا 48 ساعت تاخیر از مهلت مقرر 60% از نمره و پس از 72 ساعت از مهلت مقرر 100% از نمره تمرین به عنوان جریمه بینظمی کاسته میشود.
-------------------------------------------------------------------
عنوان |
نمره |
توضیح |
میانترم |
5.5 |
در تاریخ 12/9/96 برگزار شد |
پایانترم |
5.5 |
4 سوال تشریحی- نمرات اولیه تا 28 بهمن اعلام میشود خوش خط و خوانا بنویسید. (ارفاق بابت زیبا نویسی 0.75 نمره) استفاده از ماشین حساب بلامانع است برگه سوالات تحویل داده شود |
تکلیف و پروژه |
4 |
شامل دو تکلیف (دو نمره) و یک پروژه (مدت تا 20بهمن، دو نمره) |
ارائه (اجباری) |
3 |
برای هر دانشجو یک ارایه اجباری لحاظ میشود |
حضور کلاسی |
2 |
از 9 جلسه محاسبه شده است |
موارد ارفاقی |
6 |
بنابر خواست دانشجو، هر دانشجو میتوانسته سه ارایه داشته باشد |
این جدول در سایت درس قرار گرفته است |
نکته: ممکن است از مباحث مطرح شده در کلاس عملی، سوالاتی در امتحان مطرح شود.
میانترم 5.5، پایانترم 5.5، تکالیف 2.5، حضور و غیاب 1.5، پروژه عملی 2، ارایه اجباری 3 {20 نمره}
به دانشجویانی که تعداد غیبتهای آنان 5 و یا بیشتر باشد، قسمتی از نمره ارفاقی تعلق خواهد گرفت اگر ارایه انجام داده باشند
نمرات مازاد بر بیست نمره: ارایه ارفاقی اول 3، ارایه ارفاقی دوم 2، ارایه ارفاقی سوم 1 نمره {6 نمره}
موضوع های ارایه های ارفاقی: موضوع های باقیمانده از ارایه های اجباری (قبول برای ارایه اول و/یا دوم)، ارایه ابزارهای داده کاوی (قبول برای ارایه اول یا دوم)، ارایه مباحث اضافه(قابل قبول برای ارایه سوم)
-------------------------------------------------------------------------------------------------------------------
زمانبندی ارائه های کلاسی:
سه شنبه 9 آبان: Rapidminer
سه شنبه 16 آبان: ChartJs
سه شنبه 30 آبان: DHP، FPGrowth ، ECLAT
سه شنبه 7 آذر: decision tree in relation database، Other Attribute Selection Measures
یکشنبه 19 آذر: dygraphs
سه شنبه 21 آذر: BOAT ، Random Forest ، Sequential pattern
سه شنبه 28 آذر: Weka ، PowerBi
یکشنبه 3 دی: CLARA-CLARNS, Plotly-Python
سه شنبه 5 دی: TimeLine, LeaftLet, Classification of Class-Imbalanced Data Sets
یکشنبه 10 دی: tree pruning method، DIC، CLEMENTINE، partition
دوشنبه 11 دی ساعت 10 صبح: RainForest، Datawrapper ،max and closed pattern ، birch، Comparing classifiers
-ارایه های باقیمانده از کلاس (دوشنبه 11 دی 96 ساعت 14): ،raw ، sequential Covering methods، chameleon
ارایههای مشخص شده (سه شنبه 12 دی 96، ساعت 13): Tabelu , Sisense, Highcharts
------------------------------------------------------------------------------------------
جلسات کلاس
جلسه اول دوم 26، 28 شهریور96: عدم تشکیل کلاس
جلسه سوم، چهارم 2، 4، مهر 96: معرفی داده کاوی (S1-ch01Intro)
جلسه پنجم 9 مهر 96: تعطیل رسمی
جلسه ششم 11 مهر 96: ادامه معرفی
جلسه هفتم، هشتم و نهم 16، 18 و 23 مهر 96: قوانین انجمنی ( S3-ch06FPBasicPart1)
جلسه دهم 25 مهر 96: پایان قوانین انجمنی (S3-ch06FPBasicPart2) و آغاز بحث طبقه بندی
جلسه یازدهم و دوازدهم 30 مهر و 2 آبان 96: درخت تصمیم (S4-08ClassBasic-Part1)
جلسه سیزدهم 7 آبان 96: طبقه بندی بر اساس قوانین (S4-08ClassBasic-Part2)
جلسه چهاردهم 9 آبان 96: اولین ارایه رپید ماینر (حضور تمام دانشجویان الزامی است)
جلسه پانزدهم 14 آبان 96: معیارهای ارزیابی (S4-08ClassBasic-Part3)
جلسه شانزدهم 16 آبان 96: مجموعهای از طبقهبندها (S4-08ClassBasic-Part4) و ارائه ChartJs
جلسه هفدهم 21 آبان 96: شباهت داده ها (S6-10ClusBasic-Part1)
جلسه هجدهم 23 آبان 96: خوشه بندی (S6-10ClusBasic-Part2)
جلسه نوزدهم 28 آبان 96: شهادت امام رضا (ع) نعطیل رسمی
جلسه بیستم 30 آبان 96: ارائه های DHP، FPGrowth ، ECLAT
جلسه بیست و یکم 5 آذر 96: ادامه خوشه بندی (S6-10ClusBasic-Part3)
جلسه بیست و دوم 7 آذر 96: ارائه های decision tree in relation database، Other Attribute Selection Measures (مقاله مرتبط)
جلسه بیست و سوم 12 آذر 96: امتحان میانترم
حلسه بیست و چهارم 14 آدر 96: ادامه خوشه بندی (S6-10ClistBasic-Part4)
جلسه بیست و پنحم 19 آذر 96: پیش پردازش داده ها (S8-03Preprocessing) ، Dygraphs
جلسه بیست و ششم 21 آذر 96: BOAT ، Random Forest ، Sequential pattern
جلسه بیست و هفتم 26 آذر 96: ادامه پیش پردازش داده ها
جلسه بیست و هشتم 28 آذر 96: Weka ، PowerBi
جلسه بیست و نهم 3 دی 96: CLARA-CLARNS, Plotly-Python
جلسه سی ام 5 دی 96: TimeLine, LeaftLet, Classification of Class-Imbalanced Data Sets
جلسه سی و یکم 10 دی 96: tree pruning method، DIC، CLEMENTINE، partition
جلسه سی و دوم 11 دی 96 (ساعت 10 صبح):
RainForest،Datawrapper ، max and closed pattern، birch، Comparing classifiers
-ارایه های باقیمانده از کلاس (دوشنبه 11 دی 96 ساعت 14): ،raw ، sequential Covering methods، chameleon
-ارایههای مشخص شده (سه شنبه 12 دی 96، ساعت 13): Tabelu , Sisense, Highcharts
.--------------------------------------------------------------------------------------------------------------
تکالیف
تکلیف شماره یک: الگوریتم تولید قوانین انجمنی از روی لیست داده های مکرر (اسلاید 40 از S3-ch06FPBasicPart1)
زمان تحویل: 9 آبان 96- تحویل به صورت دستی و یا ارسال از طریق ایمیل
تکلیف شماره دو: پاسخگویی به سوالات داخل فایل HW2-DM-961
مقاله اول و مقاله دوم مورد نیاز برای پاسخگویی به سوالات تکلیف شماره دو
زمان تحویل: روز امتحان میانترم
---------------------------------------------------------------------------------------------------------
موضوعهای گرفته شده
-- نقوی و صفار: FPGrowth
--حاجیان و حیدرزاده: ECLAT
-- خانی و حشمت: DHP
-- محمدی و نفیسی: decision tree in relation database
-- جعفری و قربانی: Other Attribute Selection Measures
--مهدی تیموری و کیانوش ملکوتی: BOAT (ارایه اجباری)
--مهدی تیموری و کیانوش ملکوتی: RainForest (ارایه ارفاقی اول)
-- پگاه حاجیان،حمیدرضا مهدویپناه،نرگس حیدرزاده: Sequential pattern
-- سلیمیان و جلالی: Random Forest (ارائه اجباری)
-- سلیمیان و جلالی: Classification of Class-Imbalanced Data Sets (ارائه ارفاقی اول)
-- رحیمی، حاجی هاشمی، حدیثه محمدی: max and closed pattern
--نادری، مزروعی، شریف زاده: CLARA, CLARANS
--غزاله قاسمی،میلاد چراغی،علی طباطبایی: Phyton toolbox and Plotly (ارائه ارفاقی اول)
--غزاله قاسمی،میلاد چراغی،علی طباطبایی: دسته بندی پستهای تلگرام (پروژه پیشنهادی درس)
--صفار و بیات: tree pruning method
--رحیمی و حاجی هاشمی: DIC
--سارا قربانی، نسترن جعفری و زهرا بیات: CLEMENTINE
-- رحیممی و حاج هاشمی:birch
-- کرمعلی و کردمیل: Comparing classifiers
--بهمن یار و قربانی: partition
-- چراغی: sequential Covering methods
--- چراغی: chameleon
- partition ، اسلاید 35 از S3-ch06FPBasicPart1
- DHP، اسلاید 35 از S3-ch06FPBasicPart1
- DIC، اسلاید 35 از S3-ch06FPBasicPart1
- FPGrowth ، اسلاید 41 از S3-ch06FPBasicPart1
- ECLAT ، اسلاید 41 از S3-ch06FPBasicPart1
-Max-pattern، اسلاید 7 از S3-ch06FPBasicPart2
-Closed-pattern، اسلاید 7 از S3-ch06FPBasicPart2
- Sequential pattern، اسلاید 7 از S3-ch06FPBasicPart2
-Other Attribute Selection Measures، اسلاید 19 از S4-08ClassBasic-Part1
Tree Pruning methods، اسلاید 21 از S4-08ClassBasic-Part1
- decision tree in relation database، اسلاید 23 از S4-08ClassBasic-Part1
-RainForest، اسلاید 24 از S4-08ClassBasic-Part1
- BOAT، اسلاید 26 از S4-08ClassBasic-Part1
-sequential Covering methods اسلاید 4 از S4-08ClassBasic-Part2، روشهای nFOIL, AQ, CN2, RIPPER
- Comparing classifiers اسلاید دوم از S4-08ClassBasic-Part3روشهای Confidence intervals و Cost-benefit analysis and ROC Curves
- Random Forest اسلاید 6 از S4-08ClassBasic-Part4 روشهای Forest-RI و Forest-RC
- Classification of Class-Imbalanced Data Sets اسلاید 7 از S4-08ClassBasic-Part4
-- CLARA اسلاید 21 از S6-10ClusBasic-Part2
--CLARANS اسلاید 21 از S6-10ClusBasic-Part2
--Birch اسلاید آخر S6-10ClusBasic-Part3
--Chamelone اسلاید آخر S6-10ClusBasic-Part3
ارایه ارفاقی در خصوص ابزارها (قبول به عنوان ارایه اول یا دوم)
- آقای محمدی Chartjs -پویا خانی Weka - - محمدی و نفیسی PowerBi
- خانم ها نقوی و بهمن یار Timeline - محمدی و نفیسی LeaftLet
--سلیمیان Datawrapper علی طباطبایی: dygraphs
-- نقوی و بهمن یار:raw
-- Tableau: مسافرچی، خانم محمدی
-- Sisense: حمیدی و مالکی
-- HighCharts: حمیدی و مالکی
موضوعهای باقیمانده:
- Qlik (Qlikview)
-FusionCharts
- Charted, D3, ...
مباحث اضافه (قبول به عنوان ارایه سوم)
-پویا خانی REST2
-نفیسی: JSON
-- الهام صفار: bpms
-- سارا قربانی: BPMN2
-- نسترن جعفری: BPL
-- حمیدی: BPMS