مبانی داده کاوی

تعداد بازدید:۳۷۵۳

درس مبانی داده کاوی اطلاعات

زمان کلاس: یکشنبه و سه شنبه، ساعت 12:30 تا 14

امتحان میانترم: یکشنبه 12 آذر شامل قواعد انجمنی و روشهای دسته بندی (مباحث مرتبط با Ensemble در میانترم نخواهد بود)

محل امتحان سالن اجتماعات (متحانات) دانشکده مهندسی طبقه سوم

--------------------------------------------------------------------------------------------------------------------

پروژه درس: تعریف پروژه   (جدید، زمان بارگزاری 9 دی)

مهلت تحویل تمرین حداکثر تا ساعت 24:00 مورخه 20 بهمن 1396 می­باشد (غیر قابل تمدید). به ازای هر لحظه تاخیر پس از مهلت مقرر تا 24 ساعت اول از مهلت مقرر 30% از نمره، از 24 ساعت تا 48 ساعت تاخیر از مهلت مقرر 60% از نمره و پس از 72 ساعت از مهلت مقرر 100% از نمره تمرین به عنوان جریمه بی‌نظمی کاسته می­شود.

-------------------------------------------------------------------

عنوان

نمره

توضیح

میانترم

5.5

در تاریخ 12/9/96 برگزار شد

پایانترم

      5.5

4 سوال تشریحی- نمرات اولیه تا 28 بهمن اعلام می‌شود

خوش خط و خوانا بنویسید. (ارفاق بابت زیبا نویسی 0.75 نمره)

استفاده از ماشین حساب بلامانع است

برگه سوالات تحویل داده شود

تکلیف و پروژه

4

شامل دو تکلیف (دو نمره) و یک پروژه (مدت تا 20بهمن، دو نمره)

ارائه (اجباری)

3

برای هر دانشجو یک ارایه اجباری لحاظ می‌شود

حضور کلاسی

2

از 9 جلسه محاسبه شده است

موارد ارفاقی

6

بنابر خواست دانشجو، هر دانشجو می‌توانسته سه ارایه داشته باشد

این جدول در سایت درس قرار گرفته است

 

نکته: ممکن است از مباحث مطرح شده در کلاس عملی، سوالاتی در امتحان مطرح شود.

میانترم 5.5، پایانترم 5.5، تکالیف 2.5، حضور و غیاب 1.5، پروژه عملی 2، ارایه اجباری 3 {20 نمره}

به دانشجویانی که تعداد غیبتهای آنان 5 و یا بیشتر باشد، قسمتی از نمره ارفاقی تعلق خواهد گرفت اگر ارایه انجام داده باشند

نمرات مازاد بر بیست نمره: ارایه ارفاقی اول 3، ارایه ارفاقی دوم 2، ارایه ارفاقی سوم 1 نمره {6 نمره}

موضوع های ارایه های ارفاقی: موضوع های باقیمانده از ارایه های اجباری (قبول برای ارایه اول و/یا دوم)، ارایه ابزارهای داده کاوی (قبول برای ارایه اول یا دوم)، ارایه مباحث اضافه(قابل قبول برای ارایه سوم) 

-------------------------------------------------------------------------------------------------------------------

زمانبندی ارائه های کلاسی:

سه شنبه 9 آبان: Rapidminer

سه شنبه 16 آبان: ChartJs

سه شنبه 30 آبان: DHP، FPGrowth ، ECLAT

سه شنبه 7 آذر: decision tree in relation database، Other Attribute Selection Measures

یکشنبه 19 آذر: dygraphs

سه شنبه 21 آذر: BOAT ، Random Forest ، Sequential pattern

سه شنبه 28 آذر: Weka  ، PowerBi

یکشنبه 3 دی: CLARA-CLARNS, Plotly-Python

سه شنبه 5 دی: TimeLine, LeaftLet, Classification of Class-Imbalanced Data Sets

یکشنبه 10 دی: tree pruning method، DIC، CLEMENTINE، partition

دوشنبه 11 دی ساعت 10 صبح: RainForest، Datawrapper ،max and closed pattern ، birch، Comparing classifiers

-ارایه های باقیمانده از کلاس (دوشنبه 11 دی 96 ساعت 14): ،raw ، sequential Covering methods، chameleon

ارایه‌های مشخص شده (سه شنبه 12 دی 96، ساعت 13): Tabelu , Sisense, Highcharts

------------------------------------------------------------------------------------------

جلسات کلاس

جلسه اول دوم  26، 28 شهریور96: عدم تشکیل کلاس

جلسه سوم، چهارم 2، 4، مهر 96: معرفی داده کاوی (S1-ch01Intro)

جلسه پنجم 9 مهر 96: تعطیل رسمی

جلسه ششم 11 مهر 96: ادامه معرفی 

جلسه هفتم، هشتم و نهم 16، 18 و 23 مهر 96: قوانین انجمنی ( S3-ch06FPBasicPart1)

جلسه دهم 25 مهر 96: پایان قوانین انجمنی (S3-ch06FPBasicPart2) و آغاز بحث طبقه بندی 

جلسه یازدهم و دوازدهم 30 مهر و 2 آبان 96: درخت تصمیم (S4-08ClassBasic-Part1)

جلسه سیزدهم 7 آبان 96: طبقه بندی بر اساس قوانین (S4-08ClassBasic-Part2)

جلسه چهاردهم 9 آبان 96: اولین ارایه رپید ماینر (حضور تمام دانشجویان الزامی است)

جلسه پانزدهم 14 آبان 96: معیارهای ارزیابی (S4-08ClassBasic-Part3)

جلسه شانزدهم 16 آبان 96: مجموعه‌ای از طبقه‌بندها (S4-08ClassBasic-Part4) و ارائه  ChartJs

جلسه هفدهم 21 آبان 96: شباهت داده ها (S6-10ClusBasic-Part1)

جلسه هجدهم 23 آبان 96: خوشه بندی (S6-10ClusBasic-Part2)

جلسه نوزدهم 28 آبان 96: شهادت امام رضا (ع) نعطیل رسمی

جلسه بیستم 30 آبان 96: ارائه های DHP، FPGrowth ، ECLAT

جلسه بیست و یکم 5 آذر 96: ادامه خوشه بندی (S6-10ClusBasic-Part3)

جلسه بیست و دوم 7 آذر 96: ارائه های decision tree in relation database، Other Attribute Selection Measures (مقاله مرتبط)

جلسه بیست و سوم 12 آذر 96: امتحان میانترم

حلسه بیست و چهارم 14 آدر 96: ادامه خوشه بندی (S6-10ClistBasic-Part4)

جلسه بیست و پنحم 19 آذر 96: پیش پردازش داده ها (S8-03Preprocessing) ، Dygraphs

جلسه بیست و ششم 21 آذر 96: BOAT ، Random Forest ، Sequential pattern

جلسه بیست و هفتم 26 آذر 96: ادامه پیش پردازش داده ها

جلسه بیست و هشتم 28 آذر 96: Weka  ، PowerBi

جلسه بیست و نهم 3 دی 96: CLARA-CLARNS, Plotly-Python

جلسه سی ام 5 دی 96: TimeLine, LeaftLet, Classification of Class-Imbalanced Data Sets

جلسه سی و یکم 10 دی 96: tree pruning method، DIC، CLEMENTINE، partition

جلسه سی و دوم 11 دی 96 (ساعت 10 صبح):

RainForest،Datawrapper ، max and closed pattern، birch، Comparing classifiers

-ارایه های باقیمانده از کلاس (دوشنبه 11 دی 96 ساعت 14): ،raw ، sequential Covering methods، chameleon

-ارایه‌های مشخص شده (سه شنبه 12 دی 96، ساعت 13): Tabelu , Sisense, Highcharts

.--------------------------------------------------------------------------------------------------------------

تکالیف

تکلیف شماره یک: الگوریتم تولید قوانین انجمنی از روی لیست داده های مکرر (اسلاید 40 از  S3-ch06FPBasicPart1

زمان تحویل: 9 آبان 96- تحویل به صورت دستی و یا ارسال از طریق ایمیل 

 تکلیف شماره دو: پاسخگویی به سوالات داخل فایل HW2-DM-961

مقاله اول و مقاله دوم مورد نیاز برای پاسخگویی به سوالات تکلیف شماره دو

زمان تحویل: روز امتحان میانترم

---------------------------------------------------------------------------------------------------------

موضوع‌های گرفته شده

-- نقوی و صفار: FPGrowth 

--حاجیان و حیدرزاده:  ECLAT

-- خانی و حشمت: DHP

-- محمدی و نفیسی: decision tree in relation database

-- جعفری و قربانی: Other Attribute Selection Measures

--مهدی تیموری و کیانوش ملکوتی: BOAT (ارایه اجباری)

--مهدی تیموری و کیانوش ملکوتی: RainForest (ارایه ارفاقی اول)

-- پگاه حاجیان،حمیدرضا مهدوی‌پناه،نرگس حیدرزاده: Sequential pattern

-- سلیمیان و جلالی: Random Forest (ارائه اجباری)

-- سلیمیان و جلالی: Classification of Class-Imbalanced Data Sets (ارائه ارفاقی اول)

-- رحیمی، حاجی هاشمی، حدیثه محمدی: max and closed pattern

--نادری، مزروعی، شریف زاده: CLARA, CLARANS

--غزاله قاسمی،میلاد چراغی،علی طباطبایی: Phyton toolbox and Plotly (ارائه ارفاقی اول)

--غزاله قاسمی،میلاد چراغی،علی طباطبایی: دسته بندی پستهای تلگرام (پروژه پیشنهادی درس)

--صفار و بیات: tree pruning method

--رحیمی و حاجی هاشمی: DIC

--سارا قربانی، نسترن جعفری و زهرا بیات: CLEMENTINE

-- رحیممی و حاج هاشمی:birch

-- کرمعلی و کردمیل: Comparing classifiers

--بهمن یار و قربانی: partition

-- چراغی: sequential Covering methods

--- چراغی: chameleon

- partition ، اسلاید 35 از  S3-ch06FPBasicPart1

- DHP، اسلاید 35 از  S3-ch06FPBasicPart1

- DIC، اسلاید 35 از  S3-ch06FPBasicPart1

- FPGrowth ، اسلاید 41 از  S3-ch06FPBasicPart1

- ECLAT ، اسلاید 41 از  S3-ch06FPBasicPart1

-Max-pattern، اسلاید 7 از S3-ch06FPBasicPart2

-Closed-pattern، اسلاید 7 از S3-ch06FPBasicPart2

- Sequential pattern، اسلاید 7 از S3-ch06FPBasicPart2

-Other Attribute Selection Measures، اسلاید 19 از S4-08ClassBasic-Part1

Tree Pruning methods، اسلاید 21 از S4-08ClassBasic-Part1

- decision tree in relation database، اسلاید 23 از S4-08ClassBasic-Part1

-RainForest، اسلاید 24 از  S4-08ClassBasic-Part1

- BOAT، اسلاید 26 از  S4-08ClassBasic-Part1

-sequential Covering methods اسلاید 4 از S4-08ClassBasic-Part2، روشهای nFOIL, AQ, CN2, RIPPER

- Comparing classifiers اسلاید دوم از S4-08ClassBasic-Part3روشهای Confidence intervals و Cost-benefit analysis and ROC Curves

- Random Forest اسلاید 6 از S4-08ClassBasic-Part4 روشهای Forest-RI و Forest-RC

- Classification of Class-Imbalanced Data Sets اسلاید 7 از S4-08ClassBasic-Part4

-- CLARA اسلاید 21 از S6-10ClusBasic-Part2

--CLARANS اسلاید 21 از S6-10ClusBasic-Part2

--Birch اسلاید آخر S6-10ClusBasic-Part3

--Chamelone اسلاید آخر S6-10ClusBasic-Part3

ارایه ارفاقی در خصوص ابزارها (قبول به عنوان ارایه اول یا دوم)

- آقای محمدی Chartjs   -پویا خانی Weka  -   - محمدی و نفیسی PowerBi

- خانم ها نقوی و بهمن یار  Timeline     - محمدی و نفیسی  LeaftLet

--سلیمیان Datawrapper            علی طباطبایی: dygraphs

-- نقوی و بهمن یار:raw

-- Tableau: مسافرچی، خانم محمدی

-- Sisense: حمیدی و مالکی

-- HighCharts: حمیدی و مالکی

موضوع‌های باقیمانده:

- Qlik (Qlikview)

-FusionCharts

-  Charted, D3, ...

 

مباحث اضافه (قبول به عنوان ارایه سوم)

-پویا خانی REST2

-نفیسی:  JSON

-- الهام صفار: bpms

-- سارا قربانی:  BPMN2

-- نسترن جعفری: BPL

-- حمیدی: BPMS

آخرین ویرایش۰۲ بهمن ۱۳۹۶