نویسندگان | حمید قربانی |
---|---|
همایش | کلان داده |
تاریخ برگزاری همایش | ۵ خرداد ۹۵ |
محل برگزاری همایش | کاشان |
نوع ارائه | سخنرانی |
سطح همایش | بین المللی |
چکیده مقاله
تا چند سال قبل نرم افزار آماری R که امروزه پر استفاده ترین نرم افزار آماری است، قادر به تجزیه و تحلیل کلان داده ها نبود. اما امروزه برای تحلیل داده های کلان شیوه های متفاوتی ارایه داده است. در این مقاله ابتدا به چرایی اهمیت داده های کلان می پردازیم. سپس به اختصار جهارچوب نرم افزاری هدوپ و مولفه های مهم آن که برای ذخیره و پردازش کلان داده ها مورد نیاز است را به اختصار معرفی می کنیم. همچنین نرم افزار R و بسته نرم افزاری RHadoop معرفی شده اند که بهمراه هدوپ ما را قادر می سازند که با استفاده از تکنیکهای آماری داده های کلان را تحلیل کنیم. در پایان با ذکر مرجع، یک نمونه کلان داده مربوط به داده های خطوط هوایی به اختصار معرفی شده است.