تجزیه و تحلیل کلان داده ‌با RHadoop

نویسندگانحمید قربانی
همایشکلان داده
تاریخ برگزاری همایش۵ خرداد ۹۵
محل برگزاری همایشکاشان
نوع ارائهسخنرانی
سطح همایشبین المللی

چکیده مقاله

تا چند سال قبل نرم افزار آماری R که امروزه پر استفاده ترین نرم افزار آماری است،‌ قادر به تجزیه و تحلیل کلان داده ها نبود. اما امروزه برای تحلیل داده های کلان شیوه های متفاوتی ارایه داده است. در این مقاله ابتدا به چرایی اهمیت داده های کلان می پردازیم. سپس به اختصار جهارچوب نرم افزاری هدوپ و مولفه های مهم آن که برای ذخیره و پردازش کلان داده ها مورد نیاز است را به اختصار معرفی می کنیم. همچنین نرم افزار R ‌ و بسته نرم افزاری RHadoop معرفی شده اند که بهمراه هدوپ ما را قادر می سازند که با استفاده از تکنیکهای آماری داده های کلان را تحلیل کنیم. در پایان با ذکر مرجع، یک نمونه کلان داده مربوط به داده های خطوط هوایی به اختصار معرفی شده است.