More Related Content Similar to کلان داده کاربردها و چالش های آن (20) کلان داده کاربردها و چالش های آن1. چالش و کاربردها ،داده کالنآن های
2خادمی مریم ،1وامرزانی عزیزی حامد
1
نرم ارشد کارشناسی دانشجوی،افزارجنوب تهران واحد آزاد دانشگاه،st_h_azizi@azad.ac.ir
2
کاربردی ریاضی گروه استادیار،جنوب تهران واحد آزاد دانشگاه،khademi@azad.ac.ir
مکاتبات مسئول:وامرزانی عزیزی حامد
چکیده
مجازی فضای در اطالعات انتقال حجم روزافزون گسترش و افزایش به توجه باذخیره و ورود ،داده کالن مسأله ،الکترونیکی تجارت و بانکداری حوزه در خصوص به اینترنتحجم سازی
داده اطالعاتی اقالم از زیادیپیش ،آن مدیریت و هاپس و پردازشد متخصصین و محققان از بسیاری توجه و شده برخوردار زیادی بسیار اهمیت از اطالعات امنیت و دقت ،سرعت ،پردازشر
موقعیت ،داده کالن معرفی از پس مقاله این در .است کرده معطوف خود به را اطالعات فناوری حوزهروش ،فناوری در آن وکاربردهای هاچالش و هابررسی مورد ،را حوزه این در مطرح های
.داد خواهیم قرار
: واژه کلید( داده کالنbig dataشبکه ،هادوپ ،)ذخیره ،اجتماعی های،سازیاطالعات امنیت
1-مقدمه
باگسترشروزافزوناستفادهخدمات ازفناوری،اطالعاتوهمچنینفراگیرشدنابزارهای،دیجیتالیداده از زیادی حجم تولید باعث مجازی فضای در خود حضور واسطه به فرد هرها
میداده این .شودمی هادسته دو در تواندقسمت یک ،بگیرد قرار کلی بندیماشین توسط که است اطالعاتی بعدی قسمت و کرده تولید را آن انسان که است اطالعاتی( مختلف هایهمانند
مسیریابدوربین ،ها.است تولید حال در )... و مختلف حسگرهای ،بسته مدار ها
داده کالن«بهحجم1
داده از عظیمیهااطالقآن پردازش که که شود میبه هاداد پایگاه وسیلههاست انجام غیرقابل آن ابزارهای و سنتی های».اگزابایت چندین از بیش داده از حجم این2
(11
11داده از مختلفی انواع شامل و بوده )چندرسانه هایمی ... و متن ،ای.است افزایش حال در آن حجم تصوری غیرقابل شکل به که شود
را داده کالن از جنبه یک تنها اطالعات عظیم حجممی نشانگوناگونی ،دهد3
ذخیره اطالعات،شده سازیسرعت4
،سیستم به جدید اطالعات ورودمقادیر5
،اطالعاتوپیچیدگی6
آنها
ویژگی از همگیمی نمایان را داده کالن مفهوم که بوده فناوری از حوزه این هایچالش .سازدًاصرف حوزه این هاینمی آن مدیریت و سازی ذخیره به منوطشودپردازش و تحلیل مبحث بلکه ،
به و داده کالنمهم از ارزشمند دانش آوردن دست.است آن مسائل ترین
سال تا2113میالدی5( اگزابایت11
11می تولید انسان توسط روز دو در تنها داده از حجم این امروزه اما بود تولیدشده انسان توسط اطالعات )بایتشود.شرکتIBMخو گزارش درد
روز هر کرد اعالم5/2داده به اطالعات اگزابایتمی افزوده دنیا هایکه شود01است تولیدشده گذشته سال دو در فقط داریم دست در حاضر حال در که اطالعاتی مقدار درصد(Singh
2012).
شبکه از یکی مثال برایاز بیش روزانه که دارد کاربر میلیارد یک از بیش دنیا در محبوب اجتماعی های311میلیونتصویرمی اشتراک به یکدیگر با اجتماعی شبکه این در راتا ،گذارند
از بیش تصاویر این تعداد کنون241به و است شده گزارش میلیاردروزانه میانگین طور511ترابامی افزوده اجتماعی شبکه این اطالعات حجم به یت.شود(Tam 2012)
1
volumes
2
exabytes
3
variety
4
velocity
5
value
6
complexity
2. کالن امروزهتوا داده از عظیم از حجم این تحلیل کمک به بشر و رسیده اثبات به ... و پزشکی ،امنیت ،صنعت و بازار ،فناوری در آن کاربردهای و دادهمدیریت در کارآمدی دانش به نسته
.کند پیدا دست خود کار و کسب مؤثرتر و بهتر
شرکت تمامی برای همواره اطالعات آنالیز و مدیریتحی هر در هابر خاصی اهمیت از کاری طهآن .است خوردارراه دارند تالش همواره هاکاربه جهت در عملی هایاز اطالعات آوردن دست
.دهند انجام خود خدمات یا و محصوالت ،مشتریان
زما طول در اما نیست سختی کار اطالعات این تحلیل ،دارد خاص محصول یک و مشتری محدودی تعداد شرکت یک که زمانی... و مشتری سلیقه ،بازار فروش از زیادی اطالعات ًامسلم ن
داده از ابتدایی حجم آن با دیگر و شد خواهد تولید.نیستیم مواجه ها
به مدیران ،رقابتی بازار درکاربران یا و مشتری سالیق و عالیق با دارند نیاز متداوم طورسیاست و شوند آشنا شانحتی .کنند طراحی را جدید هایمح کار بازار مسائل به داده کالن کاربرددود
نمیشبکه اطالعات تحلیل از استفاده با امروزه بلکه شودمی اجتماعی هایپیش پایین بسیار خطای درصد با را کشور یک انتخابات توانندنموده بینی(Mahmood, Iqbal et al. 2013)
دهند سو و سمت وی محبوبیت باالرفتن و مردم افکار جهت در را انتخاباتی نامزدهای تبلیغات یا و(Bensrhir 2013).
در اطالعات از بخشی ،است باال بسیار اطالعات پیچیدگی و حجمپایگاهذخیره سنتی داده هایسرویس مجموعه ، اسناد شکل به دیگر برخی ،شده سازیداده کاربر یا مشتری به که هایی
.است نگرفته صورت آن روی بندی طبقه هیچ که مرتبط ویدئوهای و تصاویر حتی ،شده
کالن ابتدا مقاله این درچالش و کاربردها ،دادهآن هایقسم در و نموده معرفی را،بعدی تنگه قدرتمند ابزارهای از یکیمی معرفی حوزه این در اطالعات پردازش و داریگرددپایان در و
.شد خواهد بیان دارند داده کالن زمینه در مناسبی پژوهشی فرصت آینده در که موضوعاتی
2-داده کالن7
برای فارسی معادلی بخواهیم اگر“Big Data”می بگیریم نظر دربه توان"داده کالن"،"داده بزرگ"یا"داده حجیم"کالن .ندارند یکدیگر با اختالفی هیچ مفهوم در که نمود اشاره
داده از عظیمی مجموعه معنی به دادهمی هاآن پردازش که باشدبه هاداده پایگاه وسیلهاست انجام غیرقابل آن ابزارهای و سنتی های(Kaisler, Armour et al. 2013).
بیش درمقاالت و منابع تر(Gartner 2014,Sagiroglu and Sinanc 2013,Singh 2012,B.Gerhardt 2012)اند نموده بیان اصلی ویژگی سه داده کالن برای1-حجم1
2-گوناگونی0
3-سرعت11
آن به ًااصطالح که3Vsمی نیزدیگر منابعی در البته .گویند(Sagiroglu and,et al. 2013Katal, Wazid,Kaisler, Armour et al. 2013
Sinanc 2013)ِیژگیو به نیز را داده پیچیدگی و داده مقدار شده گفته اصلی ویژگی سه بر عالوهاضافه آن هایکردهاما .اندیک یا اطالعاتی جریان محیط یک که صورتی در است واضح
می گفته داده کالن مجموعه آن به کند احراز را شده برده نام مورد سه هر بتواند شبکه.شود
نام داده کالن را آن که اطالعاتی مجموعه یک تمایز وجه تشخیص البتهمی گذاریآ شرایط ًاظاهر که حجیم اطالعاتی سیستم یک و کنیمسامانه یک مثال برای .است مهم بسیار دارد را ن
دادهمی ذخیره خود در را ایران مردم اطالعات تمامی که اینمی )... و ملی شماره ،خانوادگی نام ،(نام کندتواندبه داده کالندل در را اطالعات از باالیی حجم ًاظاهر که صورتی در آید شمار
.دارد خود
7
Big data
8
Volume
9
Variety
10
Velocity
شکل1-سهویژگیاصلیکالنداده
3. 2-1-داده حجم
مهم شایدشرکت امروزه ،برشمرد داده عظیم حجم بتوان را داده کالن ویژگی ترینشبکه ًاخصوص اطالعات فناوری عرصه در نام صاحب هایمی تنهایی به اجتماعی هایروزانه توانند511
وید اشتراک سرویس مثال عنوان به ،کنند تولید جدید اطالعات ترابایتئواز بیش دقیقه هر در گوگل ی111و ساعتیدئورا خود کاربران توسط شده بارگذاریمدیریت و دریافت
می.کند(Tam 2012 , smith 2014)
2-2-داده گوناگونی
حسگر به مربوط اطالعاتتلفن ،مختلف هایشبکه در ارتباطات ،هوشمند هایساختار بدون و ساختاری صورت به که اطالعاتی گوناگونی ،اجتماعی هایمی ذخیرها پیچیده بسیار شوند،ست
داده پایگاه در اطالعات این تمام زیرارابطه هایداده این بر عالوه ،است نشده ذخیره سنتی اینیمه ،خام هاساختاری11
و ،مانند است ساختار بدون ًالکام یاایمیل،دریافتی و ارسالی های
شبکه اطالعاتنمونه از همگی ... و اجتماعی هایا هایهیچ زیرا است ساختار بدون طالعاتقالبشده تعیین پیش ازندارند اطالعات ورود برای ای(Zikopoulos 2012, Katal,
Wazid et al. 2013).
2-3-داده سرعت
داده که است معنی به داده سرعتمی منتقل و تولید سرعتی چه با مختلف اطالعاتی منابع طریق از هاداده مثال برای ،شوندحسگرهای یک توسط که هاییRFID12
مجموعه یک در
می تولیدذخیره بر عالوه که بوده باال بسیار شودسیستم است واضح ،بگیرند قرار نیز تحلیل و تجزیه مورد اطالعات باید ،لحظه در اطالعات این سازیذخیره سنتی هایو سازیتحلیل
نمی سادگی به اطالعاتنمای و بررسی مورد لحظه در را اطالعات از جریان این تواننددهند قرار ش(Zikopoulos 2012, Katal, Wazid et al. 2013).
3-داده کالن کاربرد و اهمیت
سال تا نمود اعالم آمریکا دولت2112زمینه روی بر ،فعالیت و انرژی ،دفاعی و نظامی ،مجازی فضای امنیت ،سالمت حوزه در داده کالن کاربردی هایاز بیش مرتبط تحقیقاتی های211
نموده هزینه دالر میلیون(Kaisler, Armour et al. 2013)تصمیم بهبود جهت در را آن نتایج وسیاست و گیریزمینه در گذاریبه شده برده نام هایهدف واقع در .است گرفته کار
سرمایه اصلیسازمان و گذارانآن کاربردهای و داده کالن زمینه در هاتصمیمبیش حجم تحلیل طریق از صحیح و دقیق گیریداده تر.است ها
روشالگوریتم به نسبت را خود قدرت زمانی داده کالن تحلیل تجزیه هایداده هایسیستم یا و کاویپرس هایپایگاه در پیشرفته وجودادهرابطه هایمی نمایان سنتی ایمج که سازدموعهای
داده ازنیم ،ساختاری هایاقت ،کار و کسب در داده کالن کاربردهای از مورد چند با ادامه در .شود سیستم وارد اطالعاتی مختلف منابع از ساختار بدون و ساختاری هبیش .. و صادآشنا تر
می.شویم
3-1-اطالعات فناوری
مهم ازموقعیت ترینمی اطالعات فناوری عرصه در داده کالن کاربردی هایتجزیه به توانوقایع تحلیل و13
شبکهکاربردها دیگر از .نمود اشاره شبکه به نفوذ کشف یا و خطا کشف جهت در
دست ،شبکه در نوشتن عملکرد بردن باالکلید سریع یابی-داده به مقدارقابل شماتیک ،هاداده انعطافاست اطالعات فناوری عرصه در ای(Katal, Wazid et al. 2013, Soumendra
Mohanty 2013).
3-2-کسب و اقتصادوکار
ارزش با شایدتراکنش و مشتریان اطالعات از عظیمی حجم با که جایی در ،باشد کار و کسب حوزه در اقتصادی نظر از داده کالن تحلیل کاربرد ترینآن خرید هایبا و هستیم مواجه ها
داده مناسب تحلیل و تجزیههایمی مشتریانسیاست توان.برد کار به را دقیق بازاریابی و فروش افزایش جهت مناسب راهکارهای و ها
می مثال برایبیش فروش جهت در محصول صحیح قیمت تنظیم ،مشتریان خرید سبد به مربوط اطالعات تحلیل و تجزیه با توانتوجه با فروشگاه در محصوالت قرارگیری محل طراحی ،تر
اطال بهراه کشف ،خریداران حرکت آماری عاتعرضه زنجیره مدیریت ،فروشگاه از مجدد خرید در مشتری ترغیب کارهای14
تقسیم ،مشتریان بندی15
به مناسب زمان در کاال دقیق پیشنهاد ،
نمود اشاره ... و مشتری(Marjanovic, Ariyachandra et al. 2014).
زمینه درفعالیت و اقتصادمی نیز بانکی هایداده آنالیز با توانپیش را طرح یک با مرتبط ریسک میزان هاکارت از استفاده سوء بانکی زمینه در یا و نمود بینیمش اعتباری هایشکل به تریان
شک الگوی تشخیصکاله ،تقلب یا و نفوذ کشف .برد نام اعتباری کارت از استفاده در برانگیزبرداپول یا و ریتراکنش تحلیل و تجزیه از استفاده با شوییمشتریان مالی هایمنابع دیگر با
است شده کاربردی بسیار امروزه ،نیز اطالعاتی(Soumendra Mohanty 2013).
11
Semistructured
12
Radio-Frequency IDentification
13
Log
14
Supply-chain
15
Consumer segmentations
4. 3-3-سالمت و زندگی
می سالمت و بیمه زمینه در داده کالن تحلیل کاربردهای ازکیفیت بردن باال به تواننگهنگه برنامه بهبود و بیماران از داری.نمود اشاره آنان داریپیش و بیماران با رفتار نوع تعیینگویی
م میزانؤجراحی اعمال فقیت،تعیینمیزانمؤفقیتروشهایدرمانیدربرخوردبابیماریهای،سختتشخیصبیماریهابراساسانواعاطالعات(تصاویر،پزشکیمشخصاتبیمار
احتمالی)برد نام ... و افراد در امراض ایجادکننده مختلف الگوهای بررسی و بیماران بهبودی روند بر داروها تأثیر ،(Sagiroglu and Sinanc 2013, Liu and Park 2014).
3-4-اجتم شبکهاعی
کاربردی از یکیزمینه ترینشبکه در آن تحلیل و داده کالن هایمی نمایان اجتماعی هایبهینه و محصول یک مورد در افراد نظرات بررسی .شود،باالتر فروش به رسیدن جهت در آن سازی
بهینهعالقه لیست به توجه با جستجو موتورهای در پیشنهادی کاالی سازیمندیپیش ،وی اجتماعی شبکه در فرد هایکاربران نظرات تحلیل و تجزیه از استفاده با انتخابات برنده بینی
(Mahmood, Iqbal et al. 2013)مهم از.است اجتماعی شبکه در داده کالن کاربردهای ترین
4-روش و ابزارهاموجود های
4-1-No SQL
اگر گذشته درسازمانداده از عظیمی حجم با هاداده پایگاه روی بر هارابطهای16
می مواجه خودمنظور به ،گشتندنگهتحلیل و داریرایانه َربا یک از بودند مجبور اطالعات17
داده انباره یا وای
داده پایگاه ضعف .کند استفادهرابطه هاینگه در ایداده از عظیمی حجم تحلیل و تجزیه و دارینیمه هایجدیدی فناوری کردن مطرح با دانشمندان و گشت نمایان ساختار بدون و ساختاری
نام بهNoSQL11
پایگاه از جدیدی نسل ساخت به اقدامداده هایمی که اینگه را اطالعات از عظیمی حجم تواندکند پردازش و داری،.نمودند
4-2-Apache Hadoop
قوی از یکی هادوپپایگاه تریندادهمتن هایجنبش در بازNoSQLذخیره منظور به آپاچی بنیاد توسط که استداده از عظیمی حجم پردازش و سازیغیررابطه هایمدل یک طریق از ای
توزیعمقیاس با شدهپذیری10
شرکت .است شده ساخته ،باالآن بودن باز متن ماهیت به توجه با زیادی هایمدل توزیع و ساخت به اقدامنموده هادوپ کاربردی هایمشهورترین از که اند
آنمی هابه توانHortonworksوCloudera.نمود اشارهذخیره سیستم از الهام با هادوپسازیBigTableفایل سیستم ،GFS21
نگاشت تکنیک و-کاهش21
پیش کهتوسط تر
،بود شده کاربردی و طراحی گوگل شرکتداده پایگاه با جایگزینی هادوپ توزیع از هدف واقع در .شد ساختهانباره یا و سنتی هایداده هایمی هادوپ بلکه نیست ایا استفاده با تواندز
داده تحلیل و تجزیه و داری نگه ،شده توزیع سیستم فایل مدیریت ابزار مانند خود کاربردی ابزارهایدرخواست ،هامقیاس با را هاپذیر.نماید پردازش و اجرا موازی شکل به باال ی
شکل2-ساختارهادوپ ارتباطی
16
RDBMS
17
Main-frame
18
Not Only SQL
19
Scalability
20
Google File System
21
Map-Reduce
5. HDFS22
:توزیع فایل سیستم یکمقیاس ،شدهداده ،اطمینان قابلیت افزایش برای فایل سیستم این .است شده نوشته جاوا زبان از استفاده با که بوده اطمینان قابل و پذیردر را ها
میزبانمی تکثیر مختلف هایقابلیت به دلیل همین به و کندRAIDمیزبان روی.ندارد احتیاجی ها
HBase:غیررابطه ،شده توزیع داده پایگاهایمی ایجاد هادوپ برای را تصادفی نوشتن و خواندن دسترسی که است باز متن و.کند
نگاشت چارچوب-:کاهشنرم چارچوبتوزیع محاسبات اجرای جهت افزاریداده از عظیمی مجموعه روی شدهذخیره هایخوشه روی شدههای23
شبکهسال در که است ای2114
.شد معرفی و ساخته گوگل توسط میالدی
درکوچک مجموعه سری یک به ورودی اطالعات ،نگاشت مرحلهدسته ترمی تقسیم شده بندی(کلید زوج از شده مرتب لیست یک نگاشت مرحله خروجی و شود-مقدار24
.بود خواهد )
مرتب اطالعات دارد نام کاهش گام که بعد درمرحلهدسته در ،شدهمی تولید نهایی خرجی و شده ادغام کوچکتر هایشود(Bakshi 2012).
می موازی اجرای برای چارچوب این از استفاده مزایای از:نمود اشاره زیر موارد به توان
oمقیاسباال پذیری
oمحاسباتی بار پخش25
بهگره روی بر متعادل صورتها
oبهینهشبکه و دیسک بین اطالعات انتقال سازی
oتداخل بدون موازی اجرای
oباال خطای مقاومت
Hive:داده از عظیمی مجموعه تحلیل و تجزیه امکانبه شبیه زبانی ارائه با را دارد قرار هادوپ با سازگار سیستم فایل روی بر که هاSQLمی کاربران اختیار در.گذارد
Pig:سال در2116نگاشت عملیات اجرای و ایجاد جهت ساده روشی ،یاهو تحقیقاتی مراکز توسط-ا عظیمی مجموعه روی کاهشداده زکه شد ساخته هاPig.گرفت نام
Mahout:دسته جهت ابزاریطبقه و بندیداده بندیالگوریتم از استفاده با ها.است ماشین یادگیری های
Oozie:مختصات سرویس.دارد عهده بر را داده پردازش مختلف عملیات مدیریت که است کار گردش و دهی
5-در اطالعات تحلیل حوزه مسائلداده کالن
5-1-روش کاربرد عدمداده کالن در اطالعات تحلیل سنتی های
داده سنتی تحلیل و تجزیه علم در(داده هاداده ،)کاویانباره در معمول طور به اولیه هایداده هایداده انباره هر و گرفته قرار ایمی نیز ایبرای شده تعریف پیش از قالب یک از بایست
مدیریت و نگهداریدادهمی استفاده خود هایداده انباره از استفاده نماید اجرایی اطالعات روی بر را خود تحلیل و تجزیه ،کاربرد و نیاز براساس بتواند تا کردمعایب اطالعات تحلیل در ایی
تصمیم در فناوری امروز کاربردهای به توجه با راداده است این اول مشکل .دارد گیرینبو روز به آن هایمی زیادی زمان مدت آن تولید عمر از و دهکاربرد از بعضی در و گذردتحلیل های
داده به نیاز داده کالنانباره در اطالعات مدیریت به مربوط دوم مشکل .داریم برخط و جدید هایدادهمی کنترل و مدیریت تیم یک توسط و بوده متمرکز شکل به که است ایام شوددر ا
حج با داده کالنداده از عظیمی ممو اجرای قابلیت باید داده از حجم این روی تحلیلی و پردازشی عمل هر که داریم برخورد دارد قرار شده توزیع و غیرمتمرکز شکل به که هاروی بر ازی
خوشه زیادی تعداد.باشد داشته را شبکه در ها
5-2-چالشداده تحلیل های
چالش همواره حوزه این دربه زیادی هایویژگی و داده کالن ماهیت دلیلچالش از .هست و بوده مطرح آن هایمی آن روز هاینیمه اطالعات تحلیل به تواناشاره ساختار بدون و ساختاری
روش از یکی .نمودداده در اطالعات تحلیل هایفراداده از استفاده متنی ساختار بدون های26
پیامی اجتماعی شبکه در فردی مثال برای استمی شکل این بهنویسد"پوشش وضعیت از من
سرویس است بهتر ،دارد را شبکه پوشش بهترین بود شده گفته تبلیغات در که صورتی در نیستم راضی خود همراه تلفن شبکه!کنم عوض را خود دهنده"مشتری قصد از شدن آگاه برای
شبکهفراداده خود استنتاج موتور از استفاده با اجتماعی هایهمانند کلیدی ای"سرویسدهنده"،"نیستم راضی"،"رضایت"،"قصد"نشانه رامی لحظه در و کرده گذاریداده توانندرا ها
ف مدیریت مبحث همواره و است نیز ویدئو و صداها ،تصاویر از عظیمی حجم شامل و نبوده متن به محدود داده کالن که است مشخص .کنند تحلیلرادادهی عنوان به هاروش از کیهای
بیش پژوهش به نیاز که است جذاب موضوعی داده کالن در اطالعات تحلیل.دارد تری
22
Hadoop Distributed File System
23
Cluster
24
(Key,Value)
25
Load Balancing
26
Metadata
6. مقاله این در(Kaisler, Espinosa et al. 2014)16طبقهپاک مباحث از و شده آورده داده کالن در اطالعات تحلیل مختلف انواع از بندیآماده و سازیداده سازیغنی ،هاسازی27
دادهنامتعادل جمعیت ،خام های21
چالش عنوان بهداده تحلیل هایمی نام ها.برد
5-3-چالششخصی حریم و امنیت های
چالش ازشبکه در ًاخصوص داده کالن در خصوصی حریم هایفرد برای که شود منجر دانشی کشف به است ممکن تحلیل از پس که است افراد حساس اطالعات ،اجتماعی های
.باشد داشته اطالع آن از دیگری شخص هر یا و اطالعات دارنده ندارد تمایل و بوده خصوصی
اافراد خصوصی حریم اطالعات از دولت یا و قانون مجری ستفاده
شبکه ،جستجو موتورهای مؤثر تبلیغات در افراد شخصی اطالعات از استفاده... و الکترونیکی پست ،اجتماعی های
5-4-چالشپردازشی و فنی های
راه و ابری رایانش مفهوم کنار درمقیاس رفتن باال در آن کارهایالگوریتم از بعضی ،شبکه در پذیریفناوری و هاداده تحلیل هایداده نشان خود از را مناسبی عملکرد پایین مقیاس در هااند
مقاله این در اما(Armour et al. 2013Kaisler,)می گفتهالگوریتم از بعضی شودفناوری و هامقیاس است آمده ادامه در که حاضر حال هایزتابایت حجم اندازه به پذیری20
نداشته را
.باشند
تکنیکماشین یادگیری های
متنی اطالعات تحلیل-ویدئویی-ساختار بدون صوتی
داده تصویرسازیها31
ابری رایانش
دادهکاوی
الگوریتممش و گراف های
داده شدن اضافهالگوریتم به ساختاری هایموجود های
6-نتیجهآینده کارهای و گیری
ویژگی و داده کالن معرفی از پس مقاله این درچالش و کاربردها ،آن هایقوی عنوان به هادوپ ساختار و گرفت قرار بررسی مورد آن هایابزار ترین مطرح و ترینکالن تحلیل و مدیریت
تصمیم به کمک .گشت تبیین دادهمی را تجاری هوش رفتن باال و صحیح و دقیق گیریمهم از توانشرکت که نمود عنوان داده کالن دستاوردهای ترینسازمان و هاسالی چند بزرگ های
توانسته آن کمک به استعرصه اند.کنند تعریف مدیریت و فناوری در جدید ای
مباحمی آینده در که است کاربردهایی از مورد چند فقط زیر ثبیش تواندبه و گیرد صورت پژوهش آن روی بر تر.است مطرح آن در متعددی مسائل همواره ،عرصه این بودن نوظهور دلیل
می فعالیت ابری رایانش زمینه در که افرادیمی کنندعنوان به داده کالن همانند مسائلی روی بر توانندسرویس31
سرویس عنوان به تحلیل سکوی یا و32
پژوهش ابری رایانش بستر در
مدل ارائه ،نمایندراه برای متنوع تجاری هایکسب یک اندازیوسازمان دیگر به داده تحلیل سرویس ارائه خواستار که ،کارنرم کوچک شرکت یک ًالمث .است هادارای که افزاری
داده متخصصینمی است کاویتواندداده ،اعتمادسازی فرآیند یک طی با سپس ،کرده استفاده سرویس عنوان به زیرساخت ازسازمان هایاستفاده با و گرفته اختیار در را مختلف های
روش از.دهد قرار مدیران اختیار در سرویس عنوان به را نتایج سپس و کند سازمان نیاز مورد دانش استخراج به شروع اطالعات تحلیل های
درنگاشت چارچوب-می اجرا ابری درمحیط الگوریتم یک که زمانی کاهشگره بین را کار دارد وظیفه نگاشت تابع شودبخش به کار تقسیم .کند تقسیم کارگر هایمسا هایهمیشه وی
بیش تقسیمات تعداد چه هر ،باشد قواعد استخراج هدف اگر مثال عنوان به .نیست راحت و آسانقا استخراج شود ترمشکل عدهنگاشت از مناسبی تعداد تعیین بنابراین .بود خواهد ترها
گره تعداد یازمینه از یکی هامی تحقیقاتی های.باشد تواند
نگاشت همانند موازی چارچوب یک اساس بر دارد نیاز ابری محیط یک در موازی اجرای برای اطالعات پردازش و تحلیل الگوریتم هر-بسیار ،شود نوشته کاهشالگوریتم از یهای
دادهمی مبحث این و نشده نوشته آن موازی اجرای مدل حال به تا که دارد وجود کاوی.باشد حوزه این در مناسب پژوهشی زمینه تواند
27
Enrichment
28
Population Imbalance
29
Zettabytes ( 1021
bytes)
30
Visualization
31
Big Data as a Service (BDaas)
32
Analytical platform as a service (APaas)
7. مقیاسبرنامه سطح در چه پذیریابر بستر در کاربران به سرویس ارائه در اساسی مسائل از یکی داده پایگاه سطح در چه و کاربردیپایگاه پذیری مقیاس افزایش بنابراین .استدادههای
NoSQLپژوهش از هادوپ خصوصا و.دارد بسیار کار جای که است هایی
همانشد گفته طورکهMahoutدسته ابزارهای از یکیخوشه و بندیالگوریتم مجموعه از استفاده با ابزار این .است هادوپ در اطالعات بندینگاشت مدل در که هایی-کاهش
پیادهمی شده سازیدسته تواندخوشه و بندیداده روی بر را بندیمی آتی کارهای عنوان به ،دهد انجام هاالگوریتم تواننگاشت مدل تحت کتابخانه این به را جدیدی های-کاهشاضافه
.نمود
منابعاستفاده مورد:
B.Gerhardt, K. G. a. R. K. (2012). "Unlocking Value in the Fragmented World of Big Data Analytics." Cisco Internet
Business
Solutions Group.
Bakshi, K. (2012). Considerations for big data: Architecture and approach. Aerospace Conference, 2012 IEEE.
Bensrhir, A. (2013). Big data for geo-political analysis: Application on Barack Obama's remarks and speeches. Computer
Systems and Applications (AICCSA), 2013 ACS International Conference on.
Gartner. (2014). "big data definition." from https://www.gartner.com/it-glossary/big-data./
Kaisler, S., F. Armour and A. Espinosa (2013). Introduction to Big Data: Scalable Representation and Analytics for Data
Science Minitrack. System Sciences (HICSS), 2013 46th Hawaii International Conference on.
Kaisler, S .H., J. A. Espinosa, F. Armour and W. H. Money (2014). Advanced Analytics -- Issues and Challenges in a Global
Environment. System Sciences (HICSS), 2014 47th Hawaii International Conference on.
Katal, A., M. Wazid and R. H. Goudar (2013). Big data: Issues, challenges, tools and Good practices. Contemporary
Computing (IC3), 2013 Sixth International Conference on.
Liu, W. and E. K. Park (2014). Big Data as an e-Health Service. Computing, Networking and Communications (ICNC), 2014
International Conference on.
Mahmood, T., T. Iqbal, F. Amin, W. Lohanna and A. Mustafa (2013). Mining Twitter big data to predict 2013 Pakistan
election winner. Multi Topic Conference (INMIC), 2013 16th International.
Marjanovic, O., T. Ariyachandra and B. Dinter (2014). Introduction to Business Analytics, Business Intelligence, and Big Data
Minitrack. System Sciences (HICSS), 2014 47th Hawaii International Conference on.
Sagiroglu, S. and D. Sinanc (2013). Big data: A review. Collaboration Technologies and Systems (CTS), 2013 International
Conference on.
Singh, S. (2012). Big Data analytics. Communication, Information & Computing Technology (ICCICT), 2012 International
Conference on.
smith, c. (2014). "amazing youtube statistics." from http://expandedramblings.com/index.php/youtube-statistics/#.U2c-
79ySzJV.
Soumendra Mohanty, M. J., Harsha Srivatsa (2013). Big Data Imperatives: Enterprise ‘Big Data’ Warehouse, ‘BI’
Implementations and Analytics.
Tam, D. (2012 ). "Facebook processes more than 500 TB of data daily." from http://www.cnet.com/news/facebook-
processes-more-than-500-tb-of-data-daily./
Zikopoulos, P. (2012). Understanding big data : analytics for enterprise class Hadoop and streaming data. New York,
McGraw-Hill.