SlideShare une entreprise Scribd logo
1  sur  7
‫عقاید‬ ‫تحلیل‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫های‬ ‫چالش‬ ‫و‬ ‫کاربرد‬ ‫بررسی‬
‫وامرزانی‬ ‫عزیزی‬ ‫حامد‬**
‫نرم‬ ‫کامپیوتر‬ ‫مهندسی‬ ‫گروه‬‫افزار‬
‫تهران‬ ‫مهندسی‬ ‫و‬ ‫فنی‬ ‫دانشکده‬‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،‫جنوب‬
‫ایران‬ ،‫تهران‬
st_h_azizi@azad.ac.ir
‫خادمی‬ ‫مریم‬
‫ری‬ ‫گروه‬‫اضی‬‫کاربردی‬
‫دانشکده‬‫جنوب‬ ‫تهران‬ ‫پایه‬ ‫علوم‬‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،
‫ایران‬ ،‫تهران‬
khademi@azad.ac.ir
‫چکیده‬—‫رسانه‬ ‫محبوبیت‬ ‫و‬ ‫گسترش‬ ‫با‬‫جوامع‬ ‫این‬ ،‫محور‬ ‫کاربر‬ ‫های‬
‫تج‬ ،‫سیاسی‬ ‫گوناگون‬ ‫اطالعات‬ ‫از‬ ‫ارزشمند‬ ‫منبعی‬ ‫به‬ ‫مجازی‬،‫اری‬
‫نشان‬ ‫اطالعاتی‬ ‫این‬ .‫است‬ ‫شده‬ ‫تبدیل‬ ... ‫و‬ ‫اجتماعی‬‫و‬ ‫افکار‬ ‫دهنده‬
‫وسیع‬ ‫دید‬ ‫در‬ ‫و‬ ‫فرد‬ ‫یک‬ ‫احساسات‬‫با‬ ‫که‬ ‫است‬ ‫کشور‬ ‫یک‬ ‫و‬ ‫جامعه‬ ،‫تر‬
‫داده‬ ‫این‬ ‫در‬ ‫کاوش‬‫می‬ ‫ها‬‫حوزه‬ ‫در‬ ‫ارزشی‬ ‫با‬ ‫بسیار‬ ‫دانش‬ ‫به‬ ‫توان‬‫های‬
‫کالن‬ ‫اطالعات‬ ‫از‬ ‫حجم‬ ‫این‬ ‫تحلیل‬ ‫است‬ ‫واضح‬ .‫یافت‬ ‫دست‬ ‫گوناگون‬
‫غیرساخت‬‫یاف‬‫روش‬ ‫نیازمند‬ ،‫کاربران‬ ‫ته‬‫متن‬ ‫بهینه‬ ‫و‬ ‫نوین‬ ‫های‬‫و‬ ‫کاوی‬
.‫است‬ ‫طبیعی‬ ‫زبان‬ ‫پردازش‬
‫تحلیل‬ ‫کاربردهای‬ ‫معرفی‬ ‫از‬ ‫پس‬ ‫مقاله‬ ‫این‬ ‫در‬‫عقاید‬‫یک‬ ‫در‬ ‫کاربران‬
‫کالن‬ ‫مجموعه‬‫شبکه‬ ‫همانند‬ ‫داده‬‫های‬‫سایت‬ ‫یا‬ ‫و‬ ‫اجتماعی‬‫بزرگ‬ ‫های‬
‫چالش‬ ،‫مباحث‬ ‫آخرین‬ ،‫اینترنتی‬ ‫فروش‬‫راه‬ ‫و‬ ‫ها‬‫حوزه‬ ‫این‬ ‫در‬ ‫کارها‬‫مورد‬
.‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫بررسی‬
‫واژ‬‫ه‬‫کلیدی‬ ‫های‬-‫متن‬ ،‫اجتماعی‬ ‫شبکه‬،‫کاوی‬‫کالن‬‫داده‬‫تحلیل‬ ،‫عقاید‬،
‫طبقه‬‫بندی‬
1.‫مقدمه‬
‫ارزش‬ ‫گاهی‬ ‫و‬ ‫مشترک‬ ‫وجوه‬ ‫داشتن‬ ‫دلیل‬ ‫به‬ ‫جامعه‬ ‫در‬ ‫افراد‬‫مشترک‬ ‫های‬
‫شبکه‬ ‫و‬ ‫گذاشته‬ ‫تأثیر‬ ‫یکدیگر‬ ‫روی‬ ‫بر‬‫آن‬ ‫بین‬ ‫در‬ ‫اعتماد‬ ‫و‬ ‫ارزش‬ ‫از‬ ‫ای‬‫ها‬
‫خاصی‬ ‫موضوعات‬ ‫برای‬‫می‬ ‫ایجاد‬.‫گردد‬
‫شبکه‬‫اجتماعی‬ ‫های‬‫فروشگاه‬ ،‫وبالگ‬ ‫و‬ ‫اینترنتی‬ ‫های‬‫ها‬‫منبع‬ ‫به‬
‫ارز‬‫شمند‬‫زمینه‬ ‫در‬ ‫احساسات‬ ‫کاوش‬ ‫برای‬ ‫ی‬‫مدیریت‬ ‫نظیر‬ ‫گوناگونی‬ ‫هایی‬
،‫مشتری‬ ‫با‬ ‫ارتباط‬‫جامعه‬‫کاوش‬ ،‫بازاریابی‬ ،‫شناسی‬‫افکار‬‫و‬ ‫سیاست‬ ،‫عمومی‬
‫تبدیل‬ ...‫شده‬‫ان‬.‫د‬‫رسیده‬ ‫اثبات‬ ‫به‬ ‫حقیقت‬ ‫این‬‫ب‬ ‫دانش‬ ‫که‬‫ه‬‫دست‬‫آ‬‫از‬ ‫مده‬
‫شبکه‬‫فیس‬ ‫و‬ ‫توییتر‬ ‫نظیر‬ ‫اجتماعی‬ ‫های‬‫بوک‬‫سایت‬ ‫یا‬ ‫و‬‫فروش‬ ‫بزرگ‬ ‫های‬
‫روش‬ ‫دیگر‬ ‫به‬ ‫نسبت‬ ‫باالتری‬ ‫ارزش‬ ‫مراتب‬ ‫به‬ ‫آمازون‬ ‫همانند‬ ‫اینترنتی‬‫های‬
‫زیرا‬ ،‫دارند‬ ‫افراد‬ ‫از‬ ‫فیزیکی‬ ‫مصاحبه‬ ‫و‬ ‫نظرسنجی‬ ‫مانند‬ ‫عقیده‬ ‫کاوش‬ ‫سنتی‬
‫این‬ ‫در‬‫شبکه‬ ‫گونه‬‫خالص‬ ‫نظرات‬ ‫کاربران‬ ً‫ال‬‫معمو‬ ‫ها‬‫می‬ ‫ارائه‬ ‫را‬ ‫خود‬‫و‬ ‫دهند‬
.‫نیست‬ ‫تأثیرگذار‬ ‫آن‬ ‫روی‬ ‫بر‬ ‫عاملی‬ ‫هیچ‬ ‫نوعی‬ ‫به‬
‫به‬‫می‬ ‫مردم‬ ‫اطالعاتی‬ ‫منبع‬ ‫این‬ ‫وسیله‬‫صحیح‬ ‫تصمیمات‬ ‫توانند‬‫با‬ ‫تری‬
‫محصول‬ ‫صاحبان‬ ‫راستا‬ ‫همین‬ ‫در‬ ‫و‬ ‫کنند‬ ‫اتخاذ‬ ‫افراد‬ ‫دیگر‬ ‫تجربیات‬ ‫به‬ ‫توجه‬
‫می‬ ‫نیز‬ ‫خدمات‬ ‫یا‬ ‫و‬‫عقاید‬ ‫و‬ ‫نظرات‬ ‫این‬ ‫تحلیل‬ ‫به‬ ‫توجه‬ ‫با‬ ‫توانند‬‫خود‬ ‫کیفیت‬
.‫بخشند‬ ‫بهبود‬ ‫را‬
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
2
‫آمارها‬ ‫آخرین‬ ‫طبق‬[9]‫فیس‬ ‫اجتماعی‬ ‫شبکه‬‫پیدایش‬ ‫زمان‬ ‫از‬ ‫بوک‬
‫سال‬ ‫در‬ ‫خود‬ ‫رسمی‬2004‫توانسته‬ ‫تاکنون‬44/9‫که‬ ‫را‬ ‫فعالی‬ ‫کاربر‬ ‫میلیارد‬
‫می‬ ‫خود‬ ‫شخصی‬ ‫صفحه‬ ‫وارد‬ ‫بار‬ ‫یک‬ ‫حداقل‬ ‫ماهیانه‬‫دنیا‬ ‫سراسر‬ ‫در‬ ‫را‬ ‫شوند‬
‫حدود‬ ‫دقیقه‬ ‫یک‬ ‫در‬ ‫کاربران‬ ‫این‬ ،‫کند‬ ‫جذب‬000/49‫عنوان‬ ‫به‬ ‫را‬ ‫متنی‬ ‫بار‬
‫فیس‬ ‫در‬ ‫وضعیت‬‫می‬ ‫بوک‬‫نو‬‫یسند‬[2]،‫توییتر‬ ‫اجتماعی‬ ‫شبکه‬ ‫در‬ ‫اما‬‫روزانه‬
000‫به‬ )‫(توییت‬ ‫نوشته‬ ‫میلیون‬33‫زب‬‫می‬ ‫منتشر‬ ‫کاربران‬ ‫توسط‬ ‫دنیا‬ ‫زنده‬ ‫ان‬
‫شود‬.‫از‬ ‫بیش‬ ‫آمازون‬ ‫اینترنتی‬ ‫فروش‬ ‫بزرگ‬ ‫سایت‬ ‫در‬270‫فعال‬ ‫کاربر‬ ‫میلیون‬
‫دارد‬ ‫وجود‬‫در‬ ‫را‬ ‫نظرات‬ ‫از‬ ‫عظیمی‬ ‫حجم‬ ‫که‬‫وارد‬ ‫مختلف‬ ‫محصوالت‬ ‫مورد‬
.‫کنند‬ ‫می‬
‫خوان‬ ‫است‬ ‫واضح‬‫نظرات‬ ‫از‬ ‫بخشی‬ ‫حتی‬ ‫یا‬ ‫و‬ ‫تمامی‬ ‫بررسی‬ ‫و‬ ‫دن‬
‫وقت‬ ‫کاری‬ ‫کاربران‬‫در‬ ‫و‬ ‫گیر‬‫داده‬ ‫از‬ ‫عظیم‬ ‫حجم‬ ‫این‬،‫است‬ ‫غیرممکن‬
‫عقیده‬ ‫حوزه‬ ‫در‬ ‫بنابراین‬‫ابزاری‬ ‫بهبود‬ ‫و‬ ‫ساخت‬ ‫دنبال‬ ‫به‬ ‫پژوهشگران‬ ‫کاوی‬
‫به‬ ‫توجه‬ ‫با‬ ‫را‬ ‫کاربران‬ ‫نظرات‬ ‫و‬ ‫عقیده‬ ‫خودکار‬ ‫صورت‬ ‫به‬ ‫بتواند‬ ‫که‬ ‫هستند‬
‫نوشته‬‫های‬‫آنان‬‫استخراج‬‫ذی‬ ‫به‬ ‫کلی‬ ‫وضعیت‬ ‫یک‬ ‫و‬ ‫کند‬.‫بدهد‬ ‫نفعان‬
2.‫مفاهیم‬‫و‬‫الیه‬‫تحلیل‬ ‫مختلف‬ ‫های‬
‫تعار‬‫ی‬‫ف‬‫ز‬‫ی‬‫اد‬‫ی‬‫ب‬ ‫مختلف‬ ‫مقاالت‬ ‫در‬‫ی‬‫ان‬‫همگ‬ ‫که‬ ‫شده‬‫ی‬‫ی‬‫ک‬‫معنا‬‫ی‬‫واحد‬
‫تحل‬ .‫دارند‬ ‫را‬‫ی‬‫ل‬‫احساسات‬‫و‬‫عق‬‫ی‬‫ده‬‫‏‬‫کاوی‬‫معن‬ ‫به‬‫ی‬‫شناخت‬ ‫و‬ ‫کشف‬
‫و‬ ‫مثبت‬ ‫احساسات‬‫ی‬‫ا‬‫منف‬‫ی‬‫به‬ ‫راجع‬ ‫مردم‬‫ی‬‫ک‬‫مسأله‬‫ی‬‫ا‬‫است‬ ‫محصول‬[3].
‫چهارگانه‬ ‫یک‬ ‫نظر‬ ‫یک‬ :‫نظر‬(g, s, h, t)‫آن‬ ‫در‬ ‫که‬ ‫است‬g‫هدف‬
‫که‬ ‫(آنچه‬"‫نظر‬"،)‫است‬ ‫شده‬ ‫بیان‬ ‫آن‬ ‫مورد‬ ‫در‬s،‫شده‬ ‫بیان‬ ‫حس‬h
‫و‬ ‫نظر‬ ‫صاحب‬t‫نظر‬ ‫بیان‬ ‫زمان‬‫است‬.
:‫موجودیت‬‫موجودیت‬ ‫یک‬e،‫شخص‬ ،‫سرویس‬ ،‫محصول‬ ‫یک‬
‫می‬ ‫تعریف‬ ‫جفت‬ ‫یک‬ ‫با‬ ‫که‬ ‫است‬ ‫عنوانی‬ ‫یا‬ ‫سازمان‬ ،‫رخداد‬-
:‫شود‬e:(T,W)‫که‬T‫امثال‬ ‫و‬ ‫زیرجزء‬ ‫و‬ ‫جزء‬ ‫مراتب‬ ‫سلسله‬ ‫یک‬
‫و‬ ‫آن‬W‫خص‬ ‫مجموعه‬‫ا‬‫هم‬ ‫زیرجزء‬ ‫هر‬ .‫است‬ ‫موجودیت‬ ‫آن‬ ‫یص‬
‫خص‬ ‫خودش‬‫ا‬.‫داراست‬ ‫را‬ ‫خود‬ ‫یص‬‫آن‬ ‫همگی‬ ‫وجود‬‫ضروروی‬ ‫ها‬
‫با‬ ‫تحلیل‬ ‫کار‬ ،‫قسمت‬ ‫پنج‬ ‫این‬ ‫از‬ ‫یک‬ ‫هر‬ ‫نبود‬ ‫صورت‬ ‫در‬ ‫و‬ ‫بوده‬
‫روبه‬ ‫مشکل‬.‫شد‬ ‫خواهد‬ ‫رو‬
‫عقیده‬‫م‬ ‫تقسیم‬ ‫تحلیل‬ ‫مختلف‬ ‫سطح‬ ‫سه‬ ‫در‬ ‫کاوی‬‫ی‬‫شود‬[4].
‫سند‬ ‫سطح‬‫آن‬ ‫دنبال‬ ‫به‬ ‫نظری‬ ‫سند‬ ‫یک‬ ‫داشتن‬ ‫با‬ ‫سطح‬ ‫این‬ ‫در‬ :
‫منفی‬ ‫یا‬ ‫مثبت‬ ‫نظر‬ ‫سند‬ ‫این‬ ‫کل‬ ‫بدانیم‬ ‫که‬ ‫هستیم‬.‫دارد‬‫عنوان‬ ‫به‬
‫مقاله‬ ‫یک‬ ‫داشتن‬ ‫با‬ ‫مثال‬‫نقد‬ ‫یا‬‫مشخص‬ ‫سیستم‬ ،‫محصول‬ ‫یک‬ ‫از‬
‫می‬.‫است‬ ‫بوده‬ ‫منفی‬ ‫یا‬ ‫مثبت‬ ‫کلی‬ ‫نظر‬ ‫مسأله‬ ‫مورد‬ ‫در‬ ‫که‬ ‫نماید‬
‫جمله‬ ‫سطح‬:‫مث‬ ‫های‬ ‫دسته‬ ‫به‬ ‫جمالت‬‫و‬ ،‫منفی‬ ،‫بت‬‫دسته‬ ‫خنثی‬
‫می‬ ‫بندی‬‫شوند‬.
‫ویژگی‬ ‫و‬ ‫موجودیت‬ ‫سطح‬:‫زبان‬ ‫ساختارهای‬ ‫به‬ ‫پرداختن‬ ‫جای‬ ‫به‬
‫خود‬ ‫سراغ‬ ‫مستقیما‬ ‫سطح‬ ‫این‬ ‫در‬ ... ‫و‬ ‫عبارت‬ ،‫پارگراف‬ ،‫جمله‬ ‫مثل‬
‫می‬ ‫نظر‬‫جزء‬ ‫(دو‬ ‫آن‬ ‫به‬ ‫مربوط‬ ‫حس‬ ‫و‬ ‫موجودیت‬ ‫اغلب‬ .‫رویم‬
‫می‬ ‫هم‬ ‫با‬ ‫همراه‬ )‫نظر‬ ‫اصلی‬‫کشف‬ ‫دنبال‬ ‫به‬ ‫سطح‬ ‫این‬ ‫در‬ .‫آیند‬‫حس‬
‫موجودیت‬ ‫روی‬‫جنبه‬ ‫و‬ ‫ها‬‫ها‬9
‫هستیم‬ ‫آنها‬ ‫مختلف‬ ‫ها)ی‬ ‫(ویژگی‬‫که‬
.‫دارد‬ ‫بیشتر‬ ‫های‬ ‫پیچیدگی‬ ‫قبل‬ ‫حالت‬ ‫دو‬ ‫به‬ ‫نسب‬ ‫به‬
3.‫تاریخچه‬‫کاربرد‬ ‫و‬
‫اولین‬ ‫از‬ ‫یکی‬‫تحقیقات‬‫سال‬ ‫در‬ ‫حوزه‬ ‫این‬ ‫در‬9171‫کاربنل‬ ‫توسط‬[0]
‫شبیه‬ ‫مدل‬ ‫یک‬ ‫از‬ ‫وی‬ ،‫شد‬ ‫معرفی‬‫که‬ ‫کرد‬ ‫طراحی‬ ‫را‬ ‫کامپیوتری‬ ‫شده‬ ‫سازی‬
‫می‬‫را‬ ‫کار‬ ‫محافظه‬ ‫یا‬ ‫و‬ ‫خواه‬ ‫آزادی‬ ‫حزب‬ ‫از‬ ‫فرد‬ ‫یک‬ ‫سیاسی‬ ‫عقاید‬ ‫توانست‬
‫سیاست‬ ‫به‬ ‫توجه‬ ‫با‬‫و‬ ‫آمریکا‬‫روسیه‬‫سیاست‬ ‫دیگر‬ ‫و‬‫بین‬ ‫های‬‫مدل‬ ‫المللی‬-
‫نما‬ ‫سازی‬.‫ید‬
‫احساسات‬ ‫تحلیل‬ ‫عبارت‬ ‫اما‬‫در‬[6]‫عقیده‬ ‫اصطالح‬ ‫و‬‫در‬ ‫نیز‬ ‫کاوی‬[7]
‫زبان‬ ‫اگرچه‬ ،‫شد‬ ‫برده‬ ‫نام‬ ‫بار‬ ‫اولین‬ ‫برای‬‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫و‬ ‫شناسی‬‫سابقه‬
‫سال‬ ‫از‬ ‫قبل‬ ‫تا‬ ‫اما‬ ‫دارند‬ ‫تحقیقاتی‬ ‫طوالنی‬2000‫پژوهش‬ ‫میالدی‬‫بسیار‬ ‫های‬
.‫بود‬ ‫پذیرفته‬ ‫صورت‬ ‫احساسات‬ ‫تحلیل‬ ‫با‬ ‫رابطه‬ ‫در‬ ‫محدودی‬
‫سال‬ ‫در‬ ‫شاخه‬ ‫این‬ ‫در‬ ‫تحقیقات‬ ‫گسترش‬،‫دارد‬ ‫مختلفی‬ ‫دالیل‬ ‫اخیر‬ ‫های‬
ً‫ال‬‫او‬‫حوزه‬ ‫هر‬ ‫تقریبا‬ ‫آن‬ ‫کاربرد‬‫می‬ ‫شامل‬ ‫را‬ ‫ای‬‫به‬ ‫شود‬‫صنعت‬ ‫بخش‬ ‫در‬ ‫ویژه‬
‫تحلیل‬ ‫را‬ ‫بازار‬ ً‫ال‬‫کام‬ ‫دارند‬ ‫نیاز‬ ‫مشاغل‬ ‫صاحبان‬ ،‫بازار‬ ‫بودن‬ ‫رقابتی‬ ‫دلیل‬ ‫به‬
‫برای‬ ‫را‬ ‫زیادی‬ ‫هزینه‬ ‫هستند‬ ‫حاضر‬ ‫و‬ ‫باشند‬ ‫آگاه‬ ‫مشتریان‬ ‫نظرات‬ ‫از‬ ‫و‬ ‫نموده‬
‫چالشی‬ ‫حوزه‬ ‫یک‬ ً‫ا‬‫ثانی‬ ‫دهند‬ ‫انجام‬ ‫اطالعات‬ ‫این‬ ‫داشتن‬‫به‬ ،‫است‬ ‫تحقیقاتی‬-
‫به‬ ‫فارسی‬ ‫زبان‬ ‫در‬ ‫خصوص‬‫پیچیدگی‬ ‫دلیل‬‫زیادی‬ ‫کار‬ ‫جای‬ ‫آن‬ ‫خاص‬ ‫های‬
‫دارد‬[8].
‫آخرین‬ ‫و‬ ‫معرفی‬ ‫احساسات‬ ‫تحلیل‬ ‫پرکاربرد‬ ‫حوزه‬ ‫چند‬ ‫ادامه‬ ‫در‬
.‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫تحقیقات‬
1
Aspects
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
3
3.1.‫الکترونیک‬ ‫تجارت‬ ‫و‬ ‫بازاریابی‬
‫بیش‬‫عقیده‬ ‫کاربرد‬ ‫ترین‬‫راه‬ ‫زیرا‬ ‫است‬ ‫تجارت‬ ‫و‬ ‫بازار‬ ‫حوزه‬ ‫در‬ ‫کاوی‬‫کارها‬
‫این‬ ‫در‬ ‫کاربردها‬ .‫شد‬ ‫خواهد‬ ‫فروش‬ ‫و‬ ‫سوددهی‬ ‫افزایش‬ ‫به‬ ‫منجر‬ ً‫ال‬‫معمو‬
‫حوزه‬:‫است‬ ‫بررسی‬ ‫قابل‬ ‫زیر‬ ‫دیدگاه‬ ‫سه‬ ‫از‬
‫مشتریان‬ ‫دیدگاه‬ ‫از‬،‫کاال‬ ‫مزایا‬ ‫و‬ ‫معایب‬ ،‫محصول‬ ‫کیفیت‬ ‫بررسی‬ :
... ‫و‬ ‫محصوالت‬ ‫مقایسه‬ ،‫دیگران‬ ‫تجربیات‬ ‫از‬ ‫استفاده‬
‫تولیدکنندگان‬ ‫دیدگاه‬ ‫از‬‫از‬ ‫خود‬ ‫محصول‬ ‫ضعف‬ ‫نقاط‬ ‫کشف‬ :
‫از‬ ‫بهتر‬ ‫درک‬ ،‫مشتریان‬ ‫انتظارات‬ ‫و‬ ‫نظرات‬ ‫نقطه‬ ،‫مشتریان‬ ‫دیدگاه‬
‫مشت‬ ‫نیاز‬‫شرکت‬ ‫سایر‬ ‫با‬ ‫رقابت‬ ‫و‬ ‫مقایسه‬ ،‫خود‬ ‫ریان‬‫در‬ ‫رقیب‬ ‫های‬
... ‫و‬ ‫بازار‬
‫فروشندگان‬ ‫دیدگاه‬ ‫از‬‫با‬ ‫مناسب‬ ‫تبلیغات‬ ،‫بازاریابی‬ :‫و‬ ‫عالیق‬
‫سال‬... ‫و‬ ‫خریداران‬ ‫به‬ ‫مناسب‬ ‫محصول‬ ‫پیشنهاد‬ ،‫مشتریان‬ ‫یق‬
‫مقاله‬ ‫در‬[1]‫جمع‬ ‫پس‬‫بازبینی‬ ‫و‬ ‫نظرات‬ ‫متن‬ ‫آوری‬‫کاربرن‬ ‫های‬2
‫از‬
‫انجمن‬‫شبکه‬ ،‫گفتگو‬ ‫های‬‫فروشگاه‬ ،‫اجتماعی‬ ‫های‬... ‫و‬ ‫اینترنتی‬ ‫آنالین‬ ‫های‬
‫تکنیک‬ ‫از‬ ‫استفاده‬ ‫با‬‫احساسات‬ ‫و‬ ‫عقاید‬ ‫تواستند‬ ‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫های‬
‫موبایل‬ ‫گوشی‬ ‫مانند‬ ‫مختلفی‬ ‫محصوالت‬ ‫مورد‬ ‫در‬ ‫را‬ ‫کاربران‬‫به‬‫و‬ ‫آورده‬ ‫دست‬
‫ویژگی‬ ‫مورد‬ ‫در‬ ‫جزئیات‬ ‫به‬‫دیده‬ ‫کاربران‬ ‫نقدهای‬ ‫که‬ ‫در‬ ‫آن‬ ‫مختلف‬ ‫های‬
‫بصری‬ ،‫شده‬‫سازی‬3
‫شکل‬ ‫در‬ ‫دهند‬ ‫انجام‬ ‫را‬9‫موبایل‬ ‫یک‬ ‫ویژگی‬ ‫از‬ ‫نمونه‬ ‫دو‬
‫آمده‬ ‫موردنظر‬ ‫محصول‬ ‫به‬ ‫نسبت‬ ‫کاربران‬ ‫احساسات‬ ‫کلی‬ ‫نتیجه‬ ‫همراه‬ ‫به‬
.‫است‬
‫شکل‬1-‫مورد‬ ‫در‬ ‫کاربران‬ ‫احساسات‬ ‫تحلیل‬ ‫نتایج‬‫موبایل‬ ‫گوشی‬ ‫یک‬
‫ویژگی‬ ‫تحلیل‬ ‫خالصه‬ ،‫کلی‬ ‫نتیجه‬ ‫یک‬ ‫تولید‬ ‫با‬ ‫نهایت‬ ‫در‬ ‫و‬‫مختلف‬ ‫های‬
‫می‬ ‫خالصه‬ ‫نتیجه‬ ‫یک‬ ‫در‬ ‫را‬.‫کند‬
‫در‬‫فارس‬ ‫زبان‬‫ی‬‫ن‬‫ی‬‫ز‬‫محمد‬‫ی‬‫همکاران‬ ‫و‬[90]‫راه‬‫کاری‬‫نقد‬ ‫درجهت‬ ‫را‬
‫ی‬‫ک‬‫احساس‬ ‫واژگان‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫کاال‬‫ی‬‫که‬‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫های‬‫تحل‬‫ی‬‫ل‬
‫ا‬ ‫در‬ ،‫نمودند‬ ‫ارائه‬ ‫است‬ ‫احساسات‬‫ی‬‫ن‬‫س‬‫ی‬‫ستم‬‫پ‬ ‫مرحله‬ ‫در‬ ‫ابتدا‬‫ی‬‫ش‬‫پردازش‬
‫داده‬‫جداساز‬ ‫با‬ ‫ها‬‫ی‬‫کل‬‫برچسب‬ ،‫جمالت‬ ‫و‬ ‫مات‬‫گذاری‬‫اجزا‬‫ی‬‫ر‬ ‫و‬ ‫سخن‬‫ی‬‫شه‬‫‏‬
2
User Review
3
visualization
‫ی‬‫اب‬‫ی‬‫موردن‬ ‫اطالعات‬ ،‫کلمات‬‫ی‬‫از‬‫م‬ ‫استخراج‬ ‫نقدها‬ ‫از‬‫ی‬‫شود‬‫با‬ ‫بعد‬ ‫مرحله‬ ‫در‬ .
‫و‬ ‫استخراج‬‫ی‬‫ژگ‬‫ی‬‫ها‬‫ی‬‫و‬ ‫از‬ ‫دسته‬ ‫آن‬ ،‫نقدها‬ ‫از‬ ‫کاال‬‫ی‬‫ژگ‬‫ی‬‫ها‬‫کاربران‬ ‫نظر‬ ‫از‬ ‫که‬
‫اهم‬‫ی‬‫ت‬‫ب‬‫ی‬‫ش‬‫تری‬‫م‬ ‫مشخص‬ ‫دارند‬‫ی‬‫شوند‬‫و‬ .‫ی‬‫ژگ‬‫ی‬‫های‬‫به‬‫دست‬‫آمده‬‫با‬‫دقت‬
‫باالیی‬‫مشا‬‫و‬ ‫با‬ ‫به‬‫ی‬‫ژگ‬‫ی‬‫های‬‫واقع‬‫ی‬‫طبقه‬ ‫و‬ ‫بوده‬ ‫کاال‬‫بن‬‫د‬‫ی‬‫احساس‬‫ی‬‫مجموعه‬
‫احساس‬ ‫بار‬ ‫براساس‬ ،‫داده‬‫ی‬‫م‬ ‫صورت‬ ‫متن‬ ‫در‬ ‫موجود‬ ‫واژگان‬‫ی‬‫پذی‬‫رد‬.
‫در‬‫عرصه‬‫ن‬ ‫بورس‬ ‫بازار‬ ‫و‬ ‫سهام‬‫ی‬‫ز‬‫عده‬‫ای‬‫تحل‬ ‫از‬‫ی‬‫ل‬‫گران‬‫سرما‬‫ی‬‫ه‬‫با‬
‫عق‬ ‫از‬ ‫استفاده‬‫ی‬‫ده‬‫کاوی‬‫به‬ ‫راجع‬ ‫کاربران‬‫ی‬‫ک‬‫ق‬ ،‫شرکت‬‫ی‬‫مت‬‫پ‬ ‫را‬ ‫آن‬ ‫سهام‬‫ی‬‫ش‬
‫بی‬‫ن‬‫ی‬‫م‬‫ی‬‫کنن‬‫د‬‫برا‬‫ی‬‫سا‬ ‫وب‬ ‫در‬ ‫مثال‬‫ی‬‫ت‬sentdex.com‫در‬ ‫کاربران‬ ‫نظرات‬
‫شبکه‬‫های‬‫اجتماع‬‫ی‬‫شرکت‬ ‫به‬ ‫راجع‬‫ها‬‫ی‬‫تجز‬ ‫بزرگ‬‫ی‬‫ه‬‫تحل‬ ‫و‬‫ی‬‫ل‬‫و‬ ‫شده‬
‫نما‬‫ی‬‫ش‬‫داده‬‫م‬‫ی‬‫تحل‬ ‫و‬ ‫شود‬‫ی‬‫ل‬‫گران‬‫ا‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫بازار‬‫ی‬‫ن‬‫پ‬ ‫اطالعات‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬
‫دق‬‫ی‬‫ق‬‫تری‬‫م‬ ‫را‬‫ی‬‫توانند‬.‫دهند‬ ‫انجام‬
3.2.‫جامعه‬ ‫و‬ ‫سیاست‬
‫شاخص‬‫تری‬‫ن‬‫تحل‬ ‫کاربرد‬‫ی‬‫ل‬‫اح‬‫س‬ ‫عرصه‬ ‫در‬ ‫ساسات‬‫ی‬‫است‬‫به‬ ‫مربوط‬
‫سال‬ ‫انتخابات‬2092‫آمر‬‫ی‬‫کا‬‫است‬‫انتخابات‬ ‫در‬ ‫البته‬ .2008‫تحق‬‫ی‬‫قات‬‫مشابه‬
‫پا‬ ‫سطح‬ ‫در‬‫یی‬‫ن‬‫تری‬‫ت‬ .‫بود‬ ‫شده‬ ‫انجام‬‫ی‬‫م‬‫تبل‬‫ی‬‫غات‬‫ی‬‫اطالعات‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫اوباما‬
‫شبکه‬‫های‬‫اجتماع‬‫ی‬،‫به‬‫خصوص‬‫تویی‬،‫تر‬‫رأ‬ ‫توانست‬‫ی‬‫ز‬ ‫افراد‬‫ی‬‫اد‬‫ی‬‫را‬‫ب‬‫ه‬‫دست‬
‫از‬ ‫استفاده‬ ‫با‬ ،‫آورد‬‫برچسب‬ ‫تعداد‬‫هایی‬‫ا‬ ‫هر‬ ‫در‬ ‫که‬‫ی‬‫الت‬‫حاو‬‫ی‬
#TeamObama tonight‫م‬ ‫توانستند‬ ‫بود‬‫ی‬‫زان‬‫محبوب‬‫ی‬‫ت‬‫و‬‫ی‬‫ق‬ ‫در‬ ‫را‬‫ی‬‫اس‬‫با‬
‫رق‬‫ی‬‫ب‬‫و‬‫ی‬‫آن‬ ،‫دهند‬ ‫نشان‬‫ها‬‫با‬‫استفاده‬‫از‬‫ای‬‫ن‬‫م‬ ‫اطالعات‬‫ی‬‫توانستند‬‫ا‬‫ی‬‫الت‬‫های‬
‫به‬ ‫هدف‬‫تبل‬ ‫منظور‬‫ی‬‫غات‬‫ب‬‫ی‬‫ش‬‫تر‬‫تع‬ ‫را‬‫یی‬‫ن‬‫هم‬ ‫و‬ ‫کرده‬‫چنی‬‫ن‬‫مت‬‫ن‬‫سخنران‬‫ی‬‫و‬‫ی‬
‫ا‬ ‫به‬ ‫توجه‬ ‫با‬ ‫را‬‫تنظ‬ ‫شهر‬ ‫آن‬ ‫قالب‬ ‫فکار‬‫ی‬‫م‬‫کنند‬‫شکل‬ ‫در‬ ،2‫بصری‬ ‫نمونه‬‫سازی‬
‫است‬ ‫شده‬ ‫داده‬ ‫نمایش‬ ‫تحلیل‬ ‫این‬ ‫از‬ ‫حاصل‬[99,92].
‫شکل‬2-‫م‬‫ی‬‫زان‬‫محبوب‬‫ی‬‫ت‬‫ا‬ ‫در‬ ‫اوباما‬‫ی‬‫الت‬‫ها‬‫ی‬‫استفاده‬ ‫با‬ ‫مختلف‬‫عقیده‬
‫در‬ ‫کاوی‬‫تو‬‫یی‬‫تر‬‫انتخابات‬ ‫از‬ ‫قبل‬
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
4
‫هندی‬ ‫پژوهشگران‬‫سال‬ ‫در‬2094‫حدود‬ ‫از‬ ‫استفاده‬ ‫با‬23‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫تو‬‫یی‬‫ت‬
‫از‬96‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫شبکه‬ ،‫کاربر‬‫ا‬‫ی‬‫حدود‬ ‫با‬40‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫م‬ ‫که‬ ‫ساختند‬ ‫لبه‬‫ی‬‫توانست‬
‫انتخابات‬ ‫هر‬ ‫برنده‬‫ی‬‫توج‬ ‫با‬ ‫را‬‫عقا‬ ‫به‬ ‫ه‬‫ی‬‫د‬‫نوشته‬‫های‬‫تو‬ ‫کاربران‬‫یی‬‫تر‬‫هند‬ ‫در‬
‫پ‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬‫و‬ ،‫کند‬‫ی‬‫ژگ‬‫ی‬‫اصل‬‫ی‬‫س‬‫ی‬‫ستم‬‫آن‬‫ها‬‫بالدرنگ‬‫بودن‬‫تحلی‬‫ل‬‫آن‬‫ه‬‫ا‬‫لذا‬ ،‫بود‬
‫م‬‫ی‬‫توانستند‬‫نت‬ ‫لحظه‬ ‫هر‬ ‫در‬‫ی‬‫جه‬‫به‬ ‫موجود‬ ‫اطالعات‬ ‫به‬ ‫را‬‫روزرسانی‬‫نما‬‫ی‬،‫ند‬‫در‬
‫نها‬‫ی‬‫ت‬‫پ‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬‫آن‬‫ها‬‫از‬‫دو‬‫ماه‬‫قبل‬‫از‬‫انتخابات‬‫دقی‬ً‫ا‬‫ق‬‫نت‬ ‫با‬ ‫برابر‬‫ی‬‫جه‬‫ب‬‫از‬ ‫عد‬
.‫بود‬ ‫انتخابات‬
‫اما‬‫تحل‬ ‫با‬ ‫توانستند‬ ‫محققان‬ ،‫جامعه‬ ‫بعد‬ ‫در‬‫ی‬‫ل‬‫کاربر‬ ‫توسط‬ ‫شده‬ ‫وارد‬ ‫متن‬
‫د‬ ‫و‬‫ی‬‫گر‬‫شخص‬ ‫صفحه‬ ‫اطالعات‬‫ی‬‫و‬‫ی‬‫اجتماع‬ ‫شبکه‬ ‫در‬‫ی‬‫ف‬‫ی‬‫س‬،‫بوک‬‫م‬‫ی‬‫زان‬
‫رضا‬‫ی‬‫ت‬‫و‬‫ی‬‫زندگ‬ ‫از‬‫ی‬‫م‬ ‫مجموع‬ ‫در‬ ‫و‬‫ی‬‫زان‬‫رضا‬‫ی‬‫ت‬‫ی‬‫ک‬‫تحل‬ ‫را‬ ‫جامعه‬‫ی‬‫ل‬‫کنند‬
[93].
4.‫عقیده‬ ‫مراحل‬‫کاوی‬
‫شکل‬ ‫در‬3‫مراحل‬‫قطبیت‬ ‫تعیین‬4
‫توسط‬ ‫شده‬ ‫وارد‬ ‫متن‬‫کاربر‬‫داده‬ ‫نشان‬
‫ا‬ .‫است‬ ‫شده‬‫ی‬‫ن‬‫کل‬ ‫اصول‬ ‫مراحل‬‫ی‬‫اجرا‬‫ی‬‫ی‬‫ک‬‫س‬‫ی‬‫ستم‬‫تحل‬‫ی‬‫ل‬‫گر‬‫یک‬ ‫قطبیت‬
‫متن‬‫تشر‬ ‫با‬ ‫ادامه‬ ‫در‬ .‫است‬‫ی‬‫ح‬‫روش‬ ،‫گام‬ ‫هر‬ ‫عمکلرد‬‫های‬‫اجرا‬ ‫مختلف‬‫ی‬‫آن‬
‫بررس‬ ‫مورد‬‫ی‬.‫گرفت‬ ‫خواهد‬ ‫قرار‬
‫شکل‬3–‫مراحل‬‫تحلی‬‫ل‬‫احس‬‫اجتماع‬ ‫شبکه‬ ‫در‬ ‫کاربر‬ ‫اسات‬‫ی‬
4.1.‫پیش‬‫داده‬ ‫پردازش‬‫ها‬
‫ا‬ ‫در‬‫ی‬‫ن‬‫آماده‬ ‫مرحله‬ ‫دو‬ ‫در‬ ‫موردنظر‬ ‫متن‬ ،‫کاربرد‬ ‫برحسب‬ ‫گام‬‫سازی‬‫م‬‫ی‬
،‫گردد‬‫نگارش‬ ‫عالئم‬ ‫و‬ ‫لغات‬ ‫براساس‬ ‫جمله‬ ‫ابتدا‬‫ی‬‫منقطع‬‫تقسی‬ ‫کننده‬‫م‬‫م‬‫ی‬‫شود‬
‫برچسب‬ ‫سپس‬ ‫و‬‫گذاری‬‫دستور‬ ‫مشخصه‬‫ی‬‫م‬ ‫انجام‬ ‫کلمات‬‫ی‬.‫گردد‬
4
Polarity
ً‫ال‬‫معمو‬‫اول‬‫ی‬‫ن‬‫ب‬ ‫جمله‬ ‫شکست‬‫نگارش‬ ‫خاص‬ ‫عالئم‬ ‫راساس‬‫ی‬‫مانند‬
».«(،«;»،«،»،»!«،«‫؟‬»،)»:«‫پذ‬ ‫صورت‬‫ی‬‫رفته‬‫تشک‬ ‫کلمات‬ ‫به‬ ‫جمله‬ ‫سپس‬ ‫و‬‫ی‬‫ل‬‫‏‬
‫دهنده‬‫تقس‬‫ی‬‫م‬‫م‬‫ی‬‫‏‬‫گردد‬.
‫اما‬‫برچسب‬ ‫در‬‫‏‬‫گذاری‬‫برچسب‬ ‫انتساب‬ ‫عمل‬‫‏‬‫های‬‫واژگان‬‫ی‬‫و‬ ‫کلمات‬ ‫به‬
‫نشانه‬‫‏‬‫های‬‫تشک‬‫ی‬‫ل‬‫م‬ ‫صورت‬ ‫متن‬‫ی‬‫‏‬‫پذی‬‫رد‬‫ا‬ ‫واقع‬ ‫در‬‫ی‬‫ن‬‫برچسب‬‫‏‬‫ها‬‫نقش‬
‫کلمات‬‫در‬‫جمله‬‫را‬‫مشخص‬‫م‬‫ی‬‫‏‬‫سازند‬‫کل‬ ‫حالت‬ ‫در‬ .‫ی‬‫روش‬‫‏‬‫های‬
‫برچسب‬‫‏‬‫گذاری‬‫تقس‬ ‫دسته‬ ‫دو‬ ‫به‬ ‫کلمات‬‫ی‬‫م‬‫م‬‫ی‬‫مجموعه‬ ‫اول‬ ‫دسته‬ .‫گردد‬
‫روش‬‫‏‬‫های‬‫آمار‬‫ی‬‫ق‬ ‫دوم‬ ‫دسته‬ ‫و‬‫اعده‬‫روش‬ ‫در‬ .‫هستند‬ ‫محور‬‫‏‬‫های‬‫آمار‬‫ی‬‫ی‬‫ک‬
‫احتمال‬ ‫مجموعه‬‫ی‬‫برچسب‬ ‫از‬‫‏‬‫ها‬‫برای‬‫ی‬‫ک‬‫م‬ ‫انتخاب‬ ‫کلمه‬‫ی‬‫براساس‬ ‫و‬ ‫گردد‬
‫برچسب‬‫ها‬‫ی‬‫ضر‬ ‫مجاور‬‫ی‬‫ب‬‫صح‬ ‫احتمال‬‫ی‬‫ح‬‫ه‬ ‫بودن‬‫محاسبه‬ ‫برچسب‬ ‫ر‬
‫م‬‫ی‬.‫گردد‬
ً‫ال‬‫معمو‬‫روش‬ ‫در‬‫‏‬‫های‬‫غ‬‫ی‬‫رآمار‬‫ی‬‫قوان‬ ‫از‬ ‫استفاده‬ ‫با‬ ،‫محور‬ ‫قاعده‬‫ی‬‫ن‬‫رفع‬ ‫به‬
‫برچسب‬ ‫در‬ ‫ابهامات‬‫‏‬‫گذاری‬‫‏‬‫ها‬‫م‬ ‫پرداخته‬‫ی‬‫‏‬،‫شود‬‫ا‬ ‫مجموعه‬‫ی‬‫ن‬‫قوان‬‫ی‬‫ن‬‫ی‬‫ا‬‫به‬
‫شده‬ ‫داده‬ ‫مدل‬ ‫به‬ ‫آموزش‬ ‫صورت‬‫‏‬‫اند‬‫ی‬‫ا‬‫به‬‫‏‬‫صورت‬‫دستی‬‫مع‬‫ی‬‫ن‬‫گرد‬‫ی‬‫ده‬.‫است‬
‫س‬‫ی‬‫ستم‬‫‏‬‫های‬‫مخف‬ ‫مدل‬ ،‫محور‬ ‫حافظه‬‫ی‬‫مار‬‫تخم‬ ‫روش‬ ‫و‬ ‫کوف‬‫ی‬‫ن‬‫احتمال‬
‫ب‬‫ی‬‫ش‬‫ی‬‫نه‬‫نمونه‬‫‏‬‫هایی‬‫روش‬ ‫از‬‫‏‬‫های‬‫برچسب‬‫‏‬‫گذاری‬‫برا‬ .‫هستند‬‫ی‬[ ‫در‬ ‫مثال‬94]
‫برچسب‬‫‏‬‫زنی‬‫فارس‬ ‫کلمات‬‫ی‬‫مخف‬ ‫مدل‬ ‫از‬ ‫استفاده‬ ‫با‬‫ی‬‫معرف‬ ‫مارکوف‬‫ی‬
‫شده‬.‫است‬
‫مقاله‬ ‫در‬[94]‫پیش‬‫از‬ ‫استفاده‬ ‫با‬ ‫توییتر‬ ‫متنی‬ ‫اطالعات‬ ‫پردازش‬‫چارچوب‬
‫هدوپ‬0
‫کاهش‬ ‫نگاشت‬ ‫و‬6
.‫است‬ ‫پذیرفته‬ ‫صورت‬
4.2.‫ویژگی‬ ‫انتخاب‬
‫نظرات‬‫ی‬‫در‬ ‫کاربران‬ ‫که‬‫ی‬‫ک‬‫اجتماع‬ ‫شبکه‬‫ی‬‫و‬‫ی‬‫ا‬‫در‬‫ی‬‫ک‬‫ا‬ ‫فروشگاه‬‫ی‬‫نترنت‬‫ی‬
‫به‬ ‫راجع‬‫ی‬‫ک‬‫م‬ ‫محصول‬‫ی‬‫‏‬‫دهند‬‫منف‬ ،‫مثبت‬ ‫است‬ ‫ممکن‬‫ی‬‫و‬‫ی‬‫ا‬‫خنث‬‫ی‬.‫باشد‬
‫ا‬‫ی‬‫ن‬‫قطب‬‫ی‬‫ت‬‫به‬‫ی‬‫ک‬‫و‬‫ی‬‫ژگ‬‫ی‬‫ی‬‫ا‬‫ج‬‫از‬ ‫نبه‬‫ی‬‫ک‬‫محصول‬‫ی‬‫ا‬‫نسبت‬ ‫موضوع‬
‫م‬ ‫داده‬‫ی‬‫‏‬‫شود‬‫برا‬ .‫ی‬‫کاربر‬ ‫مثال‬‫ی‬‫اجتماع‬ ‫شبکه‬ ‫در‬‫ی‬‫م‬‫ی‬‫‏‬‫نوی‬‫سد‬"!‫دوستان‬
‫گوش‬ ‫امروز‬‫ی‬‫موبا‬‫ی‬‫ل‬‫جد‬‫ی‬‫د‬‫خر‬‫ی‬‫دم‬‫ک‬‫ی‬‫ف‬‫ی‬‫ت‬‫نما‬ ‫صفحه‬‫ی‬‫ش‬‫فوق‬‫‏‬‫العاده‬‫‏‬‫ای‬‫دارد‬
‫آنتن‬ ‫اما‬‫‏‬‫دهی‬‫ن‬ ‫جالب‬ ‫آن‬‫ی‬‫ست‬."‫ا‬ ‫در‬‫ی‬‫ن‬‫بحث‬ ‫موضوع‬ ‫مثال‬"‫موبا‬‫ی‬‫ل‬"‫و‬ ‫است‬
‫و‬‫ی‬‫ژگ‬‫ی‬‫ی‬‫ا‬‫جنبه‬‫‏‬‫های‬‫ا‬‫ی‬‫ن‬‫موضوع‬"‫صف‬‫نما‬ ‫حه‬‫ی‬‫ش‬"‫و‬"‫آنتن‬‫‏‬‫دهی‬".‫است‬
‫تکنیک‬ ‫از‬ ‫یکی‬‫روش‬ ،‫متن‬ ‫در‬ ‫ویژگی‬ ‫کشف‬ ‫در‬ ‫پرکاربرد‬ ‫های‬‫اطالعات‬
‫متقابل‬7
‫است‬‫روش‬ ‫از‬ ‫یکی‬ ‫که‬‫های‬‫در‬ ‫ویژگی‬ ‫کردن‬ ‫پیدا‬ ‫آماری‬‫جمله‬ ‫یا‬ ‫سند‬
5
Hadoop
6
Map-Reduce
7
Mutual Information
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
0
‫کلمه‬ ‫هر‬ ‫برای‬ ،‫است‬x‫سند‬ ‫هر‬ ‫در‬y‫بیش‬ ‫و‬ ‫شده‬ ‫محاسبه‬ ‫مقدار‬‫یا‬ ‫ترین‬
‫اطالعات‬ ‫عنوان‬ ‫به‬ ،‫مقادیر‬ ‫آن‬ ‫میانگین‬‫باالترین‬ ‫و‬ ‫شده‬ ‫منظور‬ ‫کلمه‬ ‫آن‬ ‫مقابل‬
‫آن‬‫می‬ ‫انتخاب‬ ‫ویژگی‬ ‫عنوان‬ ‫به‬ ‫ها‬‫چنان‬ ‫گردد‬‫چه‬x‫و‬y،‫باشند‬ ‫مستقل‬ ‫هم‬ ‫از‬
‫ضابطه‬ ‫مقدار‬(9)‫می‬ ‫صفر‬ ‫را‬‫کند‬.
‫روش‬ ‫البته‬‫دیگری‬ ‫زیاد‬ ‫های‬‫همانند‬ ‫متعدد‬ ‫مقاالت‬ ‫در‬‫نما‬‫ی‬‫ه‬‫ساز‬‫ی‬‫معنا‬‫یی‬
‫پنهان‬
8
[90]‫مارکوف‬ ‫مخفی‬ ‫مدل‬ ،[96]،‫تخص‬‫ی‬‫ص‬‫د‬‫ی‬‫ر‬‫ی‬‫کله‬‫پنهان‬
9
[97]،
‫بیش‬‫آنتروپی‬ ‫ترین‬... ‫و‬.‫است‬ ‫شده‬ ‫معرفی‬
4.3.‫طبقه‬‫بندی‬‫کننده‬10
‫اصل‬ ‫پردازش‬‫ی‬‫تع‬ ‫جهت‬‫یی‬‫ن‬‫قطب‬‫ی‬‫ت‬‫ی‬‫ک‬‫جمله‬‫ی‬‫ا‬‫ی‬‫ک‬‫ا‬ ‫در‬ ‫سند‬‫ی‬‫ن‬‫مرحله‬
‫م‬ ‫صورت‬‫ی‬‫پذی‬،‫رد‬‫اصل‬ ‫هدف‬‫ی‬‫ا‬‫ی‬‫ن‬‫طبقه‬ ‫بخش‬‫بند‬‫ی‬‫ی‬‫ک‬‫جمله‬‫ی‬‫ا‬‫ی‬‫ک‬‫سند‬
‫بر‬‫قطب‬ ‫اساس‬‫ی‬‫ت‬‫حل‬ ‫راه‬ .‫است‬ ‫آن‬‫کل‬ ‫دسته‬ ‫دو‬ ‫به‬ ‫ها‬‫ی‬‫مبتن‬‫ی‬‫بر‬‫ی‬‫ادگ‬‫ی‬‫ر‬‫ی‬
‫ماش‬‫ی‬‫ن‬‫واژه‬ ‫و‬‫نامه‬‫تقسی‬‫م‬‫م‬‫ی‬‫شود‬‫دق‬ ‫ابزارها‬ .‫ی‬ً‫ا‬‫ق‬‫عمل‬ ‫همان‬‫ی‬‫م‬ ‫انجام‬ ‫را‬‫ی‬‫دهند‬
‫طبقه‬ ‫که‬‫بند‬‫ی‬‫کننده‬‫ها‬‫کاربردها‬ ‫در‬‫ی‬‫سنت‬‫ی‬‫متن‬‫کاوی‬‫آن‬ ‫در‬ ،‫دارند‬‫جا‬‫ی‬‫ک‬
‫طبقه‬ ‫از‬ ‫پس‬ ‫سند‬‫ب‬‫ندی‬‫م‬‫ی‬‫توانست‬‫دسته‬ ‫به‬‫های‬‫س‬ ‫همانند‬ ‫مختلف‬‫ی‬‫اس‬‫ی‬،
‫ورزشی‬،‫علم‬‫ی‬‫طبقه‬ ‫در‬ ‫اما‬ ‫گردد‬ ‫اضافه‬ ... ‫و‬‫بند‬‫ی‬‫کننده‬‫عقاید‬‫ا‬ ً‫ال‬‫معمو‬‫ی‬‫ن‬
‫دسته‬‫ها‬‫به‬‫سه‬‫گروه‬،‫مثبت‬‫منفی‬‫خنث‬ ‫و‬‫ی‬‫تبد‬‫ی‬‫ل‬‫م‬‫ی‬.‫گردد‬
‫در‬‫طبقه‬‫‏‬‫بندی‬‫مبتن‬‫ی‬‫پ‬ ‫از‬ ‫که‬ ‫واژگان‬ ‫بر‬‫ی‬‫کره‬‫‏‬‫های‬99
‫و‬ ‫مختلف‬‫ی‬‫ا‬‫واژه‬‫نامه‬92
‫م‬ ‫استفاده‬ ‫خاص‬‫ی‬‫‏‬‫شود‬،‫کل‬ ‫روال‬‫ی‬‫ا‬ ‫به‬‫ی‬‫ن‬‫برا‬ ‫که‬ ‫است‬ ‫شکل‬‫ی‬‫در‬ ‫کلمه‬ ‫هر‬
‫ی‬‫ک‬‫اسام‬ ‫مانند‬ ‫جمله‬‫ی‬،‫افعال‬،‫صفات‬‫و‬‫قی‬‫ود‬‫واژگان‬ ‫شبکه‬ ‫در‬ ،‫موجود‬
‫احساس‬‫ی‬‫م‬ ‫صورت‬ ‫جستجو‬‫ی‬‫گ‬‫ی‬‫رد‬‫صورت‬ ‫در‬ ‫و‬‫ی‬‫موجود‬ ‫شبکه‬ ‫در‬ ‫واژه‬ ‫آن‬ ‫که‬
،‫باشد‬‫احساس‬ ‫برچسب‬‫ی‬‫م‬ ‫استخراج‬ ‫آن‬‫ی‬‫‏‬،‫شود‬‫قطب‬ ‫با‬ ‫متناسب‬ ‫واژه‬ ‫هر‬‫ی‬‫ت‬‫ی‬‫که‬
‫شبکه‬ ‫از‬‫وزن‬ ،‫شده‬ ‫استخراج‬ ‫واژگان‬‫ی‬‫م‬‫ی‬‫گ‬‫ی‬،‫رد‬‫برا‬‫ی‬‫جمله‬ ‫هر‬‫‏‬‫ای‬‫در‬ ‫کاربر‬ ‫که‬
‫اجتماع‬ ‫شبکه‬‫ی‬‫م‬‫ی‬‫نو‬‫ی‬‫سد‬‫وزن‬ ‫مجموع‬‫‏‬‫ها‬‫با‬‫توجه‬‫به‬‫قطبی‬‫ت‬‫محاسبه‬ ‫آن‬
‫م‬‫ی‬‫‏‬،‫گردد‬‫عدد‬ ‫اگر‬‫ی‬‫بزرگ‬‫‏‬‫تر‬‫از‬‫صفر‬‫باشد‬‫آن‬‫جمله‬‫قطبی‬‫ت‬‫م‬ ‫مثبت‬‫ی‬‫‏‬‫گی‬‫رد‬‫و‬
‫در‬‫غ‬‫ی‬‫ر‬‫ا‬‫ی‬‫ن‬‫‏‬‫صورت‬‫منف‬ ‫جمله‬‫ی‬‫م‬ ‫گرفته‬ ‫نظر‬ ‫در‬‫ی‬‫‏‬‫شود‬.
‫وجود‬‫ی‬‫ک‬‫واژه‬‫‏‬‫نام‬‫ه‬‫در‬‫ی‬‫ک‬‫س‬‫ی‬‫ستم‬‫تحل‬‫ی‬‫ل‬‫ضرور‬ ‫احساسات‬‫ی‬‫اما‬ ‫است‬
‫کاف‬‫ی‬‫ن‬‫ی‬‫ست‬‫م‬ ً‫ا‬‫حتم‬ ‫و‬‫ی‬‫‏‬‫بای‬‫ست‬‫د‬ ‫کنار‬ ‫در‬‫ی‬‫گر‬‫روش‬‫‏‬‫های‬‫تکم‬‫ی‬‫ل‬‫به‬ ‫کننده‬‫کار‬
8
Latent Semantic Indexing (LSI)
9
Latent Dirichlet Allocation (LDA)
10
Classifier
11
Corpus
12
Dictionary
.‫شوند‬ ‫برده‬‫در‬‫شکل‬3‫روش‬ ‫انواع‬ ‫شده‬ ‫تالش‬‫‏‬‫های‬‫را‬‫ی‬‫ج‬‫ی‬‫طبقه‬ ‫در‬ ‫که‬‫بند‬‫ی‬
‫عق‬‫ی‬‫ده‬‫نما‬ ‫دارد‬ ‫کاربرد‬ ‫متن‬ ‫در‬‫ی‬‫ش‬[ ‫شود‬ ‫داده‬91.]
‫شکل‬4-‫روش‬ ‫انواع‬‫ها‬‫ی‬‫طبقه‬‫بند‬‫ی‬
‫ب‬‫یش‬‫تکنیک‬ ‫تر‬‫شکل‬ ‫های‬4‫پیاده‬ ‫توانایی‬‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫سازی‬
‫کالن‬‫داده‬93
‫مقیاس‬ ‫ابزارها‬ ‫این‬ ‫از‬ ‫استفاده‬ ‫دارند‬ ‫را‬‫پردازش‬ ‫سرعت‬ ‫و‬ ‫پذیری‬
‫داده‬ ‫حجم‬ ‫در‬‫چشم‬ ‫شکل‬ ‫به‬ ‫را‬ ‫باال‬ ‫های‬‫می‬ ‫افزایش‬ ‫گیری‬.‫دهد‬
‫در‬[98]‫فایل‬ ‫سیستم‬ ‫و‬ ‫هدوپ‬ ‫از‬ ‫استفاده‬ ‫با‬HDFS
94
‫تکنیک‬ ،Naïve
Bayes‫ع‬ ‫به‬‫طبقه‬ ‫نوان‬‫بندی‬‫سینما‬ ‫و‬ ‫فیلم‬ ‫مورد‬ ‫در‬ ‫کاربران‬ ‫نظرات‬ ‫کننده‬‫وب‬
‫پیاده‬ ،‫آمازون‬ ‫سایت‬‫کتابخانه‬ ‫از‬ ‫استفاده‬ ‫بدون‬ ‫نویسندگان‬ .‫است‬ ‫شده‬ ‫سازی‬-
‫پیش‬ ‫های‬‫(همانند‬ ‫هدوپ‬ ‫فرض‬Mahout‫ماژول‬ ،)‫را‬ ‫خود‬ ‫نیاز‬ ‫مورد‬ ‫های‬
.‫نمودند‬ ‫طراحی‬
‫مقیاس‬ ‫داد‬ ‫نشان‬ ‫نتایج‬‫طبقه‬ ‫پذیری‬‫بندی‬‫کننده‬NB‫بدون‬ ‫حتی‬‫داده‬ ‫پایگاه‬
‫به‬‫می‬ ‫پیدا‬ ‫افزایش‬ ‫راحتی‬.‫کند‬
‫دق‬‫حدود‬ ‫بررسی‬ ‫مورد‬ ‫حاالت‬ ‫تمامی‬ ‫در‬ ‫متوسط‬ ‫ت‬82‫اما‬ ‫بوده‬ ‫درصد‬
‫هدوپ‬ ‫چارچوب‬ ‫از‬ ‫که‬ ‫مقاالتی‬ ‫دیگر‬ ‫همانند‬‫نموده‬ ‫استفاده‬‫صورت‬ ‫در‬ ،‫اند‬
‫پیدا‬ ‫افزایش‬ ‫زیادی‬ ‫مقدار‬ ‫تا‬ ‫پردازش‬ ‫سرعت‬ ،‫ورودی‬ ‫اطالعات‬ ‫حجم‬ ‫افزایش‬
.‫کند‬ ‫می‬
‫جدول‬ ‫در‬9‫ز‬ ‫مرتبه‬‫هر‬ ‫به‬ ‫نسبت‬ ‫پردازش‬ ‫مانی‬90‫بازبینی‬ ‫متن‬ ‫هزار‬
‫که‬ ‫حالت‬ ‫اولین‬ ‫در‬ .‫است‬ ‫شده‬ ‫داده‬ ‫نمایش‬ ‫کاربران‬2‫قرار‬ ‫آن‬ ‫در‬ ‫بازبینی‬ ‫هزار‬
‫داده‬ ‫مقدار‬ ‫زیرا‬ ‫ندارد‬ ‫مناسبی‬ ‫زمانی‬ ‫مرتبه‬ ‫سازی‬ ‫موازی‬ ‫است‬ ‫مشخص‬ ،‫دارد‬
‫بالک‬ ‫هر‬ ‫حجم‬ ‫از‬ ‫ورودی‬HDFS‫کم‬‫به‬ ‫نزدیک‬ ‫و‬ ‫حجم‬ ‫افزایش‬ ‫با‬ ‫است‬ ‫تر‬
‫بهینه‬ ‫مقدار‬HDFS‫چشم‬ ‫بهبود‬ ‫زمانی‬ ‫مرتبه‬‫می‬ ‫پیدا‬ ‫گیری‬‫کند‬.
13
Big data
14
Hadoop Distributed File System
(9)
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
6
‫جدول‬9–‫هر‬ )‫(ثانیه‬ ‫پردازش‬ ‫زمان‬9000‫کاربران‬ ‫بازبینی‬ ‫متن‬
‫ورودی‬ ‫متن‬ ‫تعداد‬ ‫حجم‬
)‫(هزار‬
220200400600800
/ ‫ثانیه‬10‫متن‬ ‫هزار‬9/40090/4807/624/447/399/3
‫ورودی‬ ‫متن‬ ‫تعداد‬ ‫حجم‬
)‫(هزار‬
900092009400960098002000
/ ‫ثانیه‬10‫متن‬ ‫هزار‬88/277/247/24/237/233/2
5.‫عقیده‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫کاربرد‬‫کاوی‬
‫عظیم‬ ‫حجم‬ ‫پردازش‬ ‫توانایی‬ ‫و‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫شدن‬ ‫گسترده‬ ‫از‬ ‫بعد‬
‫اطالعات‬‫سازمان‬ ‫دیگر‬‫ها‬‫مجبور‬‫ن‬‫از‬ ‫بودند‬‫ی‬‫ک‬‫را‬ ‫َر‬‫ب‬‫ا‬‫ی‬‫انه‬‫و‬‫ی‬‫ا‬‫داده‬ ‫انباره‬‫ا‬‫ی‬
‫کند‬ ‫استفاده‬‫واقع‬ ‫در‬‫پا‬ ‫ضعف‬‫ی‬‫گاه‬‫داده‬‫ها‬‫ی‬‫رابطه‬‫ا‬‫ی‬‫نگه‬ ‫در‬‫دار‬‫ی‬‫تجز‬ ‫و‬‫ی‬‫ه‬‫و‬
‫تحل‬‫ی‬‫ل‬‫حجم‬‫عظ‬‫ی‬‫م‬‫ی‬‫داده‬ ‫از‬‫ها‬‫ی‬‫ن‬‫ی‬‫مه‬‫ساختار‬‫ی‬‫نما‬ ‫ساختار‬ ‫بدون‬ ‫و‬‫ی‬‫ان‬‫گشت‬
‫کردن‬ ‫مطرح‬ ‫با‬ ‫دانشمندان‬ ‫و‬‫مفهوم‬‫جد‬‫ی‬‫د‬‫ی‬‫نام‬ ‫به‬NoSQL
90
‫به‬ ‫اقدام‬
‫جد‬ ‫نسل‬ ‫ساخت‬‫ی‬‫د‬‫ی‬‫پا‬ ‫از‬‫ی‬‫گاه‬‫ها‬‫ی‬‫داده‬‫ا‬‫ی‬‫م‬ ‫که‬‫ی‬‫تواند‬‫عظ‬ ‫حجم‬‫ی‬‫م‬‫ی‬‫از‬
‫را‬ ‫اطالعات‬‫زیر‬ ‫یک‬ ‫در‬‫سا‬‫ابری‬ ‫خت‬‫نگ‬‫هد‬‫ار‬‫ی‬‫نمودند‬ ،‫کند‬ ‫پردازش‬ ‫و‬[91].
‫بیش‬‫الگوریتم‬ ‫تر‬‫طبقه‬ ‫های‬‫می‬ ‫بندی‬‫با‬ ‫و‬ ‫موازی‬ ‫شکل‬ ‫به‬ ‫تواند‬‫از‬ ‫استفاده‬
‫پیاده‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫شود‬ ‫سازی‬[98,20].
‫کال‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫مزایای‬ ‫از‬ ‫مورد‬ ‫چند‬ ‫به‬ ‫فقط‬ ‫ادامه‬ ‫در‬‫در‬ ‫داده‬ ‫ن‬
‫عقیده‬.‫شد‬ ‫خواهد‬ ‫اشاره‬ ‫کاوی‬
‫پ‬ ‫مراحل‬ ‫از‬ ‫یک‬ ‫هر‬‫ها‬ ‫داده‬ ‫پردازش‬ ‫و‬ ‫پردازش‬ ‫یش‬‫به‬ ‫تواند‬ ‫می‬
‫مرتبط‬ ‫ابزارهای‬ ‫روی‬ ‫بر‬ ‫موازی‬ ‫شکل‬‫از‬ ‫استفاده‬ ‫همانند‬‫چارچوب‬
‫نگاشت‬–‫شود‬ ‫سازی‬ ‫پیاده‬ ‫کاهش‬‫مثال‬ ‫برای‬ ،‫در‬[94]‫از‬ ‫استفاده‬ ‫با‬
‫داده‬ ‫در‬ ،‫نمودند‬ ‫ثابت‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫سرعت‬ ‫حجیم‬ ‫های‬
‫در‬ ‫دستورات‬ ‫اجرای‬‫هدوپ‬‫از‬ ‫بیشتر‬‫مدل‬ ‫دیگر‬‫مرسوم‬ ‫های‬‫است‬
‫شکل‬ ‫(در‬0).
‫شکل‬5-‫دوحالت‬ ‫در‬ ‫کلمه‬ ‫شمارش‬ ‫زمان‬ ‫میزان‬‫بررسی‬ ‫مورد‬
15
Not Only SQL
‫پیاده‬ ‫قصد‬ ‫شرکت‬ ‫یک‬ ‫اگر‬‫عقیده‬ ‫سیستم‬ ‫یک‬ ‫اجرایی‬ ‫و‬ ‫سازی‬‫کاوی‬
‫داشته‬‫از‬ ‫استفاده‬ ‫با‬ ‫اما‬ ‫کند‬ ‫صرف‬ ‫باید‬ ‫را‬ ‫زیادی‬ ‫هزینه‬ ‫باشد‬
‫می‬ ‫ابر‬ ‫بستر‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫هز‬ ‫تواند‬‫حد‬ ‫تا‬ ‫را‬ ‫خود‬ ‫ینه‬
‫شرکت‬ ‫از‬ ‫بسیاری‬ ،‫دهد‬ ‫کاهش‬ ‫زیادی‬‫خدمات‬ ‫این‬ ‫دارند‬ ‫وجود‬ ‫ها‬
‫نرم‬ ‫درقالب‬ ‫را‬‫اف‬‫سرویس‬ ‫عنوان‬ ‫به‬ ‫زار‬96
‫می‬ ‫ارایه‬.‫دهند‬
‫داده‬ ‫از‬ ‫حجمی‬ ‫هر‬ ‫اندازه‬ ‫به‬ ‫پذیری‬ ‫مقیاس‬
‫داده‬ ‫پردازش‬ ‫توانایی‬‫ه‬‫لحظه‬ ‫خروجی‬ ‫ایجاد‬ ‫و‬ ‫بالدرنگ‬ ‫صورت‬ ‫به‬ ‫ا‬
ً‫ا‬‫خصوص‬ ‫توانایی‬ ‫این‬ ، ‫ای‬‫زمان‬ ‫یک‬ ‫به‬ ‫وابسته‬ ‫که‬ ‫کاربردهایی‬ ‫در‬
‫است‬ ‫کاربردی‬ ‫بسیار‬ ،‫نتیجه‬ ‫یک‬ ‫بینی‬ ‫پیش‬ ‫مانند‬ ‫است‬ ‫خاص‬[29].
6.‫نتیجه‬‫آینده‬ ‫کارهای‬ ‫و‬ ‫گیری‬
‫ا‬ ‫در‬‫ی‬‫ن‬‫آخر‬ ‫مقاله‬‫ی‬‫ن‬‫و‬ ‫دستاوردها‬‫پژوهش‬‫ها‬‫در‬‫حوزه‬‫تحلی‬‫ل‬‫احساسات‬
‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫با‬‫توجه‬ ‫با‬ ‫و‬ ‫گرفت‬ ‫قرار‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫مورد‬
‫ابزارها‬ ‫این‬ ‫از‬ ‫استفاده‬ ،‫شد‬ ‫مشخص‬ ‫بررسی‬ ‫مورد‬ ‫مقاالت‬ ‫از‬ ‫حاصله‬ ‫نتایج‬ ‫به‬
‫داده‬ ‫حجم‬ ‫که‬ ‫است‬ ‫کاربردی‬ ‫و‬ ‫بهینه‬ ً‫ال‬‫کام‬ ‫صورتی‬ ‫در‬‫و‬ ‫باشد‬ ‫زیاد‬ ‫بسیار‬ ‫ها‬
‫ابزارها‬ ‫دیگر‬ ‫به‬ ‫نسبت‬ ‫نتایج‬ ‫کم‬ ‫داده‬ ‫حجم‬ ‫با‬ ‫محاسبات‬ ‫انجام‬ ‫حالت‬ ‫این‬ ‫در‬
‫ضعیف‬‫است‬ ‫تر‬.
‫به‬‫زمینه‬ ‫عنوان‬‫بیش‬ ‫پژوهش‬ ‫جای‬ ‫زیر‬ ‫عناوین‬ ‫مناسب‬ ‫تحقیقاتی‬ ‫های‬‫تری‬
.‫داشت‬ ‫خواهد‬ ‫حوزه‬ ‫این‬ ‫در‬ ‫فعاالن‬ ‫توسط‬ ‫آینده‬ ‫در‬
‫کاربرد‬ ‫و‬ ‫گسترش‬ ‫با‬‫ی‬‫‏‬‫تر‬‫ابزارها‬ ‫شدن‬‫ی‬‫مد‬‫ی‬‫ر‬‫ی‬‫ت‬‫کالن‬‫داده‬‫دن‬ ‫در‬‫ی‬،‫ا‬
‫م‬‫ی‬‫‏‬‫توان‬‫بس‬‫ی‬‫ار‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫تشخ‬‫ی‬‫ص‬‫احساسات‬‫عقاید‬ ‫و‬‫زبان‬ ‫در‬
‫فارس‬‫ی‬‫را‬‫از‬ ‫استفاده‬ ‫با‬‫ابزار‬‫ها‬‫ی‬‫مانند‬ ‫آن‬ ‫خاص‬‫هدوپ‬ ‫چارچوب‬
‫پیاده‬‫سازی‬.‫نمود‬
‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫آمار‬‫ی‬‫برا‬‫ی‬‫مدل‬‫‏‬‫سازی‬‫مدل‬ ‫از‬ ‫استفاده‬ ‫کلمات‬
n-gram‫م‬ .‫است‬‫ی‬‫‏‬‫توان‬‫برا‬‫ی‬‫مق‬ ‫بردن‬ ‫باال‬‫ی‬‫اس‬‫‏‬‫پذی‬‫ر‬‫ی‬‫اجرا‬ ‫و‬‫ی‬
‫مواز‬‫ی‬،‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫آن‬‫نگاشت‬ ‫چارچوب‬ ‫در‬ ‫را‬-‫کاهش‬
‫پ‬‫ی‬‫اده‬‫‏‬‫سازی‬‫نمود‬[22].
‫م‬‫ی‬‫‏‬‫توان‬‫تحق‬ ‫با‬‫ی‬‫ق‬‫رو‬ ‫بر‬‫ی‬‫داده‬ ‫ساختار‬‫‏‬‫های‬‫مبتن‬‫ی‬‫واژه‬ ‫بر‬‫‏‬،‫نامه‬‫زمان‬
‫جستجو‬‫در‬‫آن‬‫را‬‫کاهش‬‫داد‬‫ی‬‫ک‬‫ی‬‫ا‬ ‫از‬‫ی‬‫ن‬‫راه‬‫‏‬‫کارها‬‫می‬‫‏‬‫تواند‬‫پ‬‫ی‬‫اده‬‫‏‬
‫سازی‬‫پا‬ ‫در‬‫ی‬‫گاه‬‫داده‬‫‏‬‫های‬NoSql.‫باشد‬
‫سیستم‬ ‫یک‬ ‫در‬ ‫پردازش‬ ‫از‬ ‫بعد‬ ‫اطالعات‬ ‫سازی‬ ‫بصری‬ ‫چگونگی‬
‫چ‬ ‫همواره‬ ‫داده‬ ‫کالن‬‫بیش‬ ‫پژوهش‬ ‫جای‬ ‫و‬ ‫بوده‬ ‫الشی‬.‫دارد‬ ‫تری‬
16
Software as a Service
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
7
‫نگاشت‬ ‫چارچوب‬ ‫در‬-‫در‬ ‫الگوریتم‬ ‫یک‬ ‫که‬ ‫زمانی‬ ‫کاهش‬‫محیط‬
‫می‬ ‫اجرا‬ ‫ابری‬‫گره‬ ‫بین‬ ‫را‬ ‫کار‬ ‫دارد‬ ‫وظیفه‬ ‫نگاشت‬ ‫تابع‬ ‫شود‬‫های‬
‫بخش‬ ‫به‬ ‫کار‬ ‫تقسیم‬ .‫کند‬ ‫تقسیم‬ ‫کارگر‬‫و‬ ‫آسان‬ ‫همیشه‬ ‫مساوی‬ ‫های‬
‫هر‬ ،‫باشد‬ ‫قواعد‬ ‫استخراج‬ ‫هدف‬ ‫اگر‬ ‫مثال‬ ‫عنوان‬ ‫به‬ .‫نیست‬ ‫راحت‬
‫بیش‬ ‫تقسیمات‬ ‫تعداد‬ ‫چه‬‫مشکل‬ ‫قاعده‬ ‫استخراج‬ ‫شود‬ ‫تر‬‫خواهد‬ ‫تر‬
‫نگاشت‬ ‫از‬ ‫مناسبی‬ ‫تعداد‬ ‫تعیین‬ ‫بنابراین‬ .‫بود‬‫گره‬ ‫تعداد‬ ‫یا‬ ‫ها‬‫یکی‬ ‫ها‬
‫زمینه‬ ‫از‬‫می‬ ‫تحقیقاتی‬ ‫های‬.‫باشد‬ ‫تواند‬
‫منابع‬
[1] Statista. Facebook number of monthly active users worldwide
2015; Available from:
http://www.statista.com/statistics/264810/number-of-monthly-
active-facebook-users-worldwide/.
[2] GEOFF. Just One Minute On Facebook
JUNE 11, 2014; Available from: http//:wersm.com/just-one-minute-on-
facebook-infographic/.
[3] Adedoyin-Olowe, M.M.G., Mohamed; Stahl, Frederic, A Survey
of Data Mining Techniques for Social Media Analysis. eprint
arXiv, 2014. 1312.4617.
[4] Liu, B. and L. Zhang, A Survey of Opinion Mining and Sentiment
Analysis, in Mining Text Data, C.C. Aggarwal and C. Zhai,
Editors. 2012, Springer US. p. 415-463.
[5] Carbonell, J.G., Subjective Understanding: Computer Models of
Belief Systems, in PhD thesis. 1979.
[6] Nasukawa, T. and J. Yi, Sentiment analysis‫:‏‬capturing favorability
using natural language processing, in Proceedings of the 2nd
international conference on Knowledge capture. 2003, ACM:
Sanibel Island, FL, USA. p. 70-77.
[7] Dave, K., S. Lawrence, and D.M. Pennock, Mining the peanut
gallery: opinion extraction and semantic classification of product
reviews, in Proceedings of the 12th international conference on
World Wide Web. 2003, ACM: Budapest, Hungary. p. 519-528.
[8] Mohammad Ehsan Basiri* , A.R.n., Nasser Ghassem-Aghaee A
Framework for Sentiment Analysis in Persian. Open Transactions
on Information Processing, 2014. 1(3): p. 1-14.
[9] Kherwa, P., et al. An approach towards comprehensive sentimental
data analysis and opinion mining. in Advance Computing
Conference (IACC), 2014 IEEE International ‫.‏‬4102.
[01]‫‏‬،‫محمدی‬ ‫مجید‬ ‫و‬ ‫نفس‬ ‫نیک‬ ‫اکبر‬ ‫علی‬ ‫سمیه؛‬ ،‫زرندی‬ ‫برهانی‬9312‫نقد‬ ‫در‬ ‫کاوی‬ ‫عقیده‬ ،
،‫احساسی‬ ‫واژگان‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫کاال‬‫کنفرا‬ ‫دومین‬‫سیستم‬ ‫و‬ ‫صنایع‬ ‫مهندسی‬ ‫ملی‬ ‫نس‬
،‫صنایع‬ ‫مهندسی‬ ‫گروه‬ ،‫آباد‬ ‫نجف‬ ‫واحد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،‫آباد‬ ‫نجف‬ ،‫ها‬
http://www.civilica.com/Paper-NIESC02-NIESC02_082.html‫‏‬
[11] Lewis, R. US Election 2012: Twitter is big winner as Obama is re-
elected for second term. Wed, Nov 7, 2012 ‫‏‏‬[ cited 2015; Available
from: https://uk.news.yahoo.com/us-election-2012--twitter-is-big-
winner-as-obama-is-re-elected-for-second-term-
07112012.html#3DCuuBb.
[12] S. Chandrasekar, E.C., and A. Ginet, Predicting the US
Presidential Election using Twitter data, in CS 229 Machine
Learning Project report. 2012: Stanford University.
[13] Collins, S., et al., Are You Satisfied with Life?: Predicting
Satisfaction with Life from Facebook, in Social Computing,
Behavioral-Cultural Modeling, and Prediction, N. Agarwal, K. Xu,
and N. Osgood, Editors. 2015, Springer International Publishing. p.
24-33.
[14] Amalarethinam, V.J.N.a.D.I.G., Parallel Implementation of Big
Data Pre-Processing Algorithms for Sentiment Analysis of Social
Networking Data. Intern. J. Fuzzy Mathematical Archive, 2015.
6(2): p. 149-159.
[15] Poshyvanyk, D., et al. Combining Probabilistic Ranking and Latent
Semantic Indexing for Feature Identification. in Program
Comprehension, 2006. ICPC 2006. 14th IEEE International
Conference on. 2006.
[16] Rustamov, S., E. Mustafayev, and M.A. Clements. Sentiment
analysis using Neuro-Fuzzy and Hidden Markov models of text. in
Southeastcon, 2013 Proceedings of IEEE. 2013.
[17] Shams, M., A. Shakery, and H. Faili. A non-parametric LDA-
based induction method for sentiment analysis. in Artificial
Intelligence and Signal Processing (AISP), 2012 16th CSI
International Symposium on. 2012.
[18] Bingwei, L., et al. Scalable sentiment classification for Big Data
analysis using Naïve Bayes Classifier. in Big Data, 2013‫‏‬
IEEE International Conference on. 2013.
[19] ،‫خادمی‬ ‫مریم‬ ‫و‬ ‫حامد‬ ،‫وامرزانی‬ ‫عزیزی‬9313‫های‬ ‫چالش‬ ‫و‬ ‫کاربردها‬ ،‫داده‬ ‫کالن‬ ،
،‫آن‬ ‫مرکز‬ ،‫تهران‬ ،‫پایه‬ ‫و‬ ‫مهندسی‬ ‫علوم‬ ‫در‬ ‫نوین‬ ‫دستاوردهای‬ ‫الکترونیکی‬ ‫ملی‬ ‫همایش‬
،‫کاو‬ ‫زمین‬ ‫پژوهشهای‬‫‏‬ http://www.civilica.com/Paper-AEBSCONF01-
AEBSCONF01_114.html
[20] Li, B. and K.C.C. Chan. A Fuzzy Logic Approach for Opinion
Mining on Large Scale Twitter Data. in Utility and Cloud
Computing (UCC), 2014 IEEE/ACM 7th International Conference
on. 2014.
[21] Rahnama, A.H.A., Distributed Real-Time Sentiment Analysis for
Big Data Social Streams. 2014.
[22] Allam, T.M., A.A. Sallam, and H.M. Abdullkader. Managed N-
gram language model based on Hadoop framework and a Hbase
tables. in Informatics and Systems (INFOS), 2014 9th International
Conference on. 2014.

Contenu connexe

En vedette

En vedette (13)

91353111 datamining
91353111 datamining91353111 datamining
91353111 datamining
 
داده کاوی
داده کاویداده کاوی
داده کاوی
 
ارائهٔ DLP
ارائهٔ DLPارائهٔ DLP
ارائهٔ DLP
 
متن‌بازسازی کلان‌داده
متن‌بازسازی کلان‌دادهمتن‌بازسازی کلان‌داده
متن‌بازسازی کلان‌داده
 
تشخیص انجمن در مقیاس کلان داده
تشخیص انجمن در مقیاس کلان دادهتشخیص انجمن در مقیاس کلان داده
تشخیص انجمن در مقیاس کلان داده
 
Two Case Studies Big-Data and Machine Learning at Scale Solutions in Iran
Two Case Studies Big-Data and Machine Learning at Scale Solutions in IranTwo Case Studies Big-Data and Machine Learning at Scale Solutions in Iran
Two Case Studies Big-Data and Machine Learning at Scale Solutions in Iran
 
Big Data and Machine Learning Workshop - Day 3 @ UTACM
Big Data and Machine Learning Workshop - Day 3 @ UTACMBig Data and Machine Learning Workshop - Day 3 @ UTACM
Big Data and Machine Learning Workshop - Day 3 @ UTACM
 
عظيم داده چيست؟
عظيم داده چيست؟عظيم داده چيست؟
عظيم داده چيست؟
 
بیگ دیتا
بیگ دیتابیگ دیتا
بیگ دیتا
 
Neo4j Makes Graphs Easy: Nicole White
Neo4j Makes Graphs Easy: Nicole WhiteNeo4j Makes Graphs Easy: Nicole White
Neo4j Makes Graphs Easy: Nicole White
 
Nasiri PhD Thesis
Nasiri PhD Thesis Nasiri PhD Thesis
Nasiri PhD Thesis
 
Fraud system based on big data and machine learning
Fraud system based on big data and machine learningFraud system based on big data and machine learning
Fraud system based on big data and machine learning
 
Big Data Architecture
Big Data ArchitectureBig Data Architecture
Big Data Architecture
 

Similaire à بررسی کاربردها و چالش های کلان داده در تحلیل عقاید

10. آگهی نامه نمونه گزارش نهایی
10. آگهی نامه نمونه     گزارش نهایی10. آگهی نامه نمونه     گزارش نهایی
10. آگهی نامه نمونه گزارش نهاییShahram Honarmayeh
 
شیوه ارائه مطالب علمی و فنی (دروس 1 تا 8)
شیوه ارائه مطالب علمی و فنی  (دروس 1 تا 8)شیوه ارائه مطالب علمی و فنی  (دروس 1 تا 8)
شیوه ارائه مطالب علمی و فنی (دروس 1 تا 8)ghalamogroup
 
How to Sucess In Meeting - Amir.Zamanian
How to Sucess In Meeting - Amir.ZamanianHow to Sucess In Meeting - Amir.Zamanian
How to Sucess In Meeting - Amir.ZamanianA Zn Network
 
تحلیل محتوای کمی و کیفی کتاب های درسی
تحلیل محتوای کمی و کیفی کتاب های درسیتحلیل محتوای کمی و کیفی کتاب های درسی
تحلیل محتوای کمی و کیفی کتاب های درسیmohammad nourian
 
داده کاوی علمی
داده کاوی علمیداده کاوی علمی
داده کاوی علمیsgilasi
 
بستر برای جمع آوری اطّلاعات چیست؟
بستر برای جمع آوری اطّلاعات چیست؟بستر برای جمع آوری اطّلاعات چیست؟
بستر برای جمع آوری اطّلاعات چیست؟Navid Daneshvaran
 
زهره عموزاده مهدیرجی (مبانی و مدیریت فناوری اطلاعات سواد اطلاعاتی)
زهره عموزاده مهدیرجی  (مبانی و مدیریت فناوری اطلاعات سواد اطلاعاتی)زهره عموزاده مهدیرجی  (مبانی و مدیریت فناوری اطلاعات سواد اطلاعاتی)
زهره عموزاده مهدیرجی (مبانی و مدیریت فناوری اطلاعات سواد اطلاعاتی)Lampesht
 
Aliaskari,fayazi resource sharing.markor.. .docx
Aliaskari,fayazi resource sharing.markor.. .docxAliaskari,fayazi resource sharing.markor.. .docx
Aliaskari,fayazi resource sharing.markor.. .docxfahime aliaskari
 
مرور و خلاصه ارائه یوسف فراهانی در مورد کپی رایتینگ در تجربه کاربری (UXWriting)
مرور و خلاصه ارائه یوسف فراهانی در مورد کپی رایتینگ در تجربه کاربری (UXWriting)مرور و خلاصه ارائه یوسف فراهانی در مورد کپی رایتینگ در تجربه کاربری (UXWriting)
مرور و خلاصه ارائه یوسف فراهانی در مورد کپی رایتینگ در تجربه کاربری (UXWriting)درمسیر بازاریابی دیجیتال
 
بسته برنزی آزمون نظام مهندسی تاسیسات برقی طراحی و نظارت
بسته برنزی آزمون نظام مهندسی تاسیسات برقی طراحی و نظارتبسته برنزی آزمون نظام مهندسی تاسیسات برقی طراحی و نظارت
بسته برنزی آزمون نظام مهندسی تاسیسات برقی طراحی و نظارتMohammad Karimi
 
بسته برنزي آزمون نظام مهندسی برق-نظارت
بسته برنزي آزمون نظام مهندسی برق-نظارتبسته برنزي آزمون نظام مهندسی برق-نظارت
بسته برنزي آزمون نظام مهندسی برق-نظارتMohammad Karimi
 
بسته نقره اي آزمون نظام مهندسی برق-طراحي
بسته نقره اي آزمون نظام مهندسی برق-طراحيبسته نقره اي آزمون نظام مهندسی برق-طراحي
بسته نقره اي آزمون نظام مهندسی برق-طراحيMohammad Karimi
 

Similaire à بررسی کاربردها و چالش های کلان داده در تحلیل عقاید (20)

10. آگهی نامه نمونه گزارش نهایی
10. آگهی نامه نمونه     گزارش نهایی10. آگهی نامه نمونه     گزارش نهایی
10. آگهی نامه نمونه گزارش نهایی
 
Open access workshop
Open access workshopOpen access workshop
Open access workshop
 
شیوه ارائه مطالب علمی و فنی (دروس 1 تا 8)
شیوه ارائه مطالب علمی و فنی  (دروس 1 تا 8)شیوه ارائه مطالب علمی و فنی  (دروس 1 تا 8)
شیوه ارائه مطالب علمی و فنی (دروس 1 تا 8)
 
Altmetrics
AltmetricsAltmetrics
Altmetrics
 
How to Sucess In Meeting - Amir.Zamanian
How to Sucess In Meeting - Amir.ZamanianHow to Sucess In Meeting - Amir.Zamanian
How to Sucess In Meeting - Amir.Zamanian
 
Delphi final
Delphi finalDelphi final
Delphi final
 
Delphi final
Delphi finalDelphi final
Delphi final
 
تحلیل محتوای کمی و کیفی کتاب های درسی
تحلیل محتوای کمی و کیفی کتاب های درسیتحلیل محتوای کمی و کیفی کتاب های درسی
تحلیل محتوای کمی و کیفی کتاب های درسی
 
داده کاوی علمی
داده کاوی علمیداده کاوی علمی
داده کاوی علمی
 
بستر برای جمع آوری اطّلاعات چیست؟
بستر برای جمع آوری اطّلاعات چیست؟بستر برای جمع آوری اطّلاعات چیست؟
بستر برای جمع آوری اطّلاعات چیست؟
 
زهره عموزاده مهدیرجی (مبانی و مدیریت فناوری اطلاعات سواد اطلاعاتی)
زهره عموزاده مهدیرجی  (مبانی و مدیریت فناوری اطلاعات سواد اطلاعاتی)زهره عموزاده مهدیرجی  (مبانی و مدیریت فناوری اطلاعات سواد اطلاعاتی)
زهره عموزاده مهدیرجی (مبانی و مدیریت فناوری اطلاعات سواد اطلاعاتی)
 
Delphi final
Delphi finalDelphi final
Delphi final
 
Aliaskari,fayazi resource sharing.markor.. .docx
Aliaskari,fayazi resource sharing.markor.. .docxAliaskari,fayazi resource sharing.markor.. .docx
Aliaskari,fayazi resource sharing.markor.. .docx
 
مرور و خلاصه ارائه یوسف فراهانی در مورد کپی رایتینگ در تجربه کاربری (UXWriting)
مرور و خلاصه ارائه یوسف فراهانی در مورد کپی رایتینگ در تجربه کاربری (UXWriting)مرور و خلاصه ارائه یوسف فراهانی در مورد کپی رایتینگ در تجربه کاربری (UXWriting)
مرور و خلاصه ارائه یوسف فراهانی در مورد کپی رایتینگ در تجربه کاربری (UXWriting)
 
Delphi final
Delphi finalDelphi final
Delphi final
 
بسته برنزی آزمون نظام مهندسی تاسیسات برقی طراحی و نظارت
بسته برنزی آزمون نظام مهندسی تاسیسات برقی طراحی و نظارتبسته برنزی آزمون نظام مهندسی تاسیسات برقی طراحی و نظارت
بسته برنزی آزمون نظام مهندسی تاسیسات برقی طراحی و نظارت
 
Lug
LugLug
Lug
 
بسته برنزي آزمون نظام مهندسی برق-نظارت
بسته برنزي آزمون نظام مهندسی برق-نظارتبسته برنزي آزمون نظام مهندسی برق-نظارت
بسته برنزي آزمون نظام مهندسی برق-نظارت
 
Osint second edition
Osint second edition Osint second edition
Osint second edition
 
بسته نقره اي آزمون نظام مهندسی برق-طراحي
بسته نقره اي آزمون نظام مهندسی برق-طراحيبسته نقره اي آزمون نظام مهندسی برق-طراحي
بسته نقره اي آزمون نظام مهندسی برق-طراحي
 

بررسی کاربردها و چالش های کلان داده در تحلیل عقاید

  • 1. ‫عقاید‬ ‫تحلیل‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫های‬ ‫چالش‬ ‫و‬ ‫کاربرد‬ ‫بررسی‬ ‫وامرزانی‬ ‫عزیزی‬ ‫حامد‬** ‫نرم‬ ‫کامپیوتر‬ ‫مهندسی‬ ‫گروه‬‫افزار‬ ‫تهران‬ ‫مهندسی‬ ‫و‬ ‫فنی‬ ‫دانشکده‬‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،‫جنوب‬ ‫ایران‬ ،‫تهران‬ st_h_azizi@azad.ac.ir ‫خادمی‬ ‫مریم‬ ‫ری‬ ‫گروه‬‫اضی‬‫کاربردی‬ ‫دانشکده‬‫جنوب‬ ‫تهران‬ ‫پایه‬ ‫علوم‬‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ، ‫ایران‬ ،‫تهران‬ khademi@azad.ac.ir ‫چکیده‬—‫رسانه‬ ‫محبوبیت‬ ‫و‬ ‫گسترش‬ ‫با‬‫جوامع‬ ‫این‬ ،‫محور‬ ‫کاربر‬ ‫های‬ ‫تج‬ ،‫سیاسی‬ ‫گوناگون‬ ‫اطالعات‬ ‫از‬ ‫ارزشمند‬ ‫منبعی‬ ‫به‬ ‫مجازی‬،‫اری‬ ‫نشان‬ ‫اطالعاتی‬ ‫این‬ .‫است‬ ‫شده‬ ‫تبدیل‬ ... ‫و‬ ‫اجتماعی‬‫و‬ ‫افکار‬ ‫دهنده‬ ‫وسیع‬ ‫دید‬ ‫در‬ ‫و‬ ‫فرد‬ ‫یک‬ ‫احساسات‬‫با‬ ‫که‬ ‫است‬ ‫کشور‬ ‫یک‬ ‫و‬ ‫جامعه‬ ،‫تر‬ ‫داده‬ ‫این‬ ‫در‬ ‫کاوش‬‫می‬ ‫ها‬‫حوزه‬ ‫در‬ ‫ارزشی‬ ‫با‬ ‫بسیار‬ ‫دانش‬ ‫به‬ ‫توان‬‫های‬ ‫کالن‬ ‫اطالعات‬ ‫از‬ ‫حجم‬ ‫این‬ ‫تحلیل‬ ‫است‬ ‫واضح‬ .‫یافت‬ ‫دست‬ ‫گوناگون‬ ‫غیرساخت‬‫یاف‬‫روش‬ ‫نیازمند‬ ،‫کاربران‬ ‫ته‬‫متن‬ ‫بهینه‬ ‫و‬ ‫نوین‬ ‫های‬‫و‬ ‫کاوی‬ .‫است‬ ‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫تحلیل‬ ‫کاربردهای‬ ‫معرفی‬ ‫از‬ ‫پس‬ ‫مقاله‬ ‫این‬ ‫در‬‫عقاید‬‫یک‬ ‫در‬ ‫کاربران‬ ‫کالن‬ ‫مجموعه‬‫شبکه‬ ‫همانند‬ ‫داده‬‫های‬‫سایت‬ ‫یا‬ ‫و‬ ‫اجتماعی‬‫بزرگ‬ ‫های‬ ‫چالش‬ ،‫مباحث‬ ‫آخرین‬ ،‫اینترنتی‬ ‫فروش‬‫راه‬ ‫و‬ ‫ها‬‫حوزه‬ ‫این‬ ‫در‬ ‫کارها‬‫مورد‬ .‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫بررسی‬ ‫واژ‬‫ه‬‫کلیدی‬ ‫های‬-‫متن‬ ،‫اجتماعی‬ ‫شبکه‬،‫کاوی‬‫کالن‬‫داده‬‫تحلیل‬ ،‫عقاید‬، ‫طبقه‬‫بندی‬ 1.‫مقدمه‬ ‫ارزش‬ ‫گاهی‬ ‫و‬ ‫مشترک‬ ‫وجوه‬ ‫داشتن‬ ‫دلیل‬ ‫به‬ ‫جامعه‬ ‫در‬ ‫افراد‬‫مشترک‬ ‫های‬ ‫شبکه‬ ‫و‬ ‫گذاشته‬ ‫تأثیر‬ ‫یکدیگر‬ ‫روی‬ ‫بر‬‫آن‬ ‫بین‬ ‫در‬ ‫اعتماد‬ ‫و‬ ‫ارزش‬ ‫از‬ ‫ای‬‫ها‬ ‫خاصی‬ ‫موضوعات‬ ‫برای‬‫می‬ ‫ایجاد‬.‫گردد‬ ‫شبکه‬‫اجتماعی‬ ‫های‬‫فروشگاه‬ ،‫وبالگ‬ ‫و‬ ‫اینترنتی‬ ‫های‬‫ها‬‫منبع‬ ‫به‬ ‫ارز‬‫شمند‬‫زمینه‬ ‫در‬ ‫احساسات‬ ‫کاوش‬ ‫برای‬ ‫ی‬‫مدیریت‬ ‫نظیر‬ ‫گوناگونی‬ ‫هایی‬ ،‫مشتری‬ ‫با‬ ‫ارتباط‬‫جامعه‬‫کاوش‬ ،‫بازاریابی‬ ،‫شناسی‬‫افکار‬‫و‬ ‫سیاست‬ ،‫عمومی‬ ‫تبدیل‬ ...‫شده‬‫ان‬.‫د‬‫رسیده‬ ‫اثبات‬ ‫به‬ ‫حقیقت‬ ‫این‬‫ب‬ ‫دانش‬ ‫که‬‫ه‬‫دست‬‫آ‬‫از‬ ‫مده‬ ‫شبکه‬‫فیس‬ ‫و‬ ‫توییتر‬ ‫نظیر‬ ‫اجتماعی‬ ‫های‬‫بوک‬‫سایت‬ ‫یا‬ ‫و‬‫فروش‬ ‫بزرگ‬ ‫های‬ ‫روش‬ ‫دیگر‬ ‫به‬ ‫نسبت‬ ‫باالتری‬ ‫ارزش‬ ‫مراتب‬ ‫به‬ ‫آمازون‬ ‫همانند‬ ‫اینترنتی‬‫های‬ ‫زیرا‬ ،‫دارند‬ ‫افراد‬ ‫از‬ ‫فیزیکی‬ ‫مصاحبه‬ ‫و‬ ‫نظرسنجی‬ ‫مانند‬ ‫عقیده‬ ‫کاوش‬ ‫سنتی‬ ‫این‬ ‫در‬‫شبکه‬ ‫گونه‬‫خالص‬ ‫نظرات‬ ‫کاربران‬ ً‫ال‬‫معمو‬ ‫ها‬‫می‬ ‫ارائه‬ ‫را‬ ‫خود‬‫و‬ ‫دهند‬ .‫نیست‬ ‫تأثیرگذار‬ ‫آن‬ ‫روی‬ ‫بر‬ ‫عاملی‬ ‫هیچ‬ ‫نوعی‬ ‫به‬ ‫به‬‫می‬ ‫مردم‬ ‫اطالعاتی‬ ‫منبع‬ ‫این‬ ‫وسیله‬‫صحیح‬ ‫تصمیمات‬ ‫توانند‬‫با‬ ‫تری‬ ‫محصول‬ ‫صاحبان‬ ‫راستا‬ ‫همین‬ ‫در‬ ‫و‬ ‫کنند‬ ‫اتخاذ‬ ‫افراد‬ ‫دیگر‬ ‫تجربیات‬ ‫به‬ ‫توجه‬ ‫می‬ ‫نیز‬ ‫خدمات‬ ‫یا‬ ‫و‬‫عقاید‬ ‫و‬ ‫نظرات‬ ‫این‬ ‫تحلیل‬ ‫به‬ ‫توجه‬ ‫با‬ ‫توانند‬‫خود‬ ‫کیفیت‬ .‫بخشند‬ ‫بهبود‬ ‫را‬
  • 2. ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 2 ‫آمارها‬ ‫آخرین‬ ‫طبق‬[9]‫فیس‬ ‫اجتماعی‬ ‫شبکه‬‫پیدایش‬ ‫زمان‬ ‫از‬ ‫بوک‬ ‫سال‬ ‫در‬ ‫خود‬ ‫رسمی‬2004‫توانسته‬ ‫تاکنون‬44/9‫که‬ ‫را‬ ‫فعالی‬ ‫کاربر‬ ‫میلیارد‬ ‫می‬ ‫خود‬ ‫شخصی‬ ‫صفحه‬ ‫وارد‬ ‫بار‬ ‫یک‬ ‫حداقل‬ ‫ماهیانه‬‫دنیا‬ ‫سراسر‬ ‫در‬ ‫را‬ ‫شوند‬ ‫حدود‬ ‫دقیقه‬ ‫یک‬ ‫در‬ ‫کاربران‬ ‫این‬ ،‫کند‬ ‫جذب‬000/49‫عنوان‬ ‫به‬ ‫را‬ ‫متنی‬ ‫بار‬ ‫فیس‬ ‫در‬ ‫وضعیت‬‫می‬ ‫بوک‬‫نو‬‫یسند‬[2]،‫توییتر‬ ‫اجتماعی‬ ‫شبکه‬ ‫در‬ ‫اما‬‫روزانه‬ 000‫به‬ )‫(توییت‬ ‫نوشته‬ ‫میلیون‬33‫زب‬‫می‬ ‫منتشر‬ ‫کاربران‬ ‫توسط‬ ‫دنیا‬ ‫زنده‬ ‫ان‬ ‫شود‬.‫از‬ ‫بیش‬ ‫آمازون‬ ‫اینترنتی‬ ‫فروش‬ ‫بزرگ‬ ‫سایت‬ ‫در‬270‫فعال‬ ‫کاربر‬ ‫میلیون‬ ‫دارد‬ ‫وجود‬‫در‬ ‫را‬ ‫نظرات‬ ‫از‬ ‫عظیمی‬ ‫حجم‬ ‫که‬‫وارد‬ ‫مختلف‬ ‫محصوالت‬ ‫مورد‬ .‫کنند‬ ‫می‬ ‫خوان‬ ‫است‬ ‫واضح‬‫نظرات‬ ‫از‬ ‫بخشی‬ ‫حتی‬ ‫یا‬ ‫و‬ ‫تمامی‬ ‫بررسی‬ ‫و‬ ‫دن‬ ‫وقت‬ ‫کاری‬ ‫کاربران‬‫در‬ ‫و‬ ‫گیر‬‫داده‬ ‫از‬ ‫عظیم‬ ‫حجم‬ ‫این‬،‫است‬ ‫غیرممکن‬ ‫عقیده‬ ‫حوزه‬ ‫در‬ ‫بنابراین‬‫ابزاری‬ ‫بهبود‬ ‫و‬ ‫ساخت‬ ‫دنبال‬ ‫به‬ ‫پژوهشگران‬ ‫کاوی‬ ‫به‬ ‫توجه‬ ‫با‬ ‫را‬ ‫کاربران‬ ‫نظرات‬ ‫و‬ ‫عقیده‬ ‫خودکار‬ ‫صورت‬ ‫به‬ ‫بتواند‬ ‫که‬ ‫هستند‬ ‫نوشته‬‫های‬‫آنان‬‫استخراج‬‫ذی‬ ‫به‬ ‫کلی‬ ‫وضعیت‬ ‫یک‬ ‫و‬ ‫کند‬.‫بدهد‬ ‫نفعان‬ 2.‫مفاهیم‬‫و‬‫الیه‬‫تحلیل‬ ‫مختلف‬ ‫های‬ ‫تعار‬‫ی‬‫ف‬‫ز‬‫ی‬‫اد‬‫ی‬‫ب‬ ‫مختلف‬ ‫مقاالت‬ ‫در‬‫ی‬‫ان‬‫همگ‬ ‫که‬ ‫شده‬‫ی‬‫ی‬‫ک‬‫معنا‬‫ی‬‫واحد‬ ‫تحل‬ .‫دارند‬ ‫را‬‫ی‬‫ل‬‫احساسات‬‫و‬‫عق‬‫ی‬‫ده‬‫‏‬‫کاوی‬‫معن‬ ‫به‬‫ی‬‫شناخت‬ ‫و‬ ‫کشف‬ ‫و‬ ‫مثبت‬ ‫احساسات‬‫ی‬‫ا‬‫منف‬‫ی‬‫به‬ ‫راجع‬ ‫مردم‬‫ی‬‫ک‬‫مسأله‬‫ی‬‫ا‬‫است‬ ‫محصول‬[3]. ‫چهارگانه‬ ‫یک‬ ‫نظر‬ ‫یک‬ :‫نظر‬(g, s, h, t)‫آن‬ ‫در‬ ‫که‬ ‫است‬g‫هدف‬ ‫که‬ ‫(آنچه‬"‫نظر‬"،)‫است‬ ‫شده‬ ‫بیان‬ ‫آن‬ ‫مورد‬ ‫در‬s،‫شده‬ ‫بیان‬ ‫حس‬h ‫و‬ ‫نظر‬ ‫صاحب‬t‫نظر‬ ‫بیان‬ ‫زمان‬‫است‬. :‫موجودیت‬‫موجودیت‬ ‫یک‬e،‫شخص‬ ،‫سرویس‬ ،‫محصول‬ ‫یک‬ ‫می‬ ‫تعریف‬ ‫جفت‬ ‫یک‬ ‫با‬ ‫که‬ ‫است‬ ‫عنوانی‬ ‫یا‬ ‫سازمان‬ ،‫رخداد‬- :‫شود‬e:(T,W)‫که‬T‫امثال‬ ‫و‬ ‫زیرجزء‬ ‫و‬ ‫جزء‬ ‫مراتب‬ ‫سلسله‬ ‫یک‬ ‫و‬ ‫آن‬W‫خص‬ ‫مجموعه‬‫ا‬‫هم‬ ‫زیرجزء‬ ‫هر‬ .‫است‬ ‫موجودیت‬ ‫آن‬ ‫یص‬ ‫خص‬ ‫خودش‬‫ا‬.‫داراست‬ ‫را‬ ‫خود‬ ‫یص‬‫آن‬ ‫همگی‬ ‫وجود‬‫ضروروی‬ ‫ها‬ ‫با‬ ‫تحلیل‬ ‫کار‬ ،‫قسمت‬ ‫پنج‬ ‫این‬ ‫از‬ ‫یک‬ ‫هر‬ ‫نبود‬ ‫صورت‬ ‫در‬ ‫و‬ ‫بوده‬ ‫روبه‬ ‫مشکل‬.‫شد‬ ‫خواهد‬ ‫رو‬ ‫عقیده‬‫م‬ ‫تقسیم‬ ‫تحلیل‬ ‫مختلف‬ ‫سطح‬ ‫سه‬ ‫در‬ ‫کاوی‬‫ی‬‫شود‬[4]. ‫سند‬ ‫سطح‬‫آن‬ ‫دنبال‬ ‫به‬ ‫نظری‬ ‫سند‬ ‫یک‬ ‫داشتن‬ ‫با‬ ‫سطح‬ ‫این‬ ‫در‬ : ‫منفی‬ ‫یا‬ ‫مثبت‬ ‫نظر‬ ‫سند‬ ‫این‬ ‫کل‬ ‫بدانیم‬ ‫که‬ ‫هستیم‬.‫دارد‬‫عنوان‬ ‫به‬ ‫مقاله‬ ‫یک‬ ‫داشتن‬ ‫با‬ ‫مثال‬‫نقد‬ ‫یا‬‫مشخص‬ ‫سیستم‬ ،‫محصول‬ ‫یک‬ ‫از‬ ‫می‬.‫است‬ ‫بوده‬ ‫منفی‬ ‫یا‬ ‫مثبت‬ ‫کلی‬ ‫نظر‬ ‫مسأله‬ ‫مورد‬ ‫در‬ ‫که‬ ‫نماید‬ ‫جمله‬ ‫سطح‬:‫مث‬ ‫های‬ ‫دسته‬ ‫به‬ ‫جمالت‬‫و‬ ،‫منفی‬ ،‫بت‬‫دسته‬ ‫خنثی‬ ‫می‬ ‫بندی‬‫شوند‬. ‫ویژگی‬ ‫و‬ ‫موجودیت‬ ‫سطح‬:‫زبان‬ ‫ساختارهای‬ ‫به‬ ‫پرداختن‬ ‫جای‬ ‫به‬ ‫خود‬ ‫سراغ‬ ‫مستقیما‬ ‫سطح‬ ‫این‬ ‫در‬ ... ‫و‬ ‫عبارت‬ ،‫پارگراف‬ ،‫جمله‬ ‫مثل‬ ‫می‬ ‫نظر‬‫جزء‬ ‫(دو‬ ‫آن‬ ‫به‬ ‫مربوط‬ ‫حس‬ ‫و‬ ‫موجودیت‬ ‫اغلب‬ .‫رویم‬ ‫می‬ ‫هم‬ ‫با‬ ‫همراه‬ )‫نظر‬ ‫اصلی‬‫کشف‬ ‫دنبال‬ ‫به‬ ‫سطح‬ ‫این‬ ‫در‬ .‫آیند‬‫حس‬ ‫موجودیت‬ ‫روی‬‫جنبه‬ ‫و‬ ‫ها‬‫ها‬9 ‫هستیم‬ ‫آنها‬ ‫مختلف‬ ‫ها)ی‬ ‫(ویژگی‬‫که‬ .‫دارد‬ ‫بیشتر‬ ‫های‬ ‫پیچیدگی‬ ‫قبل‬ ‫حالت‬ ‫دو‬ ‫به‬ ‫نسب‬ ‫به‬ 3.‫تاریخچه‬‫کاربرد‬ ‫و‬ ‫اولین‬ ‫از‬ ‫یکی‬‫تحقیقات‬‫سال‬ ‫در‬ ‫حوزه‬ ‫این‬ ‫در‬9171‫کاربنل‬ ‫توسط‬[0] ‫شبیه‬ ‫مدل‬ ‫یک‬ ‫از‬ ‫وی‬ ،‫شد‬ ‫معرفی‬‫که‬ ‫کرد‬ ‫طراحی‬ ‫را‬ ‫کامپیوتری‬ ‫شده‬ ‫سازی‬ ‫می‬‫را‬ ‫کار‬ ‫محافظه‬ ‫یا‬ ‫و‬ ‫خواه‬ ‫آزادی‬ ‫حزب‬ ‫از‬ ‫فرد‬ ‫یک‬ ‫سیاسی‬ ‫عقاید‬ ‫توانست‬ ‫سیاست‬ ‫به‬ ‫توجه‬ ‫با‬‫و‬ ‫آمریکا‬‫روسیه‬‫سیاست‬ ‫دیگر‬ ‫و‬‫بین‬ ‫های‬‫مدل‬ ‫المللی‬- ‫نما‬ ‫سازی‬.‫ید‬ ‫احساسات‬ ‫تحلیل‬ ‫عبارت‬ ‫اما‬‫در‬[6]‫عقیده‬ ‫اصطالح‬ ‫و‬‫در‬ ‫نیز‬ ‫کاوی‬[7] ‫زبان‬ ‫اگرچه‬ ،‫شد‬ ‫برده‬ ‫نام‬ ‫بار‬ ‫اولین‬ ‫برای‬‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫و‬ ‫شناسی‬‫سابقه‬ ‫سال‬ ‫از‬ ‫قبل‬ ‫تا‬ ‫اما‬ ‫دارند‬ ‫تحقیقاتی‬ ‫طوالنی‬2000‫پژوهش‬ ‫میالدی‬‫بسیار‬ ‫های‬ .‫بود‬ ‫پذیرفته‬ ‫صورت‬ ‫احساسات‬ ‫تحلیل‬ ‫با‬ ‫رابطه‬ ‫در‬ ‫محدودی‬ ‫سال‬ ‫در‬ ‫شاخه‬ ‫این‬ ‫در‬ ‫تحقیقات‬ ‫گسترش‬،‫دارد‬ ‫مختلفی‬ ‫دالیل‬ ‫اخیر‬ ‫های‬ ً‫ال‬‫او‬‫حوزه‬ ‫هر‬ ‫تقریبا‬ ‫آن‬ ‫کاربرد‬‫می‬ ‫شامل‬ ‫را‬ ‫ای‬‫به‬ ‫شود‬‫صنعت‬ ‫بخش‬ ‫در‬ ‫ویژه‬ ‫تحلیل‬ ‫را‬ ‫بازار‬ ً‫ال‬‫کام‬ ‫دارند‬ ‫نیاز‬ ‫مشاغل‬ ‫صاحبان‬ ،‫بازار‬ ‫بودن‬ ‫رقابتی‬ ‫دلیل‬ ‫به‬ ‫برای‬ ‫را‬ ‫زیادی‬ ‫هزینه‬ ‫هستند‬ ‫حاضر‬ ‫و‬ ‫باشند‬ ‫آگاه‬ ‫مشتریان‬ ‫نظرات‬ ‫از‬ ‫و‬ ‫نموده‬ ‫چالشی‬ ‫حوزه‬ ‫یک‬ ً‫ا‬‫ثانی‬ ‫دهند‬ ‫انجام‬ ‫اطالعات‬ ‫این‬ ‫داشتن‬‫به‬ ،‫است‬ ‫تحقیقاتی‬- ‫به‬ ‫فارسی‬ ‫زبان‬ ‫در‬ ‫خصوص‬‫پیچیدگی‬ ‫دلیل‬‫زیادی‬ ‫کار‬ ‫جای‬ ‫آن‬ ‫خاص‬ ‫های‬ ‫دارد‬[8]. ‫آخرین‬ ‫و‬ ‫معرفی‬ ‫احساسات‬ ‫تحلیل‬ ‫پرکاربرد‬ ‫حوزه‬ ‫چند‬ ‫ادامه‬ ‫در‬ .‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫تحقیقات‬ 1 Aspects
  • 3. ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 3 3.1.‫الکترونیک‬ ‫تجارت‬ ‫و‬ ‫بازاریابی‬ ‫بیش‬‫عقیده‬ ‫کاربرد‬ ‫ترین‬‫راه‬ ‫زیرا‬ ‫است‬ ‫تجارت‬ ‫و‬ ‫بازار‬ ‫حوزه‬ ‫در‬ ‫کاوی‬‫کارها‬ ‫این‬ ‫در‬ ‫کاربردها‬ .‫شد‬ ‫خواهد‬ ‫فروش‬ ‫و‬ ‫سوددهی‬ ‫افزایش‬ ‫به‬ ‫منجر‬ ً‫ال‬‫معمو‬ ‫حوزه‬:‫است‬ ‫بررسی‬ ‫قابل‬ ‫زیر‬ ‫دیدگاه‬ ‫سه‬ ‫از‬ ‫مشتریان‬ ‫دیدگاه‬ ‫از‬،‫کاال‬ ‫مزایا‬ ‫و‬ ‫معایب‬ ،‫محصول‬ ‫کیفیت‬ ‫بررسی‬ : ... ‫و‬ ‫محصوالت‬ ‫مقایسه‬ ،‫دیگران‬ ‫تجربیات‬ ‫از‬ ‫استفاده‬ ‫تولیدکنندگان‬ ‫دیدگاه‬ ‫از‬‫از‬ ‫خود‬ ‫محصول‬ ‫ضعف‬ ‫نقاط‬ ‫کشف‬ : ‫از‬ ‫بهتر‬ ‫درک‬ ،‫مشتریان‬ ‫انتظارات‬ ‫و‬ ‫نظرات‬ ‫نقطه‬ ،‫مشتریان‬ ‫دیدگاه‬ ‫مشت‬ ‫نیاز‬‫شرکت‬ ‫سایر‬ ‫با‬ ‫رقابت‬ ‫و‬ ‫مقایسه‬ ،‫خود‬ ‫ریان‬‫در‬ ‫رقیب‬ ‫های‬ ... ‫و‬ ‫بازار‬ ‫فروشندگان‬ ‫دیدگاه‬ ‫از‬‫با‬ ‫مناسب‬ ‫تبلیغات‬ ،‫بازاریابی‬ :‫و‬ ‫عالیق‬ ‫سال‬... ‫و‬ ‫خریداران‬ ‫به‬ ‫مناسب‬ ‫محصول‬ ‫پیشنهاد‬ ،‫مشتریان‬ ‫یق‬ ‫مقاله‬ ‫در‬[1]‫جمع‬ ‫پس‬‫بازبینی‬ ‫و‬ ‫نظرات‬ ‫متن‬ ‫آوری‬‫کاربرن‬ ‫های‬2 ‫از‬ ‫انجمن‬‫شبکه‬ ،‫گفتگو‬ ‫های‬‫فروشگاه‬ ،‫اجتماعی‬ ‫های‬... ‫و‬ ‫اینترنتی‬ ‫آنالین‬ ‫های‬ ‫تکنیک‬ ‫از‬ ‫استفاده‬ ‫با‬‫احساسات‬ ‫و‬ ‫عقاید‬ ‫تواستند‬ ‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫های‬ ‫موبایل‬ ‫گوشی‬ ‫مانند‬ ‫مختلفی‬ ‫محصوالت‬ ‫مورد‬ ‫در‬ ‫را‬ ‫کاربران‬‫به‬‫و‬ ‫آورده‬ ‫دست‬ ‫ویژگی‬ ‫مورد‬ ‫در‬ ‫جزئیات‬ ‫به‬‫دیده‬ ‫کاربران‬ ‫نقدهای‬ ‫که‬ ‫در‬ ‫آن‬ ‫مختلف‬ ‫های‬ ‫بصری‬ ،‫شده‬‫سازی‬3 ‫شکل‬ ‫در‬ ‫دهند‬ ‫انجام‬ ‫را‬9‫موبایل‬ ‫یک‬ ‫ویژگی‬ ‫از‬ ‫نمونه‬ ‫دو‬ ‫آمده‬ ‫موردنظر‬ ‫محصول‬ ‫به‬ ‫نسبت‬ ‫کاربران‬ ‫احساسات‬ ‫کلی‬ ‫نتیجه‬ ‫همراه‬ ‫به‬ .‫است‬ ‫شکل‬1-‫مورد‬ ‫در‬ ‫کاربران‬ ‫احساسات‬ ‫تحلیل‬ ‫نتایج‬‫موبایل‬ ‫گوشی‬ ‫یک‬ ‫ویژگی‬ ‫تحلیل‬ ‫خالصه‬ ،‫کلی‬ ‫نتیجه‬ ‫یک‬ ‫تولید‬ ‫با‬ ‫نهایت‬ ‫در‬ ‫و‬‫مختلف‬ ‫های‬ ‫می‬ ‫خالصه‬ ‫نتیجه‬ ‫یک‬ ‫در‬ ‫را‬.‫کند‬ ‫در‬‫فارس‬ ‫زبان‬‫ی‬‫ن‬‫ی‬‫ز‬‫محمد‬‫ی‬‫همکاران‬ ‫و‬[90]‫راه‬‫کاری‬‫نقد‬ ‫درجهت‬ ‫را‬ ‫ی‬‫ک‬‫احساس‬ ‫واژگان‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫کاال‬‫ی‬‫که‬‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫های‬‫تحل‬‫ی‬‫ل‬ ‫ا‬ ‫در‬ ،‫نمودند‬ ‫ارائه‬ ‫است‬ ‫احساسات‬‫ی‬‫ن‬‫س‬‫ی‬‫ستم‬‫پ‬ ‫مرحله‬ ‫در‬ ‫ابتدا‬‫ی‬‫ش‬‫پردازش‬ ‫داده‬‫جداساز‬ ‫با‬ ‫ها‬‫ی‬‫کل‬‫برچسب‬ ،‫جمالت‬ ‫و‬ ‫مات‬‫گذاری‬‫اجزا‬‫ی‬‫ر‬ ‫و‬ ‫سخن‬‫ی‬‫شه‬‫‏‬ 2 User Review 3 visualization ‫ی‬‫اب‬‫ی‬‫موردن‬ ‫اطالعات‬ ،‫کلمات‬‫ی‬‫از‬‫م‬ ‫استخراج‬ ‫نقدها‬ ‫از‬‫ی‬‫شود‬‫با‬ ‫بعد‬ ‫مرحله‬ ‫در‬ . ‫و‬ ‫استخراج‬‫ی‬‫ژگ‬‫ی‬‫ها‬‫ی‬‫و‬ ‫از‬ ‫دسته‬ ‫آن‬ ،‫نقدها‬ ‫از‬ ‫کاال‬‫ی‬‫ژگ‬‫ی‬‫ها‬‫کاربران‬ ‫نظر‬ ‫از‬ ‫که‬ ‫اهم‬‫ی‬‫ت‬‫ب‬‫ی‬‫ش‬‫تری‬‫م‬ ‫مشخص‬ ‫دارند‬‫ی‬‫شوند‬‫و‬ .‫ی‬‫ژگ‬‫ی‬‫های‬‫به‬‫دست‬‫آمده‬‫با‬‫دقت‬ ‫باالیی‬‫مشا‬‫و‬ ‫با‬ ‫به‬‫ی‬‫ژگ‬‫ی‬‫های‬‫واقع‬‫ی‬‫طبقه‬ ‫و‬ ‫بوده‬ ‫کاال‬‫بن‬‫د‬‫ی‬‫احساس‬‫ی‬‫مجموعه‬ ‫احساس‬ ‫بار‬ ‫براساس‬ ،‫داده‬‫ی‬‫م‬ ‫صورت‬ ‫متن‬ ‫در‬ ‫موجود‬ ‫واژگان‬‫ی‬‫پذی‬‫رد‬. ‫در‬‫عرصه‬‫ن‬ ‫بورس‬ ‫بازار‬ ‫و‬ ‫سهام‬‫ی‬‫ز‬‫عده‬‫ای‬‫تحل‬ ‫از‬‫ی‬‫ل‬‫گران‬‫سرما‬‫ی‬‫ه‬‫با‬ ‫عق‬ ‫از‬ ‫استفاده‬‫ی‬‫ده‬‫کاوی‬‫به‬ ‫راجع‬ ‫کاربران‬‫ی‬‫ک‬‫ق‬ ،‫شرکت‬‫ی‬‫مت‬‫پ‬ ‫را‬ ‫آن‬ ‫سهام‬‫ی‬‫ش‬ ‫بی‬‫ن‬‫ی‬‫م‬‫ی‬‫کنن‬‫د‬‫برا‬‫ی‬‫سا‬ ‫وب‬ ‫در‬ ‫مثال‬‫ی‬‫ت‬sentdex.com‫در‬ ‫کاربران‬ ‫نظرات‬ ‫شبکه‬‫های‬‫اجتماع‬‫ی‬‫شرکت‬ ‫به‬ ‫راجع‬‫ها‬‫ی‬‫تجز‬ ‫بزرگ‬‫ی‬‫ه‬‫تحل‬ ‫و‬‫ی‬‫ل‬‫و‬ ‫شده‬ ‫نما‬‫ی‬‫ش‬‫داده‬‫م‬‫ی‬‫تحل‬ ‫و‬ ‫شود‬‫ی‬‫ل‬‫گران‬‫ا‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫بازار‬‫ی‬‫ن‬‫پ‬ ‫اطالعات‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬ ‫دق‬‫ی‬‫ق‬‫تری‬‫م‬ ‫را‬‫ی‬‫توانند‬.‫دهند‬ ‫انجام‬ 3.2.‫جامعه‬ ‫و‬ ‫سیاست‬ ‫شاخص‬‫تری‬‫ن‬‫تحل‬ ‫کاربرد‬‫ی‬‫ل‬‫اح‬‫س‬ ‫عرصه‬ ‫در‬ ‫ساسات‬‫ی‬‫است‬‫به‬ ‫مربوط‬ ‫سال‬ ‫انتخابات‬2092‫آمر‬‫ی‬‫کا‬‫است‬‫انتخابات‬ ‫در‬ ‫البته‬ .2008‫تحق‬‫ی‬‫قات‬‫مشابه‬ ‫پا‬ ‫سطح‬ ‫در‬‫یی‬‫ن‬‫تری‬‫ت‬ .‫بود‬ ‫شده‬ ‫انجام‬‫ی‬‫م‬‫تبل‬‫ی‬‫غات‬‫ی‬‫اطالعات‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫اوباما‬ ‫شبکه‬‫های‬‫اجتماع‬‫ی‬،‫به‬‫خصوص‬‫تویی‬،‫تر‬‫رأ‬ ‫توانست‬‫ی‬‫ز‬ ‫افراد‬‫ی‬‫اد‬‫ی‬‫را‬‫ب‬‫ه‬‫دست‬ ‫از‬ ‫استفاده‬ ‫با‬ ،‫آورد‬‫برچسب‬ ‫تعداد‬‫هایی‬‫ا‬ ‫هر‬ ‫در‬ ‫که‬‫ی‬‫الت‬‫حاو‬‫ی‬ #TeamObama tonight‫م‬ ‫توانستند‬ ‫بود‬‫ی‬‫زان‬‫محبوب‬‫ی‬‫ت‬‫و‬‫ی‬‫ق‬ ‫در‬ ‫را‬‫ی‬‫اس‬‫با‬ ‫رق‬‫ی‬‫ب‬‫و‬‫ی‬‫آن‬ ،‫دهند‬ ‫نشان‬‫ها‬‫با‬‫استفاده‬‫از‬‫ای‬‫ن‬‫م‬ ‫اطالعات‬‫ی‬‫توانستند‬‫ا‬‫ی‬‫الت‬‫های‬ ‫به‬ ‫هدف‬‫تبل‬ ‫منظور‬‫ی‬‫غات‬‫ب‬‫ی‬‫ش‬‫تر‬‫تع‬ ‫را‬‫یی‬‫ن‬‫هم‬ ‫و‬ ‫کرده‬‫چنی‬‫ن‬‫مت‬‫ن‬‫سخنران‬‫ی‬‫و‬‫ی‬ ‫ا‬ ‫به‬ ‫توجه‬ ‫با‬ ‫را‬‫تنظ‬ ‫شهر‬ ‫آن‬ ‫قالب‬ ‫فکار‬‫ی‬‫م‬‫کنند‬‫شکل‬ ‫در‬ ،2‫بصری‬ ‫نمونه‬‫سازی‬ ‫است‬ ‫شده‬ ‫داده‬ ‫نمایش‬ ‫تحلیل‬ ‫این‬ ‫از‬ ‫حاصل‬[99,92]. ‫شکل‬2-‫م‬‫ی‬‫زان‬‫محبوب‬‫ی‬‫ت‬‫ا‬ ‫در‬ ‫اوباما‬‫ی‬‫الت‬‫ها‬‫ی‬‫استفاده‬ ‫با‬ ‫مختلف‬‫عقیده‬ ‫در‬ ‫کاوی‬‫تو‬‫یی‬‫تر‬‫انتخابات‬ ‫از‬ ‫قبل‬
  • 4. ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 4 ‫هندی‬ ‫پژوهشگران‬‫سال‬ ‫در‬2094‫حدود‬ ‫از‬ ‫استفاده‬ ‫با‬23‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫تو‬‫یی‬‫ت‬ ‫از‬96‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫شبکه‬ ،‫کاربر‬‫ا‬‫ی‬‫حدود‬ ‫با‬40‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫م‬ ‫که‬ ‫ساختند‬ ‫لبه‬‫ی‬‫توانست‬ ‫انتخابات‬ ‫هر‬ ‫برنده‬‫ی‬‫توج‬ ‫با‬ ‫را‬‫عقا‬ ‫به‬ ‫ه‬‫ی‬‫د‬‫نوشته‬‫های‬‫تو‬ ‫کاربران‬‫یی‬‫تر‬‫هند‬ ‫در‬ ‫پ‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬‫و‬ ،‫کند‬‫ی‬‫ژگ‬‫ی‬‫اصل‬‫ی‬‫س‬‫ی‬‫ستم‬‫آن‬‫ها‬‫بالدرنگ‬‫بودن‬‫تحلی‬‫ل‬‫آن‬‫ه‬‫ا‬‫لذا‬ ،‫بود‬ ‫م‬‫ی‬‫توانستند‬‫نت‬ ‫لحظه‬ ‫هر‬ ‫در‬‫ی‬‫جه‬‫به‬ ‫موجود‬ ‫اطالعات‬ ‫به‬ ‫را‬‫روزرسانی‬‫نما‬‫ی‬،‫ند‬‫در‬ ‫نها‬‫ی‬‫ت‬‫پ‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬‫آن‬‫ها‬‫از‬‫دو‬‫ماه‬‫قبل‬‫از‬‫انتخابات‬‫دقی‬ً‫ا‬‫ق‬‫نت‬ ‫با‬ ‫برابر‬‫ی‬‫جه‬‫ب‬‫از‬ ‫عد‬ .‫بود‬ ‫انتخابات‬ ‫اما‬‫تحل‬ ‫با‬ ‫توانستند‬ ‫محققان‬ ،‫جامعه‬ ‫بعد‬ ‫در‬‫ی‬‫ل‬‫کاربر‬ ‫توسط‬ ‫شده‬ ‫وارد‬ ‫متن‬ ‫د‬ ‫و‬‫ی‬‫گر‬‫شخص‬ ‫صفحه‬ ‫اطالعات‬‫ی‬‫و‬‫ی‬‫اجتماع‬ ‫شبکه‬ ‫در‬‫ی‬‫ف‬‫ی‬‫س‬،‫بوک‬‫م‬‫ی‬‫زان‬ ‫رضا‬‫ی‬‫ت‬‫و‬‫ی‬‫زندگ‬ ‫از‬‫ی‬‫م‬ ‫مجموع‬ ‫در‬ ‫و‬‫ی‬‫زان‬‫رضا‬‫ی‬‫ت‬‫ی‬‫ک‬‫تحل‬ ‫را‬ ‫جامعه‬‫ی‬‫ل‬‫کنند‬ [93]. 4.‫عقیده‬ ‫مراحل‬‫کاوی‬ ‫شکل‬ ‫در‬3‫مراحل‬‫قطبیت‬ ‫تعیین‬4 ‫توسط‬ ‫شده‬ ‫وارد‬ ‫متن‬‫کاربر‬‫داده‬ ‫نشان‬ ‫ا‬ .‫است‬ ‫شده‬‫ی‬‫ن‬‫کل‬ ‫اصول‬ ‫مراحل‬‫ی‬‫اجرا‬‫ی‬‫ی‬‫ک‬‫س‬‫ی‬‫ستم‬‫تحل‬‫ی‬‫ل‬‫گر‬‫یک‬ ‫قطبیت‬ ‫متن‬‫تشر‬ ‫با‬ ‫ادامه‬ ‫در‬ .‫است‬‫ی‬‫ح‬‫روش‬ ،‫گام‬ ‫هر‬ ‫عمکلرد‬‫های‬‫اجرا‬ ‫مختلف‬‫ی‬‫آن‬ ‫بررس‬ ‫مورد‬‫ی‬.‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫شکل‬3–‫مراحل‬‫تحلی‬‫ل‬‫احس‬‫اجتماع‬ ‫شبکه‬ ‫در‬ ‫کاربر‬ ‫اسات‬‫ی‬ 4.1.‫پیش‬‫داده‬ ‫پردازش‬‫ها‬ ‫ا‬ ‫در‬‫ی‬‫ن‬‫آماده‬ ‫مرحله‬ ‫دو‬ ‫در‬ ‫موردنظر‬ ‫متن‬ ،‫کاربرد‬ ‫برحسب‬ ‫گام‬‫سازی‬‫م‬‫ی‬ ،‫گردد‬‫نگارش‬ ‫عالئم‬ ‫و‬ ‫لغات‬ ‫براساس‬ ‫جمله‬ ‫ابتدا‬‫ی‬‫منقطع‬‫تقسی‬ ‫کننده‬‫م‬‫م‬‫ی‬‫شود‬ ‫برچسب‬ ‫سپس‬ ‫و‬‫گذاری‬‫دستور‬ ‫مشخصه‬‫ی‬‫م‬ ‫انجام‬ ‫کلمات‬‫ی‬.‫گردد‬ 4 Polarity ً‫ال‬‫معمو‬‫اول‬‫ی‬‫ن‬‫ب‬ ‫جمله‬ ‫شکست‬‫نگارش‬ ‫خاص‬ ‫عالئم‬ ‫راساس‬‫ی‬‫مانند‬ ».«(،«;»،«،»،»!«،«‫؟‬»،)»:«‫پذ‬ ‫صورت‬‫ی‬‫رفته‬‫تشک‬ ‫کلمات‬ ‫به‬ ‫جمله‬ ‫سپس‬ ‫و‬‫ی‬‫ل‬‫‏‬ ‫دهنده‬‫تقس‬‫ی‬‫م‬‫م‬‫ی‬‫‏‬‫گردد‬. ‫اما‬‫برچسب‬ ‫در‬‫‏‬‫گذاری‬‫برچسب‬ ‫انتساب‬ ‫عمل‬‫‏‬‫های‬‫واژگان‬‫ی‬‫و‬ ‫کلمات‬ ‫به‬ ‫نشانه‬‫‏‬‫های‬‫تشک‬‫ی‬‫ل‬‫م‬ ‫صورت‬ ‫متن‬‫ی‬‫‏‬‫پذی‬‫رد‬‫ا‬ ‫واقع‬ ‫در‬‫ی‬‫ن‬‫برچسب‬‫‏‬‫ها‬‫نقش‬ ‫کلمات‬‫در‬‫جمله‬‫را‬‫مشخص‬‫م‬‫ی‬‫‏‬‫سازند‬‫کل‬ ‫حالت‬ ‫در‬ .‫ی‬‫روش‬‫‏‬‫های‬ ‫برچسب‬‫‏‬‫گذاری‬‫تقس‬ ‫دسته‬ ‫دو‬ ‫به‬ ‫کلمات‬‫ی‬‫م‬‫م‬‫ی‬‫مجموعه‬ ‫اول‬ ‫دسته‬ .‫گردد‬ ‫روش‬‫‏‬‫های‬‫آمار‬‫ی‬‫ق‬ ‫دوم‬ ‫دسته‬ ‫و‬‫اعده‬‫روش‬ ‫در‬ .‫هستند‬ ‫محور‬‫‏‬‫های‬‫آمار‬‫ی‬‫ی‬‫ک‬ ‫احتمال‬ ‫مجموعه‬‫ی‬‫برچسب‬ ‫از‬‫‏‬‫ها‬‫برای‬‫ی‬‫ک‬‫م‬ ‫انتخاب‬ ‫کلمه‬‫ی‬‫براساس‬ ‫و‬ ‫گردد‬ ‫برچسب‬‫ها‬‫ی‬‫ضر‬ ‫مجاور‬‫ی‬‫ب‬‫صح‬ ‫احتمال‬‫ی‬‫ح‬‫ه‬ ‫بودن‬‫محاسبه‬ ‫برچسب‬ ‫ر‬ ‫م‬‫ی‬.‫گردد‬ ً‫ال‬‫معمو‬‫روش‬ ‫در‬‫‏‬‫های‬‫غ‬‫ی‬‫رآمار‬‫ی‬‫قوان‬ ‫از‬ ‫استفاده‬ ‫با‬ ،‫محور‬ ‫قاعده‬‫ی‬‫ن‬‫رفع‬ ‫به‬ ‫برچسب‬ ‫در‬ ‫ابهامات‬‫‏‬‫گذاری‬‫‏‬‫ها‬‫م‬ ‫پرداخته‬‫ی‬‫‏‬،‫شود‬‫ا‬ ‫مجموعه‬‫ی‬‫ن‬‫قوان‬‫ی‬‫ن‬‫ی‬‫ا‬‫به‬ ‫شده‬ ‫داده‬ ‫مدل‬ ‫به‬ ‫آموزش‬ ‫صورت‬‫‏‬‫اند‬‫ی‬‫ا‬‫به‬‫‏‬‫صورت‬‫دستی‬‫مع‬‫ی‬‫ن‬‫گرد‬‫ی‬‫ده‬.‫است‬ ‫س‬‫ی‬‫ستم‬‫‏‬‫های‬‫مخف‬ ‫مدل‬ ،‫محور‬ ‫حافظه‬‫ی‬‫مار‬‫تخم‬ ‫روش‬ ‫و‬ ‫کوف‬‫ی‬‫ن‬‫احتمال‬ ‫ب‬‫ی‬‫ش‬‫ی‬‫نه‬‫نمونه‬‫‏‬‫هایی‬‫روش‬ ‫از‬‫‏‬‫های‬‫برچسب‬‫‏‬‫گذاری‬‫برا‬ .‫هستند‬‫ی‬[ ‫در‬ ‫مثال‬94] ‫برچسب‬‫‏‬‫زنی‬‫فارس‬ ‫کلمات‬‫ی‬‫مخف‬ ‫مدل‬ ‫از‬ ‫استفاده‬ ‫با‬‫ی‬‫معرف‬ ‫مارکوف‬‫ی‬ ‫شده‬.‫است‬ ‫مقاله‬ ‫در‬[94]‫پیش‬‫از‬ ‫استفاده‬ ‫با‬ ‫توییتر‬ ‫متنی‬ ‫اطالعات‬ ‫پردازش‬‫چارچوب‬ ‫هدوپ‬0 ‫کاهش‬ ‫نگاشت‬ ‫و‬6 .‫است‬ ‫پذیرفته‬ ‫صورت‬ 4.2.‫ویژگی‬ ‫انتخاب‬ ‫نظرات‬‫ی‬‫در‬ ‫کاربران‬ ‫که‬‫ی‬‫ک‬‫اجتماع‬ ‫شبکه‬‫ی‬‫و‬‫ی‬‫ا‬‫در‬‫ی‬‫ک‬‫ا‬ ‫فروشگاه‬‫ی‬‫نترنت‬‫ی‬ ‫به‬ ‫راجع‬‫ی‬‫ک‬‫م‬ ‫محصول‬‫ی‬‫‏‬‫دهند‬‫منف‬ ،‫مثبت‬ ‫است‬ ‫ممکن‬‫ی‬‫و‬‫ی‬‫ا‬‫خنث‬‫ی‬.‫باشد‬ ‫ا‬‫ی‬‫ن‬‫قطب‬‫ی‬‫ت‬‫به‬‫ی‬‫ک‬‫و‬‫ی‬‫ژگ‬‫ی‬‫ی‬‫ا‬‫ج‬‫از‬ ‫نبه‬‫ی‬‫ک‬‫محصول‬‫ی‬‫ا‬‫نسبت‬ ‫موضوع‬ ‫م‬ ‫داده‬‫ی‬‫‏‬‫شود‬‫برا‬ .‫ی‬‫کاربر‬ ‫مثال‬‫ی‬‫اجتماع‬ ‫شبکه‬ ‫در‬‫ی‬‫م‬‫ی‬‫‏‬‫نوی‬‫سد‬"!‫دوستان‬ ‫گوش‬ ‫امروز‬‫ی‬‫موبا‬‫ی‬‫ل‬‫جد‬‫ی‬‫د‬‫خر‬‫ی‬‫دم‬‫ک‬‫ی‬‫ف‬‫ی‬‫ت‬‫نما‬ ‫صفحه‬‫ی‬‫ش‬‫فوق‬‫‏‬‫العاده‬‫‏‬‫ای‬‫دارد‬ ‫آنتن‬ ‫اما‬‫‏‬‫دهی‬‫ن‬ ‫جالب‬ ‫آن‬‫ی‬‫ست‬."‫ا‬ ‫در‬‫ی‬‫ن‬‫بحث‬ ‫موضوع‬ ‫مثال‬"‫موبا‬‫ی‬‫ل‬"‫و‬ ‫است‬ ‫و‬‫ی‬‫ژگ‬‫ی‬‫ی‬‫ا‬‫جنبه‬‫‏‬‫های‬‫ا‬‫ی‬‫ن‬‫موضوع‬"‫صف‬‫نما‬ ‫حه‬‫ی‬‫ش‬"‫و‬"‫آنتن‬‫‏‬‫دهی‬".‫است‬ ‫تکنیک‬ ‫از‬ ‫یکی‬‫روش‬ ،‫متن‬ ‫در‬ ‫ویژگی‬ ‫کشف‬ ‫در‬ ‫پرکاربرد‬ ‫های‬‫اطالعات‬ ‫متقابل‬7 ‫است‬‫روش‬ ‫از‬ ‫یکی‬ ‫که‬‫های‬‫در‬ ‫ویژگی‬ ‫کردن‬ ‫پیدا‬ ‫آماری‬‫جمله‬ ‫یا‬ ‫سند‬ 5 Hadoop 6 Map-Reduce 7 Mutual Information
  • 5. ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 0 ‫کلمه‬ ‫هر‬ ‫برای‬ ،‫است‬x‫سند‬ ‫هر‬ ‫در‬y‫بیش‬ ‫و‬ ‫شده‬ ‫محاسبه‬ ‫مقدار‬‫یا‬ ‫ترین‬ ‫اطالعات‬ ‫عنوان‬ ‫به‬ ،‫مقادیر‬ ‫آن‬ ‫میانگین‬‫باالترین‬ ‫و‬ ‫شده‬ ‫منظور‬ ‫کلمه‬ ‫آن‬ ‫مقابل‬ ‫آن‬‫می‬ ‫انتخاب‬ ‫ویژگی‬ ‫عنوان‬ ‫به‬ ‫ها‬‫چنان‬ ‫گردد‬‫چه‬x‫و‬y،‫باشند‬ ‫مستقل‬ ‫هم‬ ‫از‬ ‫ضابطه‬ ‫مقدار‬(9)‫می‬ ‫صفر‬ ‫را‬‫کند‬. ‫روش‬ ‫البته‬‫دیگری‬ ‫زیاد‬ ‫های‬‫همانند‬ ‫متعدد‬ ‫مقاالت‬ ‫در‬‫نما‬‫ی‬‫ه‬‫ساز‬‫ی‬‫معنا‬‫یی‬ ‫پنهان‬ 8 [90]‫مارکوف‬ ‫مخفی‬ ‫مدل‬ ،[96]،‫تخص‬‫ی‬‫ص‬‫د‬‫ی‬‫ر‬‫ی‬‫کله‬‫پنهان‬ 9 [97]، ‫بیش‬‫آنتروپی‬ ‫ترین‬... ‫و‬.‫است‬ ‫شده‬ ‫معرفی‬ 4.3.‫طبقه‬‫بندی‬‫کننده‬10 ‫اصل‬ ‫پردازش‬‫ی‬‫تع‬ ‫جهت‬‫یی‬‫ن‬‫قطب‬‫ی‬‫ت‬‫ی‬‫ک‬‫جمله‬‫ی‬‫ا‬‫ی‬‫ک‬‫ا‬ ‫در‬ ‫سند‬‫ی‬‫ن‬‫مرحله‬ ‫م‬ ‫صورت‬‫ی‬‫پذی‬،‫رد‬‫اصل‬ ‫هدف‬‫ی‬‫ا‬‫ی‬‫ن‬‫طبقه‬ ‫بخش‬‫بند‬‫ی‬‫ی‬‫ک‬‫جمله‬‫ی‬‫ا‬‫ی‬‫ک‬‫سند‬ ‫بر‬‫قطب‬ ‫اساس‬‫ی‬‫ت‬‫حل‬ ‫راه‬ .‫است‬ ‫آن‬‫کل‬ ‫دسته‬ ‫دو‬ ‫به‬ ‫ها‬‫ی‬‫مبتن‬‫ی‬‫بر‬‫ی‬‫ادگ‬‫ی‬‫ر‬‫ی‬ ‫ماش‬‫ی‬‫ن‬‫واژه‬ ‫و‬‫نامه‬‫تقسی‬‫م‬‫م‬‫ی‬‫شود‬‫دق‬ ‫ابزارها‬ .‫ی‬ً‫ا‬‫ق‬‫عمل‬ ‫همان‬‫ی‬‫م‬ ‫انجام‬ ‫را‬‫ی‬‫دهند‬ ‫طبقه‬ ‫که‬‫بند‬‫ی‬‫کننده‬‫ها‬‫کاربردها‬ ‫در‬‫ی‬‫سنت‬‫ی‬‫متن‬‫کاوی‬‫آن‬ ‫در‬ ،‫دارند‬‫جا‬‫ی‬‫ک‬ ‫طبقه‬ ‫از‬ ‫پس‬ ‫سند‬‫ب‬‫ندی‬‫م‬‫ی‬‫توانست‬‫دسته‬ ‫به‬‫های‬‫س‬ ‫همانند‬ ‫مختلف‬‫ی‬‫اس‬‫ی‬، ‫ورزشی‬،‫علم‬‫ی‬‫طبقه‬ ‫در‬ ‫اما‬ ‫گردد‬ ‫اضافه‬ ... ‫و‬‫بند‬‫ی‬‫کننده‬‫عقاید‬‫ا‬ ً‫ال‬‫معمو‬‫ی‬‫ن‬ ‫دسته‬‫ها‬‫به‬‫سه‬‫گروه‬،‫مثبت‬‫منفی‬‫خنث‬ ‫و‬‫ی‬‫تبد‬‫ی‬‫ل‬‫م‬‫ی‬.‫گردد‬ ‫در‬‫طبقه‬‫‏‬‫بندی‬‫مبتن‬‫ی‬‫پ‬ ‫از‬ ‫که‬ ‫واژگان‬ ‫بر‬‫ی‬‫کره‬‫‏‬‫های‬99 ‫و‬ ‫مختلف‬‫ی‬‫ا‬‫واژه‬‫نامه‬92 ‫م‬ ‫استفاده‬ ‫خاص‬‫ی‬‫‏‬‫شود‬،‫کل‬ ‫روال‬‫ی‬‫ا‬ ‫به‬‫ی‬‫ن‬‫برا‬ ‫که‬ ‫است‬ ‫شکل‬‫ی‬‫در‬ ‫کلمه‬ ‫هر‬ ‫ی‬‫ک‬‫اسام‬ ‫مانند‬ ‫جمله‬‫ی‬،‫افعال‬،‫صفات‬‫و‬‫قی‬‫ود‬‫واژگان‬ ‫شبکه‬ ‫در‬ ،‫موجود‬ ‫احساس‬‫ی‬‫م‬ ‫صورت‬ ‫جستجو‬‫ی‬‫گ‬‫ی‬‫رد‬‫صورت‬ ‫در‬ ‫و‬‫ی‬‫موجود‬ ‫شبکه‬ ‫در‬ ‫واژه‬ ‫آن‬ ‫که‬ ،‫باشد‬‫احساس‬ ‫برچسب‬‫ی‬‫م‬ ‫استخراج‬ ‫آن‬‫ی‬‫‏‬،‫شود‬‫قطب‬ ‫با‬ ‫متناسب‬ ‫واژه‬ ‫هر‬‫ی‬‫ت‬‫ی‬‫که‬ ‫شبکه‬ ‫از‬‫وزن‬ ،‫شده‬ ‫استخراج‬ ‫واژگان‬‫ی‬‫م‬‫ی‬‫گ‬‫ی‬،‫رد‬‫برا‬‫ی‬‫جمله‬ ‫هر‬‫‏‬‫ای‬‫در‬ ‫کاربر‬ ‫که‬ ‫اجتماع‬ ‫شبکه‬‫ی‬‫م‬‫ی‬‫نو‬‫ی‬‫سد‬‫وزن‬ ‫مجموع‬‫‏‬‫ها‬‫با‬‫توجه‬‫به‬‫قطبی‬‫ت‬‫محاسبه‬ ‫آن‬ ‫م‬‫ی‬‫‏‬،‫گردد‬‫عدد‬ ‫اگر‬‫ی‬‫بزرگ‬‫‏‬‫تر‬‫از‬‫صفر‬‫باشد‬‫آن‬‫جمله‬‫قطبی‬‫ت‬‫م‬ ‫مثبت‬‫ی‬‫‏‬‫گی‬‫رد‬‫و‬ ‫در‬‫غ‬‫ی‬‫ر‬‫ا‬‫ی‬‫ن‬‫‏‬‫صورت‬‫منف‬ ‫جمله‬‫ی‬‫م‬ ‫گرفته‬ ‫نظر‬ ‫در‬‫ی‬‫‏‬‫شود‬. ‫وجود‬‫ی‬‫ک‬‫واژه‬‫‏‬‫نام‬‫ه‬‫در‬‫ی‬‫ک‬‫س‬‫ی‬‫ستم‬‫تحل‬‫ی‬‫ل‬‫ضرور‬ ‫احساسات‬‫ی‬‫اما‬ ‫است‬ ‫کاف‬‫ی‬‫ن‬‫ی‬‫ست‬‫م‬ ً‫ا‬‫حتم‬ ‫و‬‫ی‬‫‏‬‫بای‬‫ست‬‫د‬ ‫کنار‬ ‫در‬‫ی‬‫گر‬‫روش‬‫‏‬‫های‬‫تکم‬‫ی‬‫ل‬‫به‬ ‫کننده‬‫کار‬ 8 Latent Semantic Indexing (LSI) 9 Latent Dirichlet Allocation (LDA) 10 Classifier 11 Corpus 12 Dictionary .‫شوند‬ ‫برده‬‫در‬‫شکل‬3‫روش‬ ‫انواع‬ ‫شده‬ ‫تالش‬‫‏‬‫های‬‫را‬‫ی‬‫ج‬‫ی‬‫طبقه‬ ‫در‬ ‫که‬‫بند‬‫ی‬ ‫عق‬‫ی‬‫ده‬‫نما‬ ‫دارد‬ ‫کاربرد‬ ‫متن‬ ‫در‬‫ی‬‫ش‬[ ‫شود‬ ‫داده‬91.] ‫شکل‬4-‫روش‬ ‫انواع‬‫ها‬‫ی‬‫طبقه‬‫بند‬‫ی‬ ‫ب‬‫یش‬‫تکنیک‬ ‫تر‬‫شکل‬ ‫های‬4‫پیاده‬ ‫توانایی‬‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫سازی‬ ‫کالن‬‫داده‬93 ‫مقیاس‬ ‫ابزارها‬ ‫این‬ ‫از‬ ‫استفاده‬ ‫دارند‬ ‫را‬‫پردازش‬ ‫سرعت‬ ‫و‬ ‫پذیری‬ ‫داده‬ ‫حجم‬ ‫در‬‫چشم‬ ‫شکل‬ ‫به‬ ‫را‬ ‫باال‬ ‫های‬‫می‬ ‫افزایش‬ ‫گیری‬.‫دهد‬ ‫در‬[98]‫فایل‬ ‫سیستم‬ ‫و‬ ‫هدوپ‬ ‫از‬ ‫استفاده‬ ‫با‬HDFS 94 ‫تکنیک‬ ،Naïve Bayes‫ع‬ ‫به‬‫طبقه‬ ‫نوان‬‫بندی‬‫سینما‬ ‫و‬ ‫فیلم‬ ‫مورد‬ ‫در‬ ‫کاربران‬ ‫نظرات‬ ‫کننده‬‫وب‬ ‫پیاده‬ ،‫آمازون‬ ‫سایت‬‫کتابخانه‬ ‫از‬ ‫استفاده‬ ‫بدون‬ ‫نویسندگان‬ .‫است‬ ‫شده‬ ‫سازی‬- ‫پیش‬ ‫های‬‫(همانند‬ ‫هدوپ‬ ‫فرض‬Mahout‫ماژول‬ ،)‫را‬ ‫خود‬ ‫نیاز‬ ‫مورد‬ ‫های‬ .‫نمودند‬ ‫طراحی‬ ‫مقیاس‬ ‫داد‬ ‫نشان‬ ‫نتایج‬‫طبقه‬ ‫پذیری‬‫بندی‬‫کننده‬NB‫بدون‬ ‫حتی‬‫داده‬ ‫پایگاه‬ ‫به‬‫می‬ ‫پیدا‬ ‫افزایش‬ ‫راحتی‬.‫کند‬ ‫دق‬‫حدود‬ ‫بررسی‬ ‫مورد‬ ‫حاالت‬ ‫تمامی‬ ‫در‬ ‫متوسط‬ ‫ت‬82‫اما‬ ‫بوده‬ ‫درصد‬ ‫هدوپ‬ ‫چارچوب‬ ‫از‬ ‫که‬ ‫مقاالتی‬ ‫دیگر‬ ‫همانند‬‫نموده‬ ‫استفاده‬‫صورت‬ ‫در‬ ،‫اند‬ ‫پیدا‬ ‫افزایش‬ ‫زیادی‬ ‫مقدار‬ ‫تا‬ ‫پردازش‬ ‫سرعت‬ ،‫ورودی‬ ‫اطالعات‬ ‫حجم‬ ‫افزایش‬ .‫کند‬ ‫می‬ ‫جدول‬ ‫در‬9‫ز‬ ‫مرتبه‬‫هر‬ ‫به‬ ‫نسبت‬ ‫پردازش‬ ‫مانی‬90‫بازبینی‬ ‫متن‬ ‫هزار‬ ‫که‬ ‫حالت‬ ‫اولین‬ ‫در‬ .‫است‬ ‫شده‬ ‫داده‬ ‫نمایش‬ ‫کاربران‬2‫قرار‬ ‫آن‬ ‫در‬ ‫بازبینی‬ ‫هزار‬ ‫داده‬ ‫مقدار‬ ‫زیرا‬ ‫ندارد‬ ‫مناسبی‬ ‫زمانی‬ ‫مرتبه‬ ‫سازی‬ ‫موازی‬ ‫است‬ ‫مشخص‬ ،‫دارد‬ ‫بالک‬ ‫هر‬ ‫حجم‬ ‫از‬ ‫ورودی‬HDFS‫کم‬‫به‬ ‫نزدیک‬ ‫و‬ ‫حجم‬ ‫افزایش‬ ‫با‬ ‫است‬ ‫تر‬ ‫بهینه‬ ‫مقدار‬HDFS‫چشم‬ ‫بهبود‬ ‫زمانی‬ ‫مرتبه‬‫می‬ ‫پیدا‬ ‫گیری‬‫کند‬. 13 Big data 14 Hadoop Distributed File System (9)
  • 6. ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 6 ‫جدول‬9–‫هر‬ )‫(ثانیه‬ ‫پردازش‬ ‫زمان‬9000‫کاربران‬ ‫بازبینی‬ ‫متن‬ ‫ورودی‬ ‫متن‬ ‫تعداد‬ ‫حجم‬ )‫(هزار‬ 220200400600800 / ‫ثانیه‬10‫متن‬ ‫هزار‬9/40090/4807/624/447/399/3 ‫ورودی‬ ‫متن‬ ‫تعداد‬ ‫حجم‬ )‫(هزار‬ 900092009400960098002000 / ‫ثانیه‬10‫متن‬ ‫هزار‬88/277/247/24/237/233/2 5.‫عقیده‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫کاربرد‬‫کاوی‬ ‫عظیم‬ ‫حجم‬ ‫پردازش‬ ‫توانایی‬ ‫و‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫شدن‬ ‫گسترده‬ ‫از‬ ‫بعد‬ ‫اطالعات‬‫سازمان‬ ‫دیگر‬‫ها‬‫مجبور‬‫ن‬‫از‬ ‫بودند‬‫ی‬‫ک‬‫را‬ ‫َر‬‫ب‬‫ا‬‫ی‬‫انه‬‫و‬‫ی‬‫ا‬‫داده‬ ‫انباره‬‫ا‬‫ی‬ ‫کند‬ ‫استفاده‬‫واقع‬ ‫در‬‫پا‬ ‫ضعف‬‫ی‬‫گاه‬‫داده‬‫ها‬‫ی‬‫رابطه‬‫ا‬‫ی‬‫نگه‬ ‫در‬‫دار‬‫ی‬‫تجز‬ ‫و‬‫ی‬‫ه‬‫و‬ ‫تحل‬‫ی‬‫ل‬‫حجم‬‫عظ‬‫ی‬‫م‬‫ی‬‫داده‬ ‫از‬‫ها‬‫ی‬‫ن‬‫ی‬‫مه‬‫ساختار‬‫ی‬‫نما‬ ‫ساختار‬ ‫بدون‬ ‫و‬‫ی‬‫ان‬‫گشت‬ ‫کردن‬ ‫مطرح‬ ‫با‬ ‫دانشمندان‬ ‫و‬‫مفهوم‬‫جد‬‫ی‬‫د‬‫ی‬‫نام‬ ‫به‬NoSQL 90 ‫به‬ ‫اقدام‬ ‫جد‬ ‫نسل‬ ‫ساخت‬‫ی‬‫د‬‫ی‬‫پا‬ ‫از‬‫ی‬‫گاه‬‫ها‬‫ی‬‫داده‬‫ا‬‫ی‬‫م‬ ‫که‬‫ی‬‫تواند‬‫عظ‬ ‫حجم‬‫ی‬‫م‬‫ی‬‫از‬ ‫را‬ ‫اطالعات‬‫زیر‬ ‫یک‬ ‫در‬‫سا‬‫ابری‬ ‫خت‬‫نگ‬‫هد‬‫ار‬‫ی‬‫نمودند‬ ،‫کند‬ ‫پردازش‬ ‫و‬[91]. ‫بیش‬‫الگوریتم‬ ‫تر‬‫طبقه‬ ‫های‬‫می‬ ‫بندی‬‫با‬ ‫و‬ ‫موازی‬ ‫شکل‬ ‫به‬ ‫تواند‬‫از‬ ‫استفاده‬ ‫پیاده‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫شود‬ ‫سازی‬[98,20]. ‫کال‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫مزایای‬ ‫از‬ ‫مورد‬ ‫چند‬ ‫به‬ ‫فقط‬ ‫ادامه‬ ‫در‬‫در‬ ‫داده‬ ‫ن‬ ‫عقیده‬.‫شد‬ ‫خواهد‬ ‫اشاره‬ ‫کاوی‬ ‫پ‬ ‫مراحل‬ ‫از‬ ‫یک‬ ‫هر‬‫ها‬ ‫داده‬ ‫پردازش‬ ‫و‬ ‫پردازش‬ ‫یش‬‫به‬ ‫تواند‬ ‫می‬ ‫مرتبط‬ ‫ابزارهای‬ ‫روی‬ ‫بر‬ ‫موازی‬ ‫شکل‬‫از‬ ‫استفاده‬ ‫همانند‬‫چارچوب‬ ‫نگاشت‬–‫شود‬ ‫سازی‬ ‫پیاده‬ ‫کاهش‬‫مثال‬ ‫برای‬ ،‫در‬[94]‫از‬ ‫استفاده‬ ‫با‬ ‫داده‬ ‫در‬ ،‫نمودند‬ ‫ثابت‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫سرعت‬ ‫حجیم‬ ‫های‬ ‫در‬ ‫دستورات‬ ‫اجرای‬‫هدوپ‬‫از‬ ‫بیشتر‬‫مدل‬ ‫دیگر‬‫مرسوم‬ ‫های‬‫است‬ ‫شکل‬ ‫(در‬0). ‫شکل‬5-‫دوحالت‬ ‫در‬ ‫کلمه‬ ‫شمارش‬ ‫زمان‬ ‫میزان‬‫بررسی‬ ‫مورد‬ 15 Not Only SQL ‫پیاده‬ ‫قصد‬ ‫شرکت‬ ‫یک‬ ‫اگر‬‫عقیده‬ ‫سیستم‬ ‫یک‬ ‫اجرایی‬ ‫و‬ ‫سازی‬‫کاوی‬ ‫داشته‬‫از‬ ‫استفاده‬ ‫با‬ ‫اما‬ ‫کند‬ ‫صرف‬ ‫باید‬ ‫را‬ ‫زیادی‬ ‫هزینه‬ ‫باشد‬ ‫می‬ ‫ابر‬ ‫بستر‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫هز‬ ‫تواند‬‫حد‬ ‫تا‬ ‫را‬ ‫خود‬ ‫ینه‬ ‫شرکت‬ ‫از‬ ‫بسیاری‬ ،‫دهد‬ ‫کاهش‬ ‫زیادی‬‫خدمات‬ ‫این‬ ‫دارند‬ ‫وجود‬ ‫ها‬ ‫نرم‬ ‫درقالب‬ ‫را‬‫اف‬‫سرویس‬ ‫عنوان‬ ‫به‬ ‫زار‬96 ‫می‬ ‫ارایه‬.‫دهند‬ ‫داده‬ ‫از‬ ‫حجمی‬ ‫هر‬ ‫اندازه‬ ‫به‬ ‫پذیری‬ ‫مقیاس‬ ‫داده‬ ‫پردازش‬ ‫توانایی‬‫ه‬‫لحظه‬ ‫خروجی‬ ‫ایجاد‬ ‫و‬ ‫بالدرنگ‬ ‫صورت‬ ‫به‬ ‫ا‬ ً‫ا‬‫خصوص‬ ‫توانایی‬ ‫این‬ ، ‫ای‬‫زمان‬ ‫یک‬ ‫به‬ ‫وابسته‬ ‫که‬ ‫کاربردهایی‬ ‫در‬ ‫است‬ ‫کاربردی‬ ‫بسیار‬ ،‫نتیجه‬ ‫یک‬ ‫بینی‬ ‫پیش‬ ‫مانند‬ ‫است‬ ‫خاص‬[29]. 6.‫نتیجه‬‫آینده‬ ‫کارهای‬ ‫و‬ ‫گیری‬ ‫ا‬ ‫در‬‫ی‬‫ن‬‫آخر‬ ‫مقاله‬‫ی‬‫ن‬‫و‬ ‫دستاوردها‬‫پژوهش‬‫ها‬‫در‬‫حوزه‬‫تحلی‬‫ل‬‫احساسات‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫با‬‫توجه‬ ‫با‬ ‫و‬ ‫گرفت‬ ‫قرار‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫مورد‬ ‫ابزارها‬ ‫این‬ ‫از‬ ‫استفاده‬ ،‫شد‬ ‫مشخص‬ ‫بررسی‬ ‫مورد‬ ‫مقاالت‬ ‫از‬ ‫حاصله‬ ‫نتایج‬ ‫به‬ ‫داده‬ ‫حجم‬ ‫که‬ ‫است‬ ‫کاربردی‬ ‫و‬ ‫بهینه‬ ً‫ال‬‫کام‬ ‫صورتی‬ ‫در‬‫و‬ ‫باشد‬ ‫زیاد‬ ‫بسیار‬ ‫ها‬ ‫ابزارها‬ ‫دیگر‬ ‫به‬ ‫نسبت‬ ‫نتایج‬ ‫کم‬ ‫داده‬ ‫حجم‬ ‫با‬ ‫محاسبات‬ ‫انجام‬ ‫حالت‬ ‫این‬ ‫در‬ ‫ضعیف‬‫است‬ ‫تر‬. ‫به‬‫زمینه‬ ‫عنوان‬‫بیش‬ ‫پژوهش‬ ‫جای‬ ‫زیر‬ ‫عناوین‬ ‫مناسب‬ ‫تحقیقاتی‬ ‫های‬‫تری‬ .‫داشت‬ ‫خواهد‬ ‫حوزه‬ ‫این‬ ‫در‬ ‫فعاالن‬ ‫توسط‬ ‫آینده‬ ‫در‬ ‫کاربرد‬ ‫و‬ ‫گسترش‬ ‫با‬‫ی‬‫‏‬‫تر‬‫ابزارها‬ ‫شدن‬‫ی‬‫مد‬‫ی‬‫ر‬‫ی‬‫ت‬‫کالن‬‫داده‬‫دن‬ ‫در‬‫ی‬،‫ا‬ ‫م‬‫ی‬‫‏‬‫توان‬‫بس‬‫ی‬‫ار‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫تشخ‬‫ی‬‫ص‬‫احساسات‬‫عقاید‬ ‫و‬‫زبان‬ ‫در‬ ‫فارس‬‫ی‬‫را‬‫از‬ ‫استفاده‬ ‫با‬‫ابزار‬‫ها‬‫ی‬‫مانند‬ ‫آن‬ ‫خاص‬‫هدوپ‬ ‫چارچوب‬ ‫پیاده‬‫سازی‬.‫نمود‬ ‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫آمار‬‫ی‬‫برا‬‫ی‬‫مدل‬‫‏‬‫سازی‬‫مدل‬ ‫از‬ ‫استفاده‬ ‫کلمات‬ n-gram‫م‬ .‫است‬‫ی‬‫‏‬‫توان‬‫برا‬‫ی‬‫مق‬ ‫بردن‬ ‫باال‬‫ی‬‫اس‬‫‏‬‫پذی‬‫ر‬‫ی‬‫اجرا‬ ‫و‬‫ی‬ ‫مواز‬‫ی‬،‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫آن‬‫نگاشت‬ ‫چارچوب‬ ‫در‬ ‫را‬-‫کاهش‬ ‫پ‬‫ی‬‫اده‬‫‏‬‫سازی‬‫نمود‬[22]. ‫م‬‫ی‬‫‏‬‫توان‬‫تحق‬ ‫با‬‫ی‬‫ق‬‫رو‬ ‫بر‬‫ی‬‫داده‬ ‫ساختار‬‫‏‬‫های‬‫مبتن‬‫ی‬‫واژه‬ ‫بر‬‫‏‬،‫نامه‬‫زمان‬ ‫جستجو‬‫در‬‫آن‬‫را‬‫کاهش‬‫داد‬‫ی‬‫ک‬‫ی‬‫ا‬ ‫از‬‫ی‬‫ن‬‫راه‬‫‏‬‫کارها‬‫می‬‫‏‬‫تواند‬‫پ‬‫ی‬‫اده‬‫‏‬ ‫سازی‬‫پا‬ ‫در‬‫ی‬‫گاه‬‫داده‬‫‏‬‫های‬NoSql.‫باشد‬ ‫سیستم‬ ‫یک‬ ‫در‬ ‫پردازش‬ ‫از‬ ‫بعد‬ ‫اطالعات‬ ‫سازی‬ ‫بصری‬ ‫چگونگی‬ ‫چ‬ ‫همواره‬ ‫داده‬ ‫کالن‬‫بیش‬ ‫پژوهش‬ ‫جای‬ ‫و‬ ‫بوده‬ ‫الشی‬.‫دارد‬ ‫تری‬ 16 Software as a Service
  • 7. ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 7 ‫نگاشت‬ ‫چارچوب‬ ‫در‬-‫در‬ ‫الگوریتم‬ ‫یک‬ ‫که‬ ‫زمانی‬ ‫کاهش‬‫محیط‬ ‫می‬ ‫اجرا‬ ‫ابری‬‫گره‬ ‫بین‬ ‫را‬ ‫کار‬ ‫دارد‬ ‫وظیفه‬ ‫نگاشت‬ ‫تابع‬ ‫شود‬‫های‬ ‫بخش‬ ‫به‬ ‫کار‬ ‫تقسیم‬ .‫کند‬ ‫تقسیم‬ ‫کارگر‬‫و‬ ‫آسان‬ ‫همیشه‬ ‫مساوی‬ ‫های‬ ‫هر‬ ،‫باشد‬ ‫قواعد‬ ‫استخراج‬ ‫هدف‬ ‫اگر‬ ‫مثال‬ ‫عنوان‬ ‫به‬ .‫نیست‬ ‫راحت‬ ‫بیش‬ ‫تقسیمات‬ ‫تعداد‬ ‫چه‬‫مشکل‬ ‫قاعده‬ ‫استخراج‬ ‫شود‬ ‫تر‬‫خواهد‬ ‫تر‬ ‫نگاشت‬ ‫از‬ ‫مناسبی‬ ‫تعداد‬ ‫تعیین‬ ‫بنابراین‬ .‫بود‬‫گره‬ ‫تعداد‬ ‫یا‬ ‫ها‬‫یکی‬ ‫ها‬ ‫زمینه‬ ‫از‬‫می‬ ‫تحقیقاتی‬ ‫های‬.‫باشد‬ ‫تواند‬ ‫منابع‬ [1] Statista. Facebook number of monthly active users worldwide 2015; Available from: http://www.statista.com/statistics/264810/number-of-monthly- active-facebook-users-worldwide/. [2] GEOFF. Just One Minute On Facebook JUNE 11, 2014; Available from: http//:wersm.com/just-one-minute-on- facebook-infographic/. [3] Adedoyin-Olowe, M.M.G., Mohamed; Stahl, Frederic, A Survey of Data Mining Techniques for Social Media Analysis. eprint arXiv, 2014. 1312.4617. [4] Liu, B. and L. Zhang, A Survey of Opinion Mining and Sentiment Analysis, in Mining Text Data, C.C. Aggarwal and C. Zhai, Editors. 2012, Springer US. p. 415-463. [5] Carbonell, J.G., Subjective Understanding: Computer Models of Belief Systems, in PhD thesis. 1979. [6] Nasukawa, T. and J. Yi, Sentiment analysis‫:‏‬capturing favorability using natural language processing, in Proceedings of the 2nd international conference on Knowledge capture. 2003, ACM: Sanibel Island, FL, USA. p. 70-77. [7] Dave, K., S. Lawrence, and D.M. Pennock, Mining the peanut gallery: opinion extraction and semantic classification of product reviews, in Proceedings of the 12th international conference on World Wide Web. 2003, ACM: Budapest, Hungary. p. 519-528. [8] Mohammad Ehsan Basiri* , A.R.n., Nasser Ghassem-Aghaee A Framework for Sentiment Analysis in Persian. Open Transactions on Information Processing, 2014. 1(3): p. 1-14. [9] Kherwa, P., et al. An approach towards comprehensive sentimental data analysis and opinion mining. in Advance Computing Conference (IACC), 2014 IEEE International ‫.‏‬4102. [01]‫‏‬،‫محمدی‬ ‫مجید‬ ‫و‬ ‫نفس‬ ‫نیک‬ ‫اکبر‬ ‫علی‬ ‫سمیه؛‬ ،‫زرندی‬ ‫برهانی‬9312‫نقد‬ ‫در‬ ‫کاوی‬ ‫عقیده‬ ، ،‫احساسی‬ ‫واژگان‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫کاال‬‫کنفرا‬ ‫دومین‬‫سیستم‬ ‫و‬ ‫صنایع‬ ‫مهندسی‬ ‫ملی‬ ‫نس‬ ،‫صنایع‬ ‫مهندسی‬ ‫گروه‬ ،‫آباد‬ ‫نجف‬ ‫واحد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،‫آباد‬ ‫نجف‬ ،‫ها‬ http://www.civilica.com/Paper-NIESC02-NIESC02_082.html‫‏‬ [11] Lewis, R. US Election 2012: Twitter is big winner as Obama is re- elected for second term. Wed, Nov 7, 2012 ‫‏‏‬[ cited 2015; Available from: https://uk.news.yahoo.com/us-election-2012--twitter-is-big- winner-as-obama-is-re-elected-for-second-term- 07112012.html#3DCuuBb. [12] S. Chandrasekar, E.C., and A. Ginet, Predicting the US Presidential Election using Twitter data, in CS 229 Machine Learning Project report. 2012: Stanford University. [13] Collins, S., et al., Are You Satisfied with Life?: Predicting Satisfaction with Life from Facebook, in Social Computing, Behavioral-Cultural Modeling, and Prediction, N. Agarwal, K. Xu, and N. Osgood, Editors. 2015, Springer International Publishing. p. 24-33. [14] Amalarethinam, V.J.N.a.D.I.G., Parallel Implementation of Big Data Pre-Processing Algorithms for Sentiment Analysis of Social Networking Data. Intern. J. Fuzzy Mathematical Archive, 2015. 6(2): p. 149-159. [15] Poshyvanyk, D., et al. Combining Probabilistic Ranking and Latent Semantic Indexing for Feature Identification. in Program Comprehension, 2006. ICPC 2006. 14th IEEE International Conference on. 2006. [16] Rustamov, S., E. Mustafayev, and M.A. Clements. Sentiment analysis using Neuro-Fuzzy and Hidden Markov models of text. in Southeastcon, 2013 Proceedings of IEEE. 2013. [17] Shams, M., A. Shakery, and H. Faili. A non-parametric LDA- based induction method for sentiment analysis. in Artificial Intelligence and Signal Processing (AISP), 2012 16th CSI International Symposium on. 2012. [18] Bingwei, L., et al. Scalable sentiment classification for Big Data analysis using Naïve Bayes Classifier. in Big Data, 2013‫‏‬ IEEE International Conference on. 2013. [19] ،‫خادمی‬ ‫مریم‬ ‫و‬ ‫حامد‬ ،‫وامرزانی‬ ‫عزیزی‬9313‫های‬ ‫چالش‬ ‫و‬ ‫کاربردها‬ ،‫داده‬ ‫کالن‬ ، ،‫آن‬ ‫مرکز‬ ،‫تهران‬ ،‫پایه‬ ‫و‬ ‫مهندسی‬ ‫علوم‬ ‫در‬ ‫نوین‬ ‫دستاوردهای‬ ‫الکترونیکی‬ ‫ملی‬ ‫همایش‬ ،‫کاو‬ ‫زمین‬ ‫پژوهشهای‬‫‏‬ http://www.civilica.com/Paper-AEBSCONF01- AEBSCONF01_114.html [20] Li, B. and K.C.C. Chan. A Fuzzy Logic Approach for Opinion Mining on Large Scale Twitter Data. in Utility and Cloud Computing (UCC), 2014 IEEE/ACM 7th International Conference on. 2014. [21] Rahnama, A.H.A., Distributed Real-Time Sentiment Analysis for Big Data Social Streams. 2014. [22] Allam, T.M., A.A. Sallam, and H.M. Abdullkader. Managed N- gram language model based on Hadoop framework and a Hbase tables. in Informatics and Systems (INFOS), 2014 9th International Conference on. 2014.