Contenu connexe Similaire à 社交媒體研究與鉅量資料分析 Similaire à 社交媒體研究與鉅量資料分析 (20) 社交媒體研究與鉅量資料分析2. 演講架構
• 社交媒體研究
– Social networking sites
– Mobile communities
• 鉅量資料分析
– What is big data?
– Computational turn
2
4. What is social media?
• 泛指基於網際網路架構,促進
社會互動的媒介,如
Facebook、Twitter、Plurk,
做為公眾集體連繫與交換訊息
的平台,又稱社交網絡服務
(Social Networking Service,
簡稱SNS);
• Flickr、Youtube等相片、影
音分享軟體,及wiki, tag等多
人共筆、彙整群眾智慧的軟體
或技術也算在內。
• http://en.wikipedia.org/wiki/Soci
al_media
2015/1/26
5. What is Big Data?
• Google在 2014 年執行數以兆計的搜尋工作。
• 如果一年就像一幅拼圖,這些搜尋字詞會拼湊出
什麼景色呢?
• Google - Year in Search 2014
• https://www.google.com.tw/trends
5
7. 社交媒體具有雙重連結
• 人的連結:
1) 從線下社群到線上社群: 如:Facebook
2) 延伸連結: 如:朋友的朋友
3) 平台推薦連結: 使用者可能感興趣的人
4) 追蹤名人連結
• 平台(技術)的連結:
1) 與其他平台連結: 如:Youtube, Flickr
2) 與內容網站連結: 如:新聞網站
3) 與其他應用程式連結: 如: 遊戲
4) 其他網絡與SNS平台連結: 如: 使用FB帳號登入、直
接分享到FB
2015/1/26
9. Twitter大事記
Twitter 7年來的界面設計之改變
2006 Twitter誕生
2007 使用者自創#hashtag, RT
2009 飛機迫降哈德遜河,目擊者用Twitter轉播現場狀況
2009 歐普拉等名人跟著使用Twitter
2011 阿拉伯之春—推翻埃及穆巴拉克政權
2011 日本311地震海嘯
2012 倫敦奧運官方用Twitter直播賽事
2012 歐巴馬連任美國總統(史上最多Retweet)
2014 奧斯卡主持人艾倫與明星自拍(史上最快達百萬RT)
https://2014.twitter.com/perspectives
10. Facebook 2014 回顧
德國奪下冠軍的世界盃
伊波拉病毒(Ebola virus outbreak)
巴西大選
Robin Williams(於 2014 年 8 月 11 日逝世)
冰桶挑戰 Ice Bucket Challenge
加薩戰爭(Conflict in Gaza)
馬航事件(MH17 以及 MH37 )
Super Bowl
Michael Brown/Ferguson
Sochi Winter Olympics
• http://yearinreview.fb.com/
10
11. 社交媒體匯集了群體力量
• 社群新聞( social journalism):
透過群眾外包由公民提供各種新聞線索,不斷改寫新聞
的內涵。
Guardian open journalism
• 災難事件的集體協作: 災難地圖、尋人網站
• 群眾查證與流言過濾: 倫敦暴動、真假災難照片
• 社交媒體與社會抗爭: 阿拉伯之春、太陽花學運
• Twitter go CRAZY during Brazil v Germany 2014
17. Computational turn
• Big data:
– 大數據、海量數據、鉅量資料
– 大量 (Volume) : 盡可能完整的資料
– 龐雜(Variety) : 非結構化資料
– 快速(Velocity) :即時資料
– 不確定性 (Veracity) :雜訊多
• Computational turn (Berry, 2011)
鉅量資料重新形塑了知識建構與研究流程,及人們處理
資訊與分類方式,促使人文及社會科學研究也產生「向
運算轉」
17
26. 鉅量資料的迷思
• Data 數量愈大愈好?
– 過於龐大的資料,增加資料篩選的難度
– 最好是開始就能精確設計資料收集方式
• 有了鉅量資料分析,還需不需要理論?
– 理論可協助研究者進行有效研究設計
– 不是所有的問題,都適合用鉅量資料分析回答
• 母體/樣本的關係
– 抽樣是否適當,取決研究設計與問題的契合度
– 如: 選擇Twitter, Youtube, Facebook,微博
29. Network analysis on Twitter
29
2014 年以巴Gaza衝突時,支持以色列與巴勒斯坦的陣營如何各自跟自己支持者對話
Messages passed along in one side of the graph will never reach the other.
Notes de l'éditeur RT或 @reply,建立為發文者與對話者具有一筆關係(edge),如:發文者user1發送推文「@user2 馬英九勝選」,這樣user1- user2就建立為一筆關係,或是user3看到上述推文加以轉發(Retweet),則結果是user3: 「RT@user1@user2馬英九勝選」,則「user3-user1-user2」又算是一筆關係,以此類推。
研究者在所有的2.8萬筆tweets中,篩選出RT或@reply類型的推文,總共有 5655 個 Node,以 Edge 數 5 以上過濾 Node 後,還有 783 個 Node(13.85%),所繪出的網絡分析圖。
Gephi繪圖原則:節點大小是根據betweenness centrality(同時計算接收、回應、metion次數),節點越大betweenness centrality越高,也代表該節點扮演中心連結或資訊中介者的角色,節點的顏色深淺是根據indegree 與outdegree(收到與發出@reply數量)愈多,則顏色愈深。 2014以巴衝突時,支持以色列與巴勒斯坦方的陣營如何各自跟自己支持者對話,包括不同新聞媒體的新聞立場或被分享的方式。http://globalvoicesonline.org/2014/08/04/israel-gaza-war-data-the-art-of-personalizing-propaganda/
團隊收集了Instagram上全球五個城市各約2-3萬張照片,共約12萬張照片,透過機器人臉辨識及人工方式判斷自拍者的性別、年齡、心情、姿勢等。