微博情感信息挖掘系統
2017-07-25 10:31:10 來源:本站原創 瀏覽:89次內容提要:編號jsp360:我國有著龐大的微博用戶群,據不完全統計,我國微博網民達到3.31億之多,微博平臺信息發布與傳播快,產生巨大的信息量,如何從這些數據中挖掘出有價值的信息,特別是對熱點問題的情感態度,對分析社會的正能量和不穩定因素有重要意義。
我國有著龐大的互聯網用戶群,隨著微博的興起,互聯網上出現了大量的微博用戶群,針對大量的微博用戶,針對其情感信息的研究有著很重要的意義。所以大數據的分析也隨之出現。通過大數據的分析,可以更容易更方便了解到微博情感信息,可以準確掌握人們的心理情況。本系統采用了java技術開發,采用大數據分析的理念和爬蟲技術進行微博數據的爬行和分析,也是一項比較有創新特色的畢業設計,系統功能主要分為以下幾個方面:
1、針對微博的信息進行格式化處理,主要挖掘微博題目、內容、發布時間、轉發數量以及評價數量等基本信息,并存入數據庫。
2、數據信息的清洗:利用分詞技術對熱門的微博進行分詞,將停用詞和特殊的符號等不相干數據進行清理。
3、建立情感詞庫:通過建立積極情感詞庫和消極情感詞庫,為情感數據的挖掘做好服務工作。
4、蟻群算法在本系統中發揮重要的作用,本人利用蟻群算法信息素揮發原理,對微博數據信息進行動態情感分析,主要完成以下兩種關聯:
a)事件與情感的關聯,發現一些引起積極情感的事件,和一些引起負面情感的事件。
b)用戶與情感的關聯,發現一些用戶在某個時間段與積極情感或消極情感的關聯,給出用戶的情感變化曲線。
5、以曲線的方式,給用戶展示出直觀的情感的波動圖。
微博數據抓。
前十名關鍵詞排名:
曲線圖: