大數據分析網絡暢銷書與網絡流行語的相關性
2019-03-19 11:31:53 來源:本站原創 瀏覽:388次內容提要:jsp535: 大數據的應用在社會的發展中越來越廣,各個行業都在利用大數據知識和技術進行相關的數據分析,通過大數據的分析,就能夠了解數據的走勢以及可以得出相關的營業情況。我們利用大數據進行暢銷書和網絡流行語的相關性,并可以根據分析結果,得出網絡流行語在電子商務方面的應用。
網絡流行語是近幾年伴隨網絡出現的一種簡潔、具有一定的創造性的語言,具有短時間內擴散開的特點。所以網絡流行語也逐漸成為一種網絡文化,并且能夠逐漸應用開來。在網絡暢銷書方面,通過網絡的暢銷書也是傳播大量數據及信息的重要途徑,流行語和暢銷書在某些方面的傳播有可能會有相似的地方,所以,根據大數據來分析網絡暢銷書與網絡流行語是否有其相關性也是當前畢業設計研究的一個重點分析對象,本課題主要是一種操作和研究的技能鍛煉,能夠針對以下幾點進行研究。系統主要是后端的服務端的數據分析,mysql數據的數據存儲以及在windows端下的可視化編程的數據分析結果展示,該系統部署安裝在linux操作系統下,linux可以安裝在windows操作系統的虛擬機下進行操作,并且將網絡建立成內網,在windows下利用jsp網頁的技術進行數據分析結果的展示,使用操作方便,具有一定的用戶體驗。本系統主要處理以下工作和研究:
1.收集網絡暢銷書與網絡流行語的數據
2.通過搭建hadoop服務集群,對數據進行整理、過濾,存儲到hive中,對數據進行分析處理,完成可視化編程并顯示數據。
3.按照特定的算法進行分析處理
針對大數據研究過程中的操作和分析,可能存在的問題:收集數據會有一定的困難,對數據進行分析處理可能也會由于專業知識不足而有一些困難。