
在線詞頻統計工具
詞頻統計的意義
詞頻統計分析:是文本挖掘的重要方法,通過關鍵詞出現頻次多少的變化,來確定熱點及其變化趨勢
不管你是在工作還是生活中,都會有詞頻統計的需求
比如:我最近迷上了周杰倫的歌,我想分析周杰倫的歌曲的高頻詞
比如:我要做關于淘寶國產手機評論分析,了解下大家都主要說了哪些總要的信息,并幫助商家如何提升產品質量和業績
比如:我在政府機構上班,需要對每次行業報告做詞頻挖掘分析,了解本次報告重點出現的關鍵詞與以往的報告做對比
甚至不少大學生也會應用到詞頻統計工具,幫助他寫論文報告、幫助他快速了解一本書的中心思想等等
此處使用一款國內非常良心的詞頻統計分析工具“微詞云.強大的文字云藝術生成器”,你不需要懂任何代碼程序,只要把文本內容復制導入到“ 微詞云”中就可以完成詞頻統計了。
微詞云詞頻統計功能特點
- 支持千萬大文本分詞量:最高上傳文本量20M
- 自定義詞典功能:關心詞一個都不拉,分析更精準
- 提供多緯度篩詞:過濾未知詞、單個詞、詞頻為1的詞、根據不同詞性進行過濾詞
- 詞頻統計下載:支持下載全部的分詞詞頻統計結果
- 支持詞云圖可視化:可以在這里做出非常漂亮的詞云圖哦
詞頻統計分析案例
我以384首的周杰倫歌詞析案例進行分享微詞云如何實現詞頻統計的
先進入微詞云(weiciyun.com)的首頁:點擊【創建詞云】
tep1:
點擊【導入單詞】,把文本輸入到【分詞篩詞后導入】中
把周杰倫的歌詞文本復制粘貼到文本框中,點擊【開始分詞】
tep2:
進入到詞性篩詞界面,先通過【詞性】進行篩選不需要的詞(不需要的詞,就取消勾選就可以了)
篩選完詞后,點擊右下角的【確定使用所選單詞】以上就完成了基本的文本分詞詞頻統計的功能
詞頻中的高級功能
自定義詞典:
希望分詞更精準(例如手感好,系統被分成“手感和好”了)建議在分詞頁使用【自定義詞典】功能;把不想被分開的關鍵詞輸入到自定義詞典中就可以了;使用自定義詞典功能
位置:自定義詞典功能:在單詞導入的右上角上
詞頻top20
我們來看下周杰倫歌詞的top前20詞頻可視化
詞頻top10
通過詞頻可視化可以看出,周杰倫的哥很悲傷,“回憶”“離開”充滿著孤單的情感。主要偏愛情的歌曲比較多
重點功能:保存草稿
詞頻可視化python顏色組
可以根據篩詞后的數據做出不同形狀的詞頻可視化詞云圖,微詞云還支持”python“顏色模版哦
在配置中的顏色組中可以找到
情感詞展示
對文本的關鍵詞進行細致分析,例如周杰倫歌詞中的情感詞,可以手動返回到到篩詞頁進行在次篩詞下
點擊【單詞導入】即可進入到篩詞頁
周杰倫的情感中,被“愛情,媽媽,眼淚,安靜和思念”籠罩著,情感比較豐富
結尾
未來微詞云還會繼續優化更多的數據分析功能。以上也我也只是用到其中的一部分功能而已,希望對大家做數據分析有幫助。