產品經理私藏的“微詞云中文分析工具使用技巧”,學會了免壓9款文本分析工具
相信很多小伙伴,用過微詞云中文分析,如中文分詞、情感分析~
殊不知,微詞云中文分析旗下已有9款文本分析工具,其中5款高級分析工具,4款免費分析小工具
會員賬戶的小伙伴可解鎖9款工具任意權益,以及解鎖未來增加的“有關中文分析”的「新工具」和「新功能」
今天就帶大家一起盤點鮮為人知的“價值功能點!特別是中文分析會員的小伙伴,答應我,一定要看到最后!解鎖你還未觸碰的功能權益吧~
這里是微詞云中文分析旗下所有工具,未來還會繼續增加與升級
在任意中文分析工具入口購買的會員都可享受以下工具權益,不必擔心!
1、中文通用分析
2、中文通用比
3、中文情感分析
4、中文新詞發現
5、中文聚類可視化
6、詞頻比對小工具
7、文本去重小工具
8、文本逐行比對小工具
9、文本切分小工具
再推薦幾款我常用的分析免費在線小工具
1、多文本合
2、大文本切割
3、亂碼文件處理
4、3D餅狀圖生
5、繁體字轉簡體
6、文本格式轉化
高頻詞是文本分析最基礎的需求,然而還有非常多的展示形式,今天來教你做高級版的高頻詞分析吧,答應我這個一定要看完,因為太實用了!
1. Top高頻詞云圖人人都知道!
這個我就不多說了,關鍵詞在文本出現的次數越多,在詞云圖中關鍵詞顯示越大
高頻詞統計結果數據,在中文通用分析工具中的特征詞中就能看到,按照數量高低進行顯示的就是高頻詞列表了
可以在頂部創建Top100高頻詞云圖
2. 相關性詞云圖?你知道嗎?
是結合關鍵詞之間的相關性值和共現值綜合指標來分布的,其中關鍵詞越集中在中心位置的詞與文本相關性和共現值越大,關鍵詞顯示大小與單詞詞頻數有關系。
相關性分析是分析文本之間的相關性,以挖掘出文本中潛在的關系;還可以幫助企業了解文本數據,發現有價值的信息,精準推斷和決策。
使用工具:中文通用分析
操作思路:截圖相關詞云圖即可、點擊任意單詞都可查看相關詞云圖并截圖保存即可
3. 關鍵詞語義詞云圖?你知道?
精準查看某個高頻詞的語義,例如旅游業的政策報告中,查看高頻詞“發展”,都提到了什么,我可在詞序分析位置查看到左臨詞和右臨詞,把詞序分析表變成關鍵詞語義詞云圖
使用工具:中文通用分詞
操作思路:點擊報告中任意關鍵詞,就會找到詞序表—>下載詞序表->導入到詞云設計中生成詞云圖
詞云圖制作教程
4. 新晉高頻詞?你知道嗎?
這類高頻詞云圖是針對多個文本的比對分析,新出現的高頻詞簡稱為新晉高頻詞
例如研究2023年的鄉村振興政策分析與去年比較,新出現的新晉高頻詞有哪些
使用工具:中文通用比對
操作思路:在中文通用比對報告中下載【新出現詞與消失詞分析】數據結果,用詞云圖生成工具生成可視化即可
視頻教程
5. 多年高頻詞排名變化圖?你知道嗎?
這類高頻詞云圖是針對多個文本的比對分析,例如我們比對5年的鄉村振興政策文本,5年文本比對
使用工具:中文通用比對
操作思路:在【查詢單詞以及變化趨勢】處,點擊總次數指標,讓單詞按照總次數高低進行排列,勾選高頻詞并生成圖表即可。
6. 消失高頻詞?你知道嗎?
同樣消失高頻詞也是針對多個文本的比對分析,例如研究2023年的鄉村振興政策分析與過去的四年里,哪些高頻新詞消失了,不再出現。
使用工具:中文通用比對
操作思路:在【新出現詞與消失詞分析】處,在任務2選選中2023年,在任務1中選中其他任意年份都行,點擊【計算新詞】按鈕即可,下載消失詞結果數據,在詞云生成器中生成高頻詞云圖即可
制作專業感網絡關系圖
文本網絡關系圖可以幫助研究人員更好地理解文本中的詞語之間的關系,以及它們如何影響文本的整體結構
在做文本分析時,總是離不開研究關鍵詞之間的關系,網絡關系圖可以幫助研究人員更好地理解文本中的詞語之間的關系以及更好地理解文本中的詞匯和句子結構。
報告研究中,常用到共現網絡關系圖和聚類網絡關系圖,我們就來一探究竟
1. 共現網絡關系圖
共現網絡關系圖,節點顏色沒有特殊意義,聚類網絡關系圖正好相反,相同顏色節點代表是一類關鍵詞
中文通用分析中可以實現以下四種典型關系圖效果
很多小伙伴會問,這個網絡關系圖怎么分析呢?
ChatGPT說“共現網絡關系圖是一種可視化圖表,用來表示多元實體在不同情境下的關系。它是一種點-邊圖,點表示實體,邊表示實體之間的關系。圖中的節點大小可以表示實體的重要性,邊的粗細表示實體之間的關系的強度??梢酝ㄟ^觀察共現網絡關系圖來分析實體之間的關系”
使用工具:中文通用分析
操作思路:在工具中導入文本數據,得到報告后,找到網絡關系圖位置,重新選詞,并計算關系,調整效果即可
操作參考視頻:https://www.bilibili.com/video/BV1MK41167ik/
2. 聚類網絡關系圖
其實微詞云可以生成聚類效果網絡關系圖,需要使用者上傳完全共詞矩陣表和關鍵詞分類表即可
實際上完全矩陣表在中文通用分析中就可以導出的下面會詳細講數據表所在的位置
如何分析文本聚類網絡關系圖關系?
ChatGPT說“首先要從數據的角度來看,可以從節點和邊的數量,以及各個節點之間的距離等來分析數據。節點越多,其關系就越復雜;節點之間的距離越短,就說明他們之間的關系越緊密。此外,還可以從節點的連接情況來看,如果一個節點的連接情況比較多,說明它在整個網絡中的重要性也比較高。另外,也可以從節點的類型來看,這可以幫助我們判斷文本是否更多地偏向某個主題,從而得出結論”
使用工具:中文聚類可視化
操作思路:上傳完全矩陣表和關鍵詞分組聚類表即可
操作參考教程
文本情感正負面分析并不難!
殊不知中文分析權益中還有情感分析,可以做基礎的文本情感傾向判斷,例如正負面占比、情緒值與數量分布情況,還可以查看每條數據的情感判斷數據信息等,未來也是我們主要發展的一款工具
使用工具:中文情感分析
操作步驟上傳文本->選擇行業詞典即可
操作教程
不容錯過的高質量數據分析表
1. 完全共詞矩陣表
在做網絡關系圖時少不了要計算共現關系值,無論你是在中文分詞中生成還是在其他外部軟件生成都離不開這個數據表,你可以在中文通用分析報告里下載
使用工具:中文通用分析
下載位置:網絡關系圖功能模塊,右上角位置處
數據更改方法:可點擊重新選詞來更改數據,最多50個詞
2. 切詞分詞表
例如想要每條數據返回切詞結果數據表,其實微詞云都可以實現,因為功能較基礎,所以只提供了下載數據而已,沒有過多展示
使用工具:中文通用分析、中文情感分析
下載位置:基礎信息模塊【下載】位置處
3. 任務文件表
目前只有中文分詞有「任務文本表」的功能,這個表可實現多次編輯分析結果數據,可理解為分析結果數據離線保存功能,也是會員賬號專屬功能。
4. 數據定位表
很多小伙伴有高頻詞“還原語境”的需求,而這里的數據定位表就完全可以滿足這個需求,直接定位所有與這個關鍵詞有關的原文本數據。點擊報告中的關鍵詞就可以找到這個數據結果表。
5. 詞序分析表
上面有提到關于詞序分析,它的價值不可忽視,可以抽取出關鍵詞的長顆粒度的組合詞組,讓研究者了解關鍵詞背后想表達的真正意義,結合數據定位表看效果更好。
點擊報告中的關鍵詞就可以找到詞序分析表了
6. 關鍵詞關系綜合分析表
這里有關鍵詞相關性值、共現值、共同出現次數值、TFIDF值以及單詞出現次數、不平衡比等重要指標
是研究關鍵詞報告重要數據之一,中文通用分析,中文通用比對中都有這個表。
7. 情感分析表
在中文情感分析工具中,我們是可以下載每條數據的情感分析結果數據的,也許對某些用戶這些數據價值度很高,可以進一步做其他的數據研究
使用工具:中文情感分析
下載位置:情感分析結果表模塊位置
高顆粒度詞這樣提取,做高階版詞頻分析!
別指望中文通用分析幫你提取出3~6個字長度的高頻詞啦?用用這家伙,絕對靠得??!
因為它就是做新詞挖掘的,尤其是挖掘3~4個字長度的價值詞最在行,在配合中文通用分析中的自定義詞典功能絕配夫妻檔~
很多小伙伴專門為新詞發現工具而來的,因為他們還用它幫助企業建立行業詞典庫,是時候展示它的才華的時候了,功能介紹請查看往期推文即可。
短語關鍵詞詞頻統計怎么做?
我已經分好關鍵詞了,想做關鍵詞詞頻統計怎么做?
這里教大家一個絕密方法,方法簡單到你想哭,你卻不知道!
絕密視頻送你