如何分析多個文本異同,趨勢變化分析?如共有詞,獨有詞,詞變化量、累計量等?
很多時候,我們需要對多份文本進行比多分析
如政府多份工作報告、電商每個季度評論分析、多份相關文本分析等
通過比多,我們可以挖掘文本之間的變化、一致性和預測趨勢等
好了,我準備了是鄉村振興的19年、20年、21年數據,用來做比對分析研究文本異同之處
那么是否有一個工具支持我們這么做呢?其實是有的
在線多文本比對工具
我們打開微詞云的中文通用比對分析工具
使用方法也很簡單,上傳要比對文本的wcy文件就可以了
如何獲得每個文本的wcy文件?
非常簡單,wcy文件是微詞云獨有的文件而已
我們需要使用中文通用分析工具,上傳文本,生成報告后,就可以下載wcy文件了
做比對多份文本的同性分析
上傳好三個wcy文件后,我們就可以進入到報告里面了
我們先來看下單詞交集位置,這里是三份文本共同出現的高頻詞表
可根據右側側的詞表統計位置,查看共同出現次數做多的詞有哪些
左側是共有詞與文本的詞匯的占比統計
中間是共有詞云圖信息
共有詞趨勢變化
同時我們還可以點擊共有詞查看共有詞的趨勢變化,可以看多年的詞匯趨勢
如果數據量夠大,按照一定規則,我們還可以推測未來幾年的詞的變化情況
文本差異性分析
基礎信息差異
我們在報告頂部位置,左側可以直接看到文本的大小、字數、總詞數、特征詞數、有效條數據、詞密度、平均句長等信息的差異變化
右側可以看到詞性占比之間的差異,詞性占比可以幫助我們更好地理解文本的語言特征差異
文本獨有詞分析
我們還可以通過文本之間獨有的詞分析文本的特點,你可以觀察政策的更新、修改和調整,從而了解政策的發展軌跡
例如我們查看新出現詞與消失詞分析
我們可以查看下19年有哪些獨有詞,我們可以這樣查
參照任務1選擇19年,參照任務2可以選擇20年
最終我們查消失的詞就行了
從19年到20年消失了哪些詞可以證明19年存在的詞,而20年并不存在
并且上面的表格數據中,所在任務只看包含19年的數據的,證明19年獨有的數據而不再其他文本中出現過
而右側統計表已經幫助統計好了每份文件的獨有詞了
如獨有詞數量折線圖和具體的詞表
變化趨勢分析
變化較大的詞趨勢分析
在查詢單詞以及變化趨勢功能模塊
我們會看到幾個重要指標
如總次數、平均次數、總條數、平均變化和最大變化
那么我們可以研究的點就比較多了
如,我們想研究這三個文本變化最大的一些詞的趨勢情況
變化大的詞表明政策的決策的方向改變,所以很重要的
我們先勾選這三個文件,然后在根據最大變化倒序排列,選擇幾個詞來做比對
這里注意的是:提前取消系統默認好的單詞,點擊清空選擇就好
出現頻次較高的詞變化
我們還可以根據出現總次數最大倒敘排列來選擇關鍵詞來分析變化趨勢
累計變化最大的詞分析
我們還可以根據變化累計量來分析關鍵詞的變化趨勢
操作上和上面一樣,把累計變化值倒敘排列進就行了
右側有很多展示變化表,大家可以自己慢慢查看哦
其實還有很多功能沒有說明,大家可以自己進一步探索,多個文本比對可挖掘的信息很多,這款工具還有很多不足,希望多給微詞云提一些需求建議!
相關文章推薦
1、多文本比對分析報告怎么做?
2、除了“ROSTCM6”高校師生更青睞的文本分析工具來了!
3、文本分析中,如何根據“關鍵詞”快速查找所有相關句子或段落?
4、文本分析之多份文本詞頻分析比較