NLTK,即自然語言工具箱,是書籍《python自然語言處理》所介紹的python庫。對於自然語言的處理有強大的功能。本經驗就nltk的例子的安裝進行分享。還介紹書中的示例。
工具/原料
電腦需要安裝python及nltk庫.
方法/步驟
python的安裝請參考經驗“python canopy安裝及配置”。安裝完成之後,使用命令行啟動。
nltk需要安裝好,然後使用import nltk導入。
為了能夠使用書中的例子,需要下載示例和數據。輸入nltk.download()命令。在下圖中選擇book。
文件大概有100多M,等待一段時間。
下載完成之後,輸入以下命令,將書中用到的文本數據導入。共有九個文本,囚全是英文文本。如要分析中文,可以自己準備數據。
輸入以下命令,在文本1中查找選中的單次出現次數。
畫出選擇的詞在文章中出現的位置頻數。
注意事項
這只是拋磚引玉,書中還有許多精彩例子。