上QQ阅读APP看书,第一时间看更新
1.4.5 NLTK
NLTK(Natural Language Toolkit,自然语言处理工具包)是NLP领域中最常使用的Python库。NLTK是由Steven Bird和Edward Loper在宾夕法尼亚大学开发的开源项目,可以访问超过50个语料库和词汇资源,并有一套用于分类、标记化、词干标记、解析和语义推理的文本处理库。
图1-9 Pandas网站
图1-10 SciPy网站
NLTK官方网址为http://www.nltk.org/,如图1-11所示。
图1-11 NTLK网站