欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/ACL2, C++/F#/Lisp
NLTK
来自开放百科 - 灰狐
(版本间的差异)
小 (→功能) |
小 (→图集) |
||
第20行: | 第20行: | ||
* 应用:图形化的关键字排序、分析器、WordNet查看器、聊天机器人 | * 应用:图形化的关键字排序、分析器、WordNet查看器、聊天机器人 | ||
* 语言学领域的工作:处理SIL工具箱格式的数据 | * 语言学领域的工作:处理SIL工具箱格式的数据 | ||
+ | |||
+ | ==指南== | ||
+ | >>> import nltk | ||
+ | >>> nltk.download() | ||
==图集== | ==图集== |
2015年7月25日 (六) 01:32的版本
您可以在Wikipedia上了解到此条目的英文信息 NLTK Thanks, Wikipedia. |
NLTK — the Natural Language Toolkit
Python NLTK 自然语言处理包
目录 |
功能
NLTK提供以下功能和处理任务:
- 获取语料库:语料库和词典的标准化接口
- 字符串处理:分词、句子分解、提取主干
- 搭配探究:t-检验、卡方、交互信息
- 词性标识符:n-gram、backoff、Brill、HMM、TnT
- 分类:决策树、最大熵、朴素贝叶斯、EM、k-means
- 分块:正则表达式、n-gram、命名实体
- 解析:图表、基于特征、一致性、概率性、依赖性
- 语义:λ演算、一阶逻辑、模型检验
- 指标评测:精度、召回率、协议系数
- 概率与估计:概率分布、平滑概率分布
- 应用:图形化的关键字排序、分析器、WordNet查看器、聊天机器人
- 语言学领域的工作:处理SIL工具箱格式的数据
指南
>>> import nltk >>> nltk.download()
图集
链接
分享您的观点