欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/ACL2/Agda, C++/Lisp/Haskell
NLTK
来自开放百科 - 灰狐
(版本间的差异)
小 (→链接) |
小 (→项目) |
||
| (未显示1个用户的11个中间版本) | |||
| 第1行: | 第1行: | ||
| − | {{SeeWikipedia}} | + | {{SeeWikipedia|Natural_Language_Toolkit}} |
NLTK — the Natural Language Toolkit | NLTK — the Natural Language Toolkit | ||
| + | |||
| + | ==简介== | ||
| + | Python NLTK 自然语言处理包 | ||
| + | |||
| + | ==功能== | ||
| + | NLTK 提供以下功能和处理任务: | ||
| + | |||
| + | * 获取语料库:语料库和词典的标准化接口 | ||
| + | * 字符串处理:分词、句子分解、提取主干 | ||
| + | * 搭配探究:t-检验、卡方、交互信息 | ||
| + | * 词性标识符:n-gram、backoff、Brill、HMM、TnT | ||
| + | * 分类:决策树、最大熵、朴素贝叶斯、EM、k-means | ||
| + | * 分块:正则表达式、n-gram、命名实体 | ||
| + | * 解析:图表、基于特征、一致性、概率性、依赖性 | ||
| + | * 语义:λ演算、一阶逻辑、模型检验 | ||
| + | * 指标评测:精度、召回率、协议系数 | ||
| + | * 概率与估计:概率分布、平滑概率分布 | ||
| + | * 应用:图形化的关键字排序、分析器、WordNet查看器、聊天机器人 | ||
| + | * 语言学领域的工作:处理SIL工具箱格式的数据 | ||
| + | |||
| + | ==指南== | ||
| + | >>> import nltk | ||
| + | >>> nltk.download() | ||
| + | |||
| + | ==项目== | ||
| + | *[https://github.com/nltk/nltk/wiki/Machine-Translation NLTK Machine Translation] [https://www.nltk.org/api/nltk.translate.html nltk.translate package] | ||
| + | *[[WordNet]] [https://www.nltk.org/howto/wordnet.html Interface] | ||
| + | |||
==图集== | ==图集== | ||
<gallery> | <gallery> | ||
| 第9行: | 第37行: | ||
==链接== | ==链接== | ||
*[http://www.nltk.org/ 官方网站] | *[http://www.nltk.org/ 官方网站] | ||
| − | *[ | + | *[https://github.com/nltk/nltk NLTK @ GitHub] |
*[http://docs.huihoo.com/nltk/ 开放文档] | *[http://docs.huihoo.com/nltk/ 开放文档] | ||
| + | *[https://www.npmjs.com/package/nlp-toolkit Natural Language Processing Toolkit for node.js] | ||
| + | *[http://download.huihoo.com/nltk NLTK数据集、文本语料和词汇资源] | ||
| + | *[http://m.blog.csdn.net/blog/huyoo/12188573 python的nltk中文使用和学习资料汇总帮你入门提高] | ||
| + | [[category:computational linguistics]] | ||
| + | [[category:natural language processing]] | ||
| + | [[category:artificial intelligence]] | ||
[[category:python]] | [[category:python]] | ||
2022年3月7日 (一) 06:33的最后版本
| |
您可以在Wikipedia上了解到此条目的英文信息 NLTK Thanks, Wikipedia. |
NLTK — the Natural Language Toolkit
目录 |
[编辑] 简介
Python NLTK 自然语言处理包
[编辑] 功能
NLTK 提供以下功能和处理任务:
- 获取语料库:语料库和词典的标准化接口
- 字符串处理:分词、句子分解、提取主干
- 搭配探究:t-检验、卡方、交互信息
- 词性标识符:n-gram、backoff、Brill、HMM、TnT
- 分类:决策树、最大熵、朴素贝叶斯、EM、k-means
- 分块:正则表达式、n-gram、命名实体
- 解析:图表、基于特征、一致性、概率性、依赖性
- 语义:λ演算、一阶逻辑、模型检验
- 指标评测:精度、召回率、协议系数
- 概率与估计:概率分布、平滑概率分布
- 应用:图形化的关键字排序、分析器、WordNet查看器、聊天机器人
- 语言学领域的工作:处理SIL工具箱格式的数据
[编辑] 指南
>>> import nltk >>> nltk.download()
[编辑] 项目
[编辑] 图集
[编辑] 链接
分享您的观点