NLTK

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
(项目)
 
(未显示1个用户的12个中间版本)
第1行: 第1行:
{{SeeWikipedia}}
+
{{SeeWikipedia|Natural_Language_Toolkit}}
  
 
NLTK — the Natural Language Toolkit
 
NLTK — the Natural Language Toolkit
 +
 +
==简介==
 +
Python NLTK 自然语言处理包
 +
 +
==功能==
 +
NLTK 提供以下功能和处理任务:
 +
 +
* 获取语料库:语料库和词典的标准化接口
 +
* 字符串处理:分词、句子分解、提取主干
 +
* 搭配探究:t-检验、卡方、交互信息
 +
* 词性标识符:n-gram、backoff、Brill、HMM、TnT
 +
* 分类:决策树、最大熵、朴素贝叶斯、EM、k-means
 +
* 分块:正则表达式、n-gram、命名实体
 +
* 解析:图表、基于特征、一致性、概率性、依赖性
 +
* 语义:λ演算、一阶逻辑、模型检验
 +
* 指标评测:精度、召回率、协议系数
 +
* 概率与估计:概率分布、平滑概率分布
 +
* 应用:图形化的关键字排序、分析器、WordNet查看器、聊天机器人
 +
* 语言学领域的工作:处理SIL工具箱格式的数据
 +
 +
==指南==
 +
>>> import nltk
 +
>>> nltk.download()
 +
 +
==项目==
 +
*[https://github.com/nltk/nltk/wiki/Machine-Translation NLTK Machine Translation] [https://www.nltk.org/api/nltk.translate.html nltk.translate package]
 +
*[[WordNet]] [https://www.nltk.org/howto/wordnet.html Interface]
 +
 +
==图集==
 +
<gallery>
 +
image:nltk-downloader.png|下载器
 +
</gallery>
 +
 
==链接==
 
==链接==
 
*[http://www.nltk.org/ 官方网站]
 
*[http://www.nltk.org/ 官方网站]
*[http://code.google.com/p/nltk/ 项目主页]
+
*[https://github.com/nltk/nltk NLTK @ GitHub]
*[http://docs.huihoo.com/nltk/ 开源文档]
+
*[http://docs.huihoo.com/nltk/ 开放文档]
 +
*[https://www.npmjs.com/package/nlp-toolkit Natural Language Processing Toolkit for node.js]
 +
*[http://download.huihoo.com/nltk NLTK数据集、文本语料和词汇资源]
 +
*[http://m.blog.csdn.net/blog/huyoo/12188573 python的nltk中文使用和学习资料汇总帮你入门提高]
  
[[Category:Python]]
+
[[category:computational linguistics]]
 +
[[category:natural language processing]]
 +
[[category:artificial intelligence]]
 +
[[category:python]]

2022年3月7日 (一) 06:33的最后版本

Wikipedia-35x35.png 您可以在Wikipedia上了解到此条目的英文信息 NLTK Thanks, Wikipedia.

NLTK — the Natural Language Toolkit

目录

[编辑] 简介

Python NLTK 自然语言处理包

[编辑] 功能

NLTK 提供以下功能和处理任务:

  • 获取语料库:语料库和词典的标准化接口
  • 字符串处理:分词、句子分解、提取主干
  • 搭配探究:t-检验、卡方、交互信息
  • 词性标识符:n-gram、backoff、Brill、HMM、TnT
  • 分类:决策树、最大熵、朴素贝叶斯、EM、k-means
  • 分块:正则表达式、n-gram、命名实体
  • 解析:图表、基于特征、一致性、概率性、依赖性
  • 语义:λ演算、一阶逻辑、模型检验
  • 指标评测:精度、召回率、协议系数
  • 概率与估计:概率分布、平滑概率分布
  • 应用:图形化的关键字排序、分析器、WordNet查看器、聊天机器人
  • 语言学领域的工作:处理SIL工具箱格式的数据

[编辑] 指南

>>> import nltk
>>> nltk.download()

[编辑] 项目

[编辑] 图集

[编辑] 链接

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱