NLTK

来自开放百科 - 灰狐
2022年3月7日 (一) 06:33Allen (讨论 | 贡献)的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到: 导航, 搜索
Wikipedia-35x35.png 您可以在Wikipedia上了解到此条目的英文信息 NLTK Thanks, Wikipedia.

NLTK — the Natural Language Toolkit

目录

简介

Python NLTK 自然语言处理包

功能

NLTK 提供以下功能和处理任务:

  • 获取语料库:语料库和词典的标准化接口
  • 字符串处理:分词、句子分解、提取主干
  • 搭配探究:t-检验、卡方、交互信息
  • 词性标识符:n-gram、backoff、Brill、HMM、TnT
  • 分类:决策树、最大熵、朴素贝叶斯、EM、k-means
  • 分块:正则表达式、n-gram、命名实体
  • 解析:图表、基于特征、一致性、概率性、依赖性
  • 语义:λ演算、一阶逻辑、模型检验
  • 指标评测:精度、召回率、协议系数
  • 概率与估计:概率分布、平滑概率分布
  • 应用:图形化的关键字排序、分析器、WordNet查看器、聊天机器人
  • 语言学领域的工作:处理SIL工具箱格式的数据

指南

>>> import nltk
>>> nltk.download()

项目

图集

链接

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱