Apache Tika

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
(链接)
(链接)
 
(未显示1个用户的3个中间版本)
第6行: 第6行:
 
<gallery>
 
<gallery>
 
image:apache-tika-framework.png|框架
 
image:apache-tika-framework.png|框架
 +
image:apche-tika-in-machine-learning.png|机器学习
 +
image:apache-tika-parser-method.png|Parse方法
 +
image:apache-tika-parser-interface-implementations.png|接口实现
 +
image:apache-nutch2-architecture.png|Nutch2框架
 +
image:apache-tika-metadata.png|元数据
 
</gallery>
 
</gallery>
  
第16行: 第21行:
 
[[category:apache]]
 
[[category:apache]]
 
[[category:metadata]]
 
[[category:metadata]]
 +
[[category:OSGi]]

2016年2月12日 (五) 00:41的最后版本

Apache Tika:通用的内容分析工具箱,通过现有的解析器库检测以及从各种文档提取元数据以及结构化的文本内容。

Apache Tika 可以和 Apache NutchApache LuceneApache Solr 结合,提供完整的搜索引擎基础设施。

[编辑] 图集

[编辑] 链接

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱