欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/ACL2, C++/F#/Lisp
Apache Tika
来自开放百科 - 灰狐
(版本间的差异)
小 (→图集) |
小 (→链接) |
||
(未显示1个用户的1个中间版本) | |||
第10行: | 第10行: | ||
image:apache-tika-parser-interface-implementations.png|接口实现 | image:apache-tika-parser-interface-implementations.png|接口实现 | ||
image:apache-nutch2-architecture.png|Nutch2框架 | image:apache-nutch2-architecture.png|Nutch2框架 | ||
− | image:apache-tika-metadata.png| | + | image:apache-tika-metadata.png|元数据 |
</gallery> | </gallery> | ||
第21行: | 第21行: | ||
[[category:apache]] | [[category:apache]] | ||
[[category:metadata]] | [[category:metadata]] | ||
+ | [[category:OSGi]] |
2016年2月12日 (五) 00:41的最后版本
Apache Tika:通用的内容分析工具箱,通过现有的解析器库检测以及从各种文档提取元数据以及结构化的文本内容。
Apache Tika 可以和 Apache Nutch、Apache Lucene、Apache Solr 结合,提供完整的搜索引擎基础设施。
[编辑] 图集
[编辑] 链接
分享您的观点