欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/ACL2, C++/F#/Lisp
Apache Tika
来自开放百科 - 灰狐
(版本间的差异)
小 (→图集) |
小 (→图集) |
||
第7行: | 第7行: | ||
image:apache-tika-framework.png|框架 | image:apache-tika-framework.png|框架 | ||
image:apche-tika-in-machine-learning.png|机器学习 | image:apche-tika-in-machine-learning.png|机器学习 | ||
+ | image:apache-tika-parser-method.png|Parse方法 | ||
+ | image:apache-tika-parser-interface-implementations.png|接口实现 | ||
+ | image:apache-nutch2-architecture.png|Nutch2框架 | ||
+ | image:apache-tika-metadata.png|愿数据 | ||
</gallery> | </gallery> | ||
2015年7月19日 (日) 03:50的版本
Apache Tika:通用的内容分析工具箱,通过现有的解析器库检测以及从各种文档提取元数据以及结构化的文本内容。
Apache Tika 可以和 Apache Nutch、Apache Lucene、Apache Solr 结合,提供完整的搜索引擎基础设施。
图集
链接
分享您的观点