Search engine

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
第44行: 第44行:
 
*[[CLucene]] is a C++ port of Lucene - http://clucene.sourceforge.net
 
*[[CLucene]] is a C++ port of Lucene - http://clucene.sourceforge.net
 
*[[Nutch]] (open source web-scalable search engine) - http://lucene.apache.org/nutch/
 
*[[Nutch]] (open source web-scalable search engine) - http://lucene.apache.org/nutch/
*Hadoop - http://lucene.apache.org/hadoop/
+
*[[Hadoop]] - http://lucene.apache.org/hadoop/
 
*ASPSeek - http://www.aspseek.org/  
 
*ASPSeek - http://www.aspseek.org/  
 
*DataparkSearch - http://www.dataparksearch.org/  
 
*DataparkSearch - http://www.dataparksearch.org/  

2006年11月25日 (六) 23:35的版本

国内著名搜索引擎公司百度 http://www.baidu.com 总裁李彦宏说:搜索引擎不是人人都能做的领域,进入的门槛比较高。

典型的搜索引擎系统架构图

搜索引擎的门槛主要是技术门槛,包括网页数据的快速采集、海量数据的索引和存储、搜索结果的相关性排序、搜索效率的毫秒级要求、分布式处理和负载均衡、自然语言的理解技术等等,这些都是搜索引擎的门槛。

搜索关键字处理流程

搜索引擎的策略都是采用服务器群集和分布式计算技术。

经典文章: The Anatomy of a Large-Scale Hypertextual Web Search Engine

目录

搜索引擎

开源项目

中文资源

相关文章

相关链接

文件:Example.jpg

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱