Search engine

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
第42行: 第42行:
 
==开源项目==
 
==开源项目==
 
*[[mnoGoSearch]] - http://mnogosearch.org/
 
*[[mnoGoSearch]] - http://mnogosearch.org/
*[[Lucene]] Search Engine (no crawler) - http://lucene.apache.org
+
*[[Apache Lucene]] Search Engine (no crawler) - http://lucene.apache.org
 
*[[CLucene]] is a C++ port of Lucene - http://clucene.sourceforge.net
 
*[[CLucene]] is a C++ port of Lucene - http://clucene.sourceforge.net
 
*[[Nutch]] (open source web-scalable search engine) - http://lucene.apache.org/nutch/
 
*[[Nutch]] (open source web-scalable search engine) - http://lucene.apache.org/nutch/

2006年12月1日 (五) 11:09的版本

国内著名搜索引擎公司百度 http://www.baidu.com 总裁李彦宏说:搜索引擎不是人人都能做的领域,进入的门槛比较高。

典型的搜索引擎系统架构图

搜索引擎的门槛主要是技术门槛,包括网页数据的快速采集、海量数据的索引和存储、搜索结果的相关性排序、搜索效率的毫秒级要求、分布式处理和负载均衡、自然语言的理解技术等等,这些都是搜索引擎的门槛。

搜索关键字处理流程

搜索引擎的策略都是采用服务器群集和分布式计算技术。

经典文章: The Anatomy of a Large-Scale Hypertextual Web Search Engine

目录

搜索引擎

开源项目

中文资源

相关文章

相关链接

文件:Example.jpg

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱