Search engine

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
第1行: 第1行:
国内著名搜索引擎公司百度(http://www.baidu.com)总裁李彦宏说:搜索引擎不是人人都能做的领域,进入的门槛比较高。
+
国内著名搜索引擎公司百度 http://www.baidu.com 总裁李彦宏说:搜索引擎不是人人都能做的领域,进入的门槛比较高。
  
 
[[Image:search_engine.jpg|thumb|right|典型的搜索引擎系统架构图]]
 
[[Image:search_engine.jpg|thumb|right|典型的搜索引擎系统架构图]]
第5行: 第5行:
  
 
[[Image:wordID.jpg|thumb|right|搜索关键字处理流程]]
 
[[Image:wordID.jpg|thumb|right|搜索关键字处理流程]]
 +
 +
搜索引擎的策略都是采用服务器群集和分布式计算技术。
 +
 
==搜索引擎==
 
==搜索引擎==
 
*[[List of search engines]]
 
*[[List of search engines]]
第67行: 第70行:
 
*Guidelines for Robot Writers : http://www.robotstxt.org/wc/guidelines.html
 
*Guidelines for Robot Writers : http://www.robotstxt.org/wc/guidelines.html
 
*SearchTools.com:  http://www.searchtools.com/robots/ ,All About Search Indexing Robots and Spiders
 
*SearchTools.com:  http://www.searchtools.com/robots/ ,All About Search Indexing Robots and Spiders
*中文搜索引擎技术揭密:网络蜘蛛 - http://www.magicpower.com.cn/Articles/showarticle.asp?article_id=183
+
 
*中文搜索引擎技术揭密:中文分词 - http://www.magicpower.com.cn/Articles/showarticle.asp?article_id=184
+
==相关文章==
*中文搜索引擎技术揭密:排序技术 - http://www.magicpower.com.cn/Articles/showarticle.asp?article_id=185
+
*[[Search Engine Segment|中文分词和搜索引擎]]
*中文搜索引擎技术揭密:系统架构 - http://www.magicpower.com.cn/Articles/showarticle.asp?article_id=186
+
  
 
[[Image:Example.jpg]]
 
[[Image:Example.jpg]]

2006年11月22日 (三) 21:37的版本

国内著名搜索引擎公司百度 http://www.baidu.com 总裁李彦宏说:搜索引擎不是人人都能做的领域,进入的门槛比较高。

典型的搜索引擎系统架构图

搜索引擎的门槛主要是技术门槛,包括网页数据的快速采集、海量数据的索引和存储、搜索结果的相关性排序、搜索效率的毫秒级要求、分布式处理和负载均衡、自然语言的理解技术等等,这些都是搜索引擎的门槛。

搜索关键字处理流程

搜索引擎的策略都是采用服务器群集和分布式计算技术。

目录

搜索引擎

开源项目

中文资源

相关文章

相关链接

相关文章

文件:Example.jpg

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱