Search engine

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
第7行: 第7行:
  
 
搜索引擎的策略都是采用服务器群集和分布式计算技术。
 
搜索引擎的策略都是采用服务器群集和分布式计算技术。
 +
 +
经典文章: [http://infolab.stanford.edu/~backrub/google.html The Anatomy of a Large-Scale Hypertextual Web Search Engine]
  
 
==搜索引擎==
 
==搜索引擎==
第63行: 第65行:
 
==相关文章==
 
==相关文章==
 
*[[Google的启示]]
 
*[[Google的启示]]
 +
*[[Search Engine Segment|中文分词和搜索引擎]]
 +
*[[Search Engine and Segment|中文搜索引擎技术揭密:中文分词]]
 +
*[[Search Engine and Sort Technology|中文搜索引擎技术揭密:排序技术]]
 +
*[[Search Engine and Web Crawler|中文搜索引擎技术揭密: 网络蜘蛛]]
 +
*[[Search Engine and System Structure|中文搜索引擎技术揭密:系统架构]]
  
 
==相关链接==
 
==相关链接==
第70行: 第77行:
 
*Guidelines for Robot Writers : http://www.robotstxt.org/wc/guidelines.html
 
*Guidelines for Robot Writers : http://www.robotstxt.org/wc/guidelines.html
 
*SearchTools.com:  http://www.searchtools.com/robots/ ,All About Search Indexing Robots and Spiders
 
*SearchTools.com:  http://www.searchtools.com/robots/ ,All About Search Indexing Robots and Spiders
 
==相关文章==
 
*[[Search Engine Segment|中文分词和搜索引擎]]
 
  
 
[[Image:Example.jpg]]
 
[[Image:Example.jpg]]

2006年11月22日 (三) 21:52的版本

国内著名搜索引擎公司百度 http://www.baidu.com 总裁李彦宏说:搜索引擎不是人人都能做的领域,进入的门槛比较高。

典型的搜索引擎系统架构图

搜索引擎的门槛主要是技术门槛,包括网页数据的快速采集、海量数据的索引和存储、搜索结果的相关性排序、搜索效率的毫秒级要求、分布式处理和负载均衡、自然语言的理解技术等等,这些都是搜索引擎的门槛。

搜索关键字处理流程

搜索引擎的策略都是采用服务器群集和分布式计算技术。

经典文章: The Anatomy of a Large-Scale Hypertextual Web Search Engine

目录

搜索引擎

开源项目

中文资源

相关文章

相关链接

文件:Example.jpg

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱