Search engine

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
第62行: 第62行:
 
*[[Tesseract OCR]] - http://sourceforge.net/projects/tesseract-ocr
 
*[[Tesseract OCR]] - http://sourceforge.net/projects/tesseract-ocr
 
*天网千帆FTP文件搜索引擎 - http://project.mytianwang.cn/
 
*天网千帆FTP文件搜索引擎 - http://project.mytianwang.cn/
 +
*[[Sphider]]
  
 
==中文资源==
 
==中文资源==

2006年12月11日 (一) 16:21的版本

国内著名搜索引擎公司百度 http://www.baidu.com 总裁李彦宏说:搜索引擎不是人人都能做的领域,进入的门槛比较高。

典型的搜索引擎系统架构图

搜索引擎的门槛主要是技术门槛,包括网页数据的快速采集、海量数据的索引和存储、搜索结果的相关性排序、搜索效率的毫秒级要求、分布式处理和负载均衡、自然语言的理解技术等等,这些都是搜索引擎的门槛。

搜索关键字处理流程

搜索引擎的策略都是采用服务器群集和分布式计算技术。

经典文章: The Anatomy of a Large-Scale Hypertextual Web Search Engine

目录

搜索引擎

开源项目

中文资源

相关文章

相关链接

文件:Example.jpg

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱