Search engine

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
第60行: 第60行:
 
*[[Apache Nutch]] (open source web-scalable search engine) - http://lucene.apache.org/nutch/
 
*[[Apache Nutch]] (open source web-scalable search engine) - http://lucene.apache.org/nutch/
 
*[[Apache Hadoop]] - http://lucene.apache.org/hadoop/
 
*[[Apache Hadoop]] - http://lucene.apache.org/hadoop/
 +
*[[Compass]]
 
*[[SF FTP Search Engine|SF超高速FTP搜索引擎]]
 
*[[SF FTP Search Engine|SF超高速FTP搜索引擎]]
 
*ASPSeek - http://www.aspseek.org/  
 
*ASPSeek - http://www.aspseek.org/  

2007年1月6日 (六) 22:47的版本

"聚类" 是目前搜索引擎最热门的技术。

"聚类" 主要分为"搜索内容聚类"和"搜索结果排序聚类"

搜索内容聚类:指基于内容方面的聚类

搜索结果排序聚类:主要体现在查询结果的排序上

国内著名搜索引擎公司百度总裁李彦宏说:搜索引擎不是人人都能做的领域,进入的门槛比较高。

典型的搜索引擎系统架构图

搜索引擎的门槛主要是技术门槛,包括网页数据的快速采集、海量数据的索引和存储、搜索结果的相关性排序、搜索效率的毫秒级要求、分布式处理和负载均衡、自然语言的理解技术等等,这些都是搜索引擎的门槛。

搜索关键字处理流程

搜索引擎的策略都是采用服务器群集和分布式计算技术。

经典文章: The Anatomy of a Large-Scale Hypertextual Web Search Engine

目录

搜索市场

据业内分析,今后以百度、Google和雅虎为主的水平搜索的增长将趋缓,而垂直搜索(手机移动搜索)、论坛搜索、本地搜索等未来新兴搜索引擎市场将以30%左右的速度增长,到2010年规模将达到78亿元。

也就是说,水平搜索风光不再,而垂直搜索则方兴未艾,垂直搜索是搜索市场新的“蓝海”。据市场研究机构Kelsey Group预测,在未来5年内,仅美国国内地区搜索市场规模将达34亿美元。

搜索引擎

开源项目

中文资源

相关文章

相关链接

文件:Example.jpg

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱