Baidu

来自开放百科 - 灰狐
2009年1月12日 (一) 15:26Allen (讨论 | 贡献)的版本

跳转到: 导航, 搜索
Logo baidu.gif

2000年1月1日,公司创始人李彦宏、徐勇携120万美元风险投资,从美国硅谷回国,创建了百度公司。创立之初,百度就将自己的目标定位于打造中国人自己的中文搜索引擎,并愿为此目标不懈的努力奋斗。

2000 年5月,百度首次为门户网站——硅谷动力提供搜索技术服务,之后迅速占领中国搜索引擎市场,成为最主要的搜索技术提供商。2001年8月,发布 Baidu.com搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式,2001年10月22日正式发布Baidu 搜索引擎。

2005年8月5日,百度在美国纳斯达克上市,成为2005年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。

“百度一下”已经成为了人们进行搜索的新动词。

目录

百度文化

  • 用户导向: 坚持以用户需求为导向
  • 分享: 不断学习总结并积极分享
  • 求实: 坚持坦诚和实事求是的作风
  • 系统: 从系统的角度思考解决问题
  • 卓越: 拥抱挑战和变化,追求卓越
  • 惜时: 珍惜并善于管理时间

管理团队

李彦宏
  • 李彦宏

李彦宏最先创建了ESP技术,并将它成功的应用于INFOSEEK/GO.COM的搜索引擎中。GO.COM的图像搜索引擎是他的另一项极其具有应用价值的技术创新。1996年,他首先解决了如何将基于网页质量的排序与基于相关性排序完美结合的问题,并因此获得了美国专利.

威廉.张
  • 首席科学家

2007年1月,威廉.张(William I. Chang)加入百度,任首席科学家。

张以纬: 他出生在中国台湾,是一个加州华人,在风起云涌的互联网风潮世界中,被誉为当今世界上最为领先的搜索引擎技术工程师、互联网战略发展专家之一。

威廉.张为全球最具盛名的搜索引擎专家之一。威廉.张当年在哈佛大学取得数学学士学位,之后又以次线性文本匹配算法上的突破性成果获得美国加州大学柏克利分校的计算机专业博士学位。1990年代中,威廉•张即投身互联网搜索引擎技术研究,是这一新兴领域的开拓者之一。1996年6月,威廉•张担任 Infoseek的CTO。期间,他主持研发的Infoseek的自然语言搜索引擎Ultraseek,是最受欢迎的早期互联网搜索引擎之一,其企业应用版本至今还广为使用。当Disney入股 Infoseek后,推出了Go Network,威廉•张担任Go Network的战略副总裁,具体负责制定新型媒体网络中市场、社区与商务的整合战略。2001年夏天,他创建了Affini公司,继续将他对未来互联网的预见付诸于实践。(来源: http://www.baidu.com/about/02.html)

威廉.张创办的公司Affini: http://www.affini.com/

功能特点

1. 基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和查全率。

2. 支持主流的中文编码标准。包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。

3. 智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。

4. 检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串,便于用户判断是否阅读原文。

5. 百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。

6. 相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%。

7. 运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的平均响应时间小于0.5秒)

8. 可以提供一周、二周、四周等多种服务方式。可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。

9. 检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。

10. 智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。

11. 分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。每个部分均采用N+1的冗余设计,1台服务器时刻处于备用状态。因而整个系统能在99.9%的时间内提供高可用性和高稳定性的服务。

12. 高可配置性使得搜索服务能够满足不同用户的需求。在搜索调度、相关性评价、内容过滤、显示方式等方面均为客户提供了可配置手段,使系统具有很大的灵活性和适应性。ICP站点通过调用百度搜索引擎的应用编程接口(API)调用搜索服务,由他们自行决定搜索结果的显示方式,加入自己的广告和公司图标(logo)。

13. 先进的网页动态摘要显示技术。可以动态摘要显示网页中含有用户查询字串的任意位置文字,使用户阅读和判断搜索结果更方便更快捷。

14. 独有百度快照,巧妙解决了搜索用户经常遇到的死链接问题。百度搜索引擎已先预览各网站,拍下网页的快照,为用户贮存大量的应急网页。百度快照不仅下载速度极快,而且已将用户查询字串用不同颜色在网页中标记。

15. 支持多种高级检索语法,使用户查询效率更高、结果更准。已支持"+"(AND)、"-"(NOT)、"|"(OR)、"site:"、"link:",还将继续增加其它高效的搜索语法。

来源网络,不断补充中.....

百度招聘

这里的一些话语对大家会有一定启发:

  • 每一个程序都要经受上亿流量的考验!
  • 自己的产品被亿万人使用、喜爱、依赖!
  • 科学面前人人平等,这里只相信数据和逻辑!
  • 让我们一起用技术改变世界!!
  • 拥有数千上万台服务器,全世界最大的并行集群之一,如何聪明、高效的管理它们,完成一秒钟都不能宕机的复杂运维任务?
  • ......

从人员招聘信息中可以了解到搜索引擎所涉及的技术,了解要做搜索引擎要做哪方面的研究和技术储备。嘿嘿,想做 Search Engine 的朋友可考虑在这些方面做更多沉淀。

http://hr.baidu.com/job.php?ct=1

百度服务导航

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱