Heritrix

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索

2008年6月2日 (一) 12:35的版本

Heritrix: Internet Archive Web Crawler

The archive-crawler project is building a flexible, extensible, robust, and scalable web crawler capable of fetching, archiving, and analyzing the full diversity and breadth of internet-accesible content.

GNU LGPL

Programming Language : Java

Links

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱