最新消息:请随时分享你的乐趣!

标签:Nutch

技术博客

Nutch2.x on Hbase 命令解释

磊子 2年前 (2014-10-23) 1191浏览 0评论

  crawl过程: 1. inject 将seed.txt 保存到数据库 nutch inject urls/ -crawlId mytest 2. generate 就是将数据库中的这个种子解析N多(深度就+1)。然后再保存回去(we...