发新话题
打印

采集规则先采最第一页再采后页报重复采集

采集规则先采最第一页再采后页报重复采集

第一次采集,只采了第一页,从1到1
第二次采集,从2到2,报已重复采集,不采第2页

TOP

你把具体错误信息帖上来,因为里面会有我需要的详细信息
DiY-Page作者
如有问题请发帖 勿发短消息
中国人民大学 知行二楼

TOP

{b64}JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ7uqsbEnLAogICdjb252bW9kZScgPT4gJ25vbmUnLAogICdmdGFyZ2V0JyA9PiAndG9iYnMnLAogICdiYnN1c2VyJyA9PiAnuN/Qo9DCzsXBqrKlJywKICAnbGlzdHVybGZvcm1hdCcgPT4gJ3tiNjR9YUhSMGNEb3ZMM2QzZHk1amRXNWxkM011WldSMUxtTnVMMEZ5ZEdsamJHVXZVMmh2ZDBOc1lYTnpMbUZ6Y0Q5RGJHRnpjMGxFUFRFbWNHRm5aVDBxJywKICAnZmlyc3RsaXN0dXJsZm9ybWF0JyA9PiAne2I2NH1hSFIwY0RvdkwzZDNkeTVqZFc1bGQzTXVaV1IxTG1OdUwwRnlkR2xqYkdVdmFIVmhZbVZwTHc9PScsCiAgJ2VudHJ5dXJsZm9ybWF0JyA9PiAne2I2NH1hSFIwY0RvdkwzZDNkeTVqZFc1bGQzTXVaV1IxTG1OdUwwRnlkR2xqYkdVdmFIVmhZbVZwTHlvdWFIUnRiQT09JywKICAnbGlzdHBhdHRlcm4nID0+ICd7YjY0fVBHRWdZMnhoYzNNOVhDSnNhWE4wUVZ3aUlHaHlaV1k5WENJdlFYSjBhV05zWlM5b2RXRmlaV2t2S2k1b2RHMXNYQ0lxUEM5aFBnPT0nLAogICdhcnRpY2xlaWRubycgPT4gMSwKICAndGl0bGVwYXR0ZXJuJyA9PiAne2I2NH1QSFJwZEd4bFBpbzhMM1JwZEd4bFBnPT0nLAogICd0aXRsZW5vJyA9PiAxLAogICdjb250ZW50cGF0dGVybicgPT4gJ3tiNjR9UEhSa0lHTnNZWE56UFdOdmJuUmxiblFnYVdROVptOXVkSHB2YjIwcVBpbzhkR1FnWTJ4aGMzTTlRWEowYVdOc1pWOTBaR0puWVd4c0lHRnNhV2R1UFhKcFoyaDBJR052YkZOd1lXNDlNajQ9JywKICAnY29udGVudG5vJyA9PiAyLAogICd0cmltcGF0dGVybicgPT4gJ3tiNjR9UEhSaFlteGxLand2ZEdGaWJHVSsnLAogICdzdGFydHBhZ2UnID0+IDksCiAgJ2VuZHBhZ2UnID0+IDksCiAgJ2NhdGFpZCcgPT4gMTkwLAogICd1c2VhdXRvJyA9PiAwLAopOw==

TOP

也不是报错,就是已经成功采集从1到1,第二次采集,设置从2到2,却仍然从1到1开始采集,提示报已内容已采集,文章重复,采集完成就不采第2页

TOP

重复应该是
ID为XXX的文章与数据库中的记录重复
DiY-Page作者
如有问题请发帖 勿发短消息
中国人民大学 知行二楼

TOP

引用:
原帖由 wenshuang 于 2008-9-29 00:50 发表
重复应该是
ID为XXX的文章与数据库中的记录重复
提示的确如此

但我没让采已经采集过的页面,为什么还提示已经重复?

而且需要采集后页内容,却仍然没有采集

TOP

我就是在问你ID是什么……
DiY-Page作者
如有问题请发帖 勿发短消息
中国人民大学 知行二楼

TOP

发新话题