
经测试合格的采集规则由版主移动到这里。方便新手迅速收集采集规则。
子版块 主题: 119 帖子: 505

本人是菜鸟,正在学习DIYPAGE的采集,看了教程和下载各位领导的规则仔细研究,自己做了一个站的采集。 但是有些问题处理不好,请组织上拉兄弟一把。 具体是这样,我采的是图片站,页面含有HTML代码,采集到论坛后...
作者: kingbad 查看/回复: 246/5 发表时间: 2009/3/9 03:59

=====BEGIN:url===== 'http://bbs.angle32.cn/read-htm-tid-769-page-1-fpage-1.html">1 2 3 4 5 .. 23 \\/is' =====END:pattern_1===== =====BEGIN:matches_1===== array ( 0 => array ( ), 1 => ...
作者: bubua 查看/回复: 14/1 发表时间: 2009/6/19 04:40

我自己设计了,就是采集不了,郁闷 股城论坛 研究报告区 http://bbs.stockcity.cn/showforum-33.aspx
作者: futoo 查看/回复: 16/1 发表时间: 2009/6/18 17:50

http://news.sohu.com/news_scrollnews.shtml 搜狐新闻中心
作者: zzm7074 查看/回复: 13/1 发表时间: 2009/6/18 21:39

因为我过滤得太多.造成一个贴子80%面积空格...我要怎么才能过滤掉?? 谢谢了.
作者: youth1111 查看/回复: 46/2 发表时间: 2009/6/16 01:33

哪位仁兄来帮我写下采集 十分感谢 地址如下: http://www.swuyc.edu.cn/swuyc/Index.do?method=getNewsPaging
作者: whs164 查看/回复: 85/2 发表时间: 2009/6/11 07:37

有人可以提供明報即時新聞的采集規則嗎? http://inews.mingpao.com/htm/INews/20090613/allindex.htm 弄了半天也弄不了 謝謝 錯誤報告:=====BEGIN:url===== 'http://inews.mingpao.com/htm/INews/1/allinde...
作者: spencersin 查看/回复: 57/2 发表时间: 2009/6/13 13:33

JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ+eou+iNieS6uummmea4r+aWsCDogZ4gJywKICAnY29udm1vZGUnID0+ICdiMnUnLAogICdmdGFyZ2V0JyA9PiAndG9iYnMnLAogICdiYnN1c2VyJyA9PiAn54uC5Lq6JywKICAnbGlzdHVybGZvcm1h...
作者: basic 查看/回复: 59/1 发表时间: 2009/6/9 03:21

JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ+WHuOWNgCcsCiAgJ2NvbnZtb2RlJyA9PiAnbm9uZScsCiAgJ2Z0YXJnZXQnID0+ICd0b2JicycsCiAgJ2Jic3VzZXInID0+ICfni4Lkuro777yzTe+8szs4JywKICAnbGlzdHVybGZvcm1hdCcgPT4g...
作者: basic 查看/回复: 66/1 发表时间: 2009/6/8 13:40

http://xzh.app.mop.com/
作者: gaoyaolove 查看/回复: 85/1 发表时间: 2009/6/6 18:53

JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ7z1t8oyJywKICAnY29udm1vZGUnID0+ICdub25lJywKICAnZnRhcmdldCcgPT4gJ3RvYmJzJywKICAnYmJzdXNlcicgPT4gJ2FkbWluJywKICAnbGlzdHVybGZvcm1hdCcgPT4gJ1tiNjRdYUhSMGNE...
作者: yy987509 查看/回复: 81/1 发表时间: 2009/6/4 11:08

http://www.XXXXXXXX.com/forum-3-1.html 采集这个网站的,用了这个规则,提示 内容页中的标题表达式 有误 请大家帮忙,谢谢。 JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ8PAyrMnLAogICdjb252bW9kZScgPT4g...
作者: yy987509 查看/回复: 92/4 发表时间: 2009/6/3 17:34

显示故障代码如下=====BEGIN:url===== 'http://www.sunvv.com/list/2_1.html' =====END:url===== =====BEGIN:filecontent===== false =====END:filecontent===== =====BEGIN:pattern===== '/\\(.*?)\\/is' ===...
作者: 冰城渔民 查看/回复: 82/1 发表时间: 2009/6/3 16:05

JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ3NzJywKICAnY29udm1vZGUnID0+ICdub25lJywKICAnZnRhcmdldCcgPT4gJ3RvYmJzJywKICAnYmJzdXNlcicgPT4gJ2dhb3lhb2xvdmU7tPO6/tau19M7Z2FveWFvO8DLyMs7tLrT6jvF89PRcmxv...
作者: gaoyaolove 查看/回复: 91/1 发表时间: 2009/6/1 22:25

http://www.512bar.com/?action-category-catid-7
作者: gaoyaolove 查看/回复: 86/1 发表时间: 2009/6/2 00:55

http://www.sssz.cn/forum-153-2.html 这个站的内容页中的内容表达式总也找不到,输入这个*,只显示帖子的ID
作者: gaoyaolove 查看/回复: 87/2 发表时间: 2009/6/1 00:11

再麻烦老师请教两个问题 一、在新建采集规则时,在 内容页地址格式里有两个变量,即日期和文章的ID是在变的,如何编写? 二、有的文章内容是两页以上的,用教程里的纺写规则采集只能采集到第一页的内容,包括第2...
作者: myc2009 查看/回复: 79/1 发表时间: 2009/5/31 11:41
用自己编写的采集规则采集到的内容是乱码如何解决?
作者: myc2009 查看/回复: 86/1 发表时间: 2009/5/30 15:59

6.0的自动采集是首页驱动还是所有页面驱动?
作者: 刀片 查看/回复: 128/1 发表时间: 2009/5/27 10:44

开始不成功 过一会就好 ,就是采集不到下载地址?? {b64}JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ87ez74nLAogICdjb252bW9kZScgPT4gJ25vbmUnLAogICdmdGFyZ2V0JyA9PiAndG9kcGNtcycsCiAgJ2Jic3VzZX...
作者: liuzoom 查看/回复: 81/2 发表时间: 2009/5/25 10:51
JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ7mks8zN+CcsCiAgJ2NvbnZtb2RlJyA9PiAndTJnJywKICAnZnRhcmdldCcgPT4gJ3RvZHBjbXMnLAogICdiYnN1c2VyJyA9PiAnwK22obSry7UnLAogICdsaXN0dXJsZm9ybWF0JyA9PiAnW2I2NF1h...
作者: fk1985 查看/回复: 204/13 发表时间: 2009/5/16 11:17
JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ8Pxycy3qMLJ18nRryCh+iDWqsq2svrIqCcsCiAgJ2NvbnZtb2RlJyA9PiAnbm9uZScsCiAgJ2Z0YXJnZXQnID0+ICd0b2JicycsCiAgJ2Jic3VzZXInID0+ICdseXpoZycsCiAgJ2xpc3R1cmxmb3Jt...
作者: lyzhg 查看/回复: 94/2 发表时间: 2009/5/25 10:25

本人是新手,高手请跳过,谢谢 有很多朋友和我一样,在写采集过程中会出现一个问题,就是我们呢的目标站是gb2312,然而我们测试的时候确是UTF-8,如果不改的话,我们采集过来就是乱码,所以,我们只要重新编辑下采...
作者: cl_yunjie 查看/回复: 112/4 发表时间: 2009/5/24 15:19

1、图片到本地。好处是避免因为别的网站完蛋了,自己的网站变成小红叉。还有利于网站优化。懂点的都知道alt是咋回事。 2、分页采集。一篇好的文章谁都不想看一半或者一段。 3、内容替换。这个也是采集变原创的...
作者: 刀片 查看/回复: 102/1 发表时间: 2009/5/24 11:09

哪位大侠帮忙写个采集规则 谢谢 http://bbs.examda.com/thread.php?fid=305&page=1 我要采集这个页面 帮帮忙咯
作者: cl_yunjie 查看/回复: 119/2 发表时间: 2009/5/23 16:13

=====BEGIN:url===== 'http://www.it.com.cn/mobile/shanzhai/news/2009/05/13/14/524693.html' =====END:url===== =====BEGIN:filecontent===== ' 拉低CDMA芯片价30%威盛憧憬联发科第二 IT.com.cn IT世界网-买...
作者: fk1985 查看/回复: 123/3 发表时间: 2009/5/19 16:42

帮我写10个站的采集规则!每个站1条就行了,反正改改就可以用了! 每条3块钱!一共30块!我可以把钱给DP大大!你再给我规则也行!或则信得过我的,我用上了,直接给你付也行!一点点钱,我不会欠谁的! 我是 货源...
作者: 货源114 查看/回复: 125/1 发表时间: 2009/5/19 00:19

JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ0E11b6zpNDCzsUnLAogICdjb252bW9kZScgPT4gJ25vbmUnLAogICdmdGFyZ2V0JyA9PiAndG9kcGNtcycsCiAgJ2Jic3VzZXInID0+ICcnLAogICdsaXN0dXJsZm9ybWF0JyA9PiAnW2I2NF1hSFIw...
作者: go123 查看/回复: 140/5 发表时间: 2009/5/8 16:42

JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ9DCwMu+/MrCJywKICAnY29udm1vZGUnID0+ICdub25lJywKICAnZnRhcmdldCcgPT4gJ3RvYmJzJywKICAnYmJzdXNlcicgPT4gJ8CttqG0q8u1JywKICAnbGlzdHVybGZvcm1hdCcgPT4gJ1tiNjRd...
作者: fk1985 查看/回复: 94/2 发表时间: 2009/5/15 16:30
我弄了 好几天了, 都没弄出来,郁闷了
作者: 张家口惜缘 查看/回复: 225/14 发表时间: 2009/5/7 16:15