|
| 首页 >> DiY-Page程序开发 >> 采集规则交流 | 【论坛浏览】 【发表新帖】 | |||||
|
子版块 | 87 主题 | 407 帖子 | |||
| 标题 | 作者 | 查看/回复 | 发表时间 | |||
一个DZ论坛的采集,内容表达式不会写http://www.palunion.net/bbs/index.php 参照下论坛的帖子,没有成功,希望版主帮忙下 |
huanyoubei | 524/14 | 2008/9/14 14:36 | |||
采集时出现错误,=====BEGIN:url===== 'http://www.qqzone.org/qq/qzone/daima/list1_1.html' =====END:url===== =====BEGIN:filecontent===== false =====END:filecontent===== =====BEGIN:pattern===== '/\\\\ \\(.*?)\\\\/i... |
Ming | 100/2 | 2008/11/1 21:44 | |||
采集如此简单!怎么都不会?谁不会? 进来留下需要采集的地址 我帮你们写 一天只写一个哦~!~ 呵呵 因为每天我也比较忙的 所以不能帮太多的人 呵呵 再说文爽也没给我发工资 记得写详细点 论坛的采集不知道一样不一样 我没写... |
xinzzz | 281/10 | 2008/10/26 21:06 | |||
采集时老是出错,代码如下=====BEGIN:url===== 'http://www.diypage.com/cn/dp-bbsforum-5-1.html' =====END:url===== =====BEGIN:filecontent===== false =====END:filecontent===== =====BEGIN:pattern===== '/\\\\ array ( ), ... |
jsmm | 162/4 | 2008/10/12 12:19 | |||
帮我看看这个规则怎么错了!{b64}JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ9DCs7W1/dOwJywKICAnY29udm1vZGUnID0+ICdub25lJywKICAnZnRhcmdldCcgPT4gJ3RvYmJzJywKICAnYmJzdXNlcicgPT4gJ2ppdmVzaHUnLAogICdsaXN0dXJsZm9ybWF0JyA9PiAne2I... |
sylershu | 84/4 | 2008/10/29 21:31 | |||
规则报错问题[问题已经解决]问题已经解决.谢谢勇士的热心帮助:) 本帖最后由 rrryyy 于 2008-10-27 15:56 编辑 ] |
rrryyy | 131/3 | 2008/10/23 09:46 | |||
请教:有关采集规则先问下像这样的页面*号应该怎么代替? http://home.ccd.com.cn/Htmls/2008/10/16/2008101617475364855-1.html http://home.ccd.com.cn/Htmls/*.html吗 但是我的还是报错 折腾了很久还是不成功,郁闷的紧 我采集的是... |
cn168 | 81/1 | 2008/10/26 04:38 | |||
能帮我写个这个页面的采集吗能帮我写个这个页面的采集吗? 从十一点弄采集弄到现在,还没搞懂是咋回事,帮我写一个页面的,其它的我可以自己改改. http://www.eju.cn/Design/news.aspx?S=1&T=1&C=61&Title=空间布局&page=2 |
cn168 | 89/1 | 2008/10/26 06:13 | |||
標題亂碼問題我使用UTF-8繁體中文 目標頁未設定以下代碼 *擷取的都會是亂碼,無論編碼是否做轉換 可強制擷取時做編碼鎖定嗎? |
lylm | 97/2 | 2008/10/24 01:02 | |||
DIY站长进来做个交易!我希望我可以得到授权码~! 我是学生` 没什么资金~所以无力够买! 希望可以赠送我授权玛` 希望站没PM给我~ 我会经常给本站发布采集规则~~~~! 外加教大家计划任务的自动发帖 可以设置时间段 演示的话看一下 ... |
、哆啦A夢′ | 171/8 | 2008/10/19 00:44 | |||
采集错误提示=====BEGIN:url===== 'http://yk.zjol.com.cn/06yk/yknews' =====END:url===== =====BEGIN:filecontent===== false =====END:filecontent===== =====BEGIN:pattern===== '/\\\\\\/is' =====END:pattern===== ... |
血狸 | 84/4 | 2008/10/21 13:12 | |||
内容替换问题内容替换的问题 有这么一段代码 hao3gp.com 下载 320*240 我想把www.hao3gp.com/htm_data/2/0810/'thunder替换成thunder 还有把hao3gp.com 下载 替换成 下载 是这样写吗 www.hao3gp.com/htm_data/2/0810/'... |
rrryyy | 96/3 | 2008/10/21 12:59 | |||
采集报错问题...=====BEGIN:url===== 'http://bbs.3gp.cn/forumdisplay.php?fid=9&page=1' =====END:url===== =====BEGIN:filecontent===== ' var discuz_uid = 0;var IMGDIR = \'images/default\';var... |
rrryyy | 71/1 | 2008/10/22 09:30 | |||
出现这样的采集错误=====BEGIN:url===== 'http://www.xinhuanet.com/focus/jrjd.htm' =====END:url===== =====BEGIN:filecontent===== false =====END:filecontent===== =====BEGIN:pattern===== '/\\\\ |
英超 | 109/8 | 2008/10/17 16:39 | |||
文章系统,只采集汉字的疯狂过滤法采集的事情经常碰到同一个网站不同的栏目,内容经常变化 HML标记,会出现意向不到的不想要的格式,开始总要反复查看N个页面,把所有的不需要的格式都过滤掉。包括图片、表格table、表单forn、DIV、字体大小、字体... |
gssasd | 124/4 | 2008/10/18 11:54 | |||
| 如果有人愿意提供,大家就可以照着来做了。 有生成HTML版的还有非静态的,请大家提供一下各大名论坛的规则。方便大家进一步采集! 请在此贴回复,我会做一个整理,谢谢大家!请注明论坛版本,最好是规则详细设置。 |
勇者 | 293/3 | 2008/10/14 23:22 | |||
【求助】我采集来的都是乱码??我的论坛是UTF8 我要采集的论坛是GBK 规则已经写好可以采集(规则中编码选择模式:从采集目标采集来的编码转成UTF8)但是采来的都是乱码?怎么回事啊??求高手帮忙~!谢谢 |
博惠 | 74/1 | 2008/10/17 14:10 | |||
老大,帮写个规则.谢谢!http://blog.ifeng.com/593452.html 能不能采刘墉「世说心语」文字版的内容呀, 谢谢! |
tianyasxb | 81/1 | 2008/10/16 23:21 | |||
请帮忙写个规则目标站地址:http://19free.com.cn/html/asp/index.html 请斑竹帮忙写一下这个站的啊采集规则,我自己写的规则总是不能用全都是提示内容页地址格式或标题和内容有误 谢谢拉``我是真写不对拉才来求教的 |
egok | 119/9 | 2008/10/15 17:31 | |||
关于采采集删除的问题我有个问题我采集过的内容要在哪里能清空呢?我想重新采集,但会提示已经采集过了内容重复不再采集,我已经把内容删除了也提示重复,要怎么才能重新采集内容呢?具休要在哪里清空采集的内容?:handshake :handshake |
飞龙在天 | 96/1 | 2008/10/14 11:45 | |||
可以講一下內容替換表達式怎麼寫/用??可以講一下內容替換表達式怎麼寫/用??:loveliness: |
+_.偉仔 | 274/26 | 2008/10/9 22:29 | |||
請問有人能幫忙寫個規則嗎?http://www.ck101.com/forums/forum-260-1.html 希望有好心人幫我寫這個規則,以後才好參考...知道怎麼寫!!辛勞各位大大了 |
Kyung | 153/8 | 2008/10/9 16:03 | |||
怎样设置多个论坛用户名发帖子呢?论坛发帖用户名 仅当采集数据输入论坛时可用,如果输入的用户名不存在则无法采集 如:u77uuy etemlpj 1z8q0bb nwgcopqp 8t4k80kx 2bq0w0m t2d6gr ... |
bnbnbn | 169/7 | 2008/10/9 15:55 | |||
我采集的是这个页面,始终无法屏蔽分页代码http://home.55188.com/news/yaowen/2008/10/081088293437152G392DA0K547GGK.htm我采集的是这个页面,始终无法屏蔽分页代码,其他采集都正常 规则如下:{b64}JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ8Dtz... |
id123 | 106/3 | 2008/10/8 21:53 | |||
红色代码 分页,无法屏蔽掉截至9月23日,沪深两市1601家A股的平均市净率为2.592倍,仍远远高于成熟市场市净率水平;加权平均市盈率则为... |
id123 | 99/1 | 2008/10/8 21:21 | |||
请求支援!!ID重复不再采集重复的厉害 一个规则根本猜不到什么文章 |
haojay | 112/1 | 2008/10/8 00:43 | |||
这个规则 我怎么就搞不通错在哪里呢???{b64}JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJzI0MCozMjDNvMasaHR0cDovL3d3dy5tZGVzay5jb20uY24vJywKICAnY29udm1vZGUnID0+ICdub25lJywKICAnZnRhcmdldCcgPT4gJ3RvYmJzJywKICAnYmJzdXNlcicgPT4gJ2FkbWluJyw... |
xyhk | 142/1 | 2008/10/6 20:02 | |||
求版主或高手帮我写个规则地址 http://www.duwenzhang.com/wenzhang/renshengzheli/ 这个页面相信不难吧~~~ 谢谢啦 |
花王子 | 369/14 | 2008/10/2 15:13 | |||
新手求助,各路高手请进!我想采集这个网站内容,可是老是出现“内容页地址格式有误 或 内容页的标题和内容表达式均有误 或 网络传输太慢,请 点击此处修改此规则 或 稍后重试,请帮忙查看一下哪里出现问题了? {b64}JGltcG9ydGFycmF5PWF... |
iyie | 124/1 | 2008/10/5 10:21 | |||
大侠帮我修改一下规则{b64}JGltcG9ydGFycmF5PWFycmF5ICgKICAnbmFtZScgPT4gJ9Cjx+y5q7jmJywKICAnY29udm1vZGUnID0+ICdub25lJywKICAnZnRhcmdldCcgPT4gJ3RvYmJzJywKICAnYmJzdXNlcicgPT4gJ7jf0KPQws7FwaqypScsCiAgJ2xpc3R1cmxmb3JtYXQnID0... |
van2449 | 137/2 | 2008/10/3 23:14 | |||
| 共有主题数 261 每页显示 30 | 页码 2/9 |< << 1 2 3 4 5 6 7 >> >| | |||||