本帖最后由 goGooSeeker 于 2016-9-5 19:58 编辑

我采集的信息在第1屏-第10屏之间,
但是页面总共有上百屏,
每次采集都要浪费时间滚到底。

我看了连续动作里面的滚屏好像是设置滚屏完再滚屏的次数的,
我这种情况有办法设置解决吗?比如说只滚前10屏
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2016-9-5 19:57

沙发
Fuller 管理员 发表于 2016-9-5 15:26:34 | 只看该作者
连续动作能控制具体的滚屏次数,连续动作的滚屏会产生很多结果文件,滚一次产生一个结果文件
举报 使用道具
板凳
goGooSeeker 初级会员 发表于 2016-9-5 16:21:09 | 只看该作者
Fuller 发表于 2016-9-5 15:26
连续动作能控制具体的滚屏次数,连续动作的滚屏会产生很多结果文件,滚一次产生一个结果文件 ...

嗯嗯,这个我已经清楚了,我如上描述的问题有办法设置解决吗?就是只采集第1-10屏的内容,剩下的屏就不要滚了,直接跳过采集下条,不然太浪费时间了
举报 使用道具
地板
Fuller 管理员 发表于 2016-9-5 16:37:02 | 只看该作者
goGooSeeker 发表于 2016-9-5 16:21
嗯嗯,这个我已经清楚了,我如上描述的问题有办法设置解决吗?就是只采集第1-10屏的内容,剩下的屏就不要 ...

连续动作中的滚屏可以设置次数的,就设置10
举报 使用道具
5#
goGooSeeker 初级会员 发表于 2016-9-5 16:58:55 | 只看该作者
Fuller 发表于 2016-9-5 16:37
连续动作中的滚屏可以设置次数的,就设置10

我在   工作台 -> 连续动作 -> 滚屏  里面设置
不论是
每次滚屏数10,总共滚屏数1
还是
每次滚屏数1,总共滚屏数10
都会在采集网页的时候滚到底
举报 使用道具
6#
Fuller 管理员 发表于 2016-9-5 17:07:07 | 只看该作者
goGooSeeker 发表于 2016-9-5 16:58
我在   工作台 -> 连续动作 -> 滚屏  里面设置
不论是
还是

应该用后者

检查一下DS打数机的菜单 配置-》滚屏参数,在这里滚屏次数要设置成0,看看是否有效果。
举报 使用道具
7#
goGooSeeker 初级会员 发表于 2016-9-5 17:37:13 | 只看该作者
本帖最后由 goGooSeeker 于 2016-9-5 17:39 编辑
Fuller 发表于 2016-9-5 17:07
应该用后者

检查一下DS打数机的菜单 配置-》滚屏参数,在这里滚屏次数要设置成0,看看是否有效果。

经过测试,滚屏10次是如下参数:
工作台 -> 连续动作:
每次滚屏数10,总共滚屏数1
DS打数机 -> 滚屏参数
滚屏次数0
滚屏速度2

但是有个问题, 每次会自动生成2个采集文件,原本是生成1个的。
我在其他参数不变的情况下把总共滚屏数改为-1,就会无限采集生成当前页面
改为0还是每次自动生成2个采集文件,2个采集文件是重复相同的
举报 使用道具
8#
ym 版主 发表于 2016-9-5 18:19:27 | 只看该作者
goGooSeeker 发表于 2016-9-5 17:37
经过测试,滚屏10次是如下参数:

但是有个问题, 每次会自动生成2个采集文件,原本是生成1个的。

滚屏一次就增加生成一个xml文件,可以导入到excel中过滤重复内容
举报 使用道具
9#
goGooSeeker 初级会员 发表于 2016-9-5 19:57:59 | 只看该作者
ym 发表于 2016-9-5 18:19
滚屏一次就增加生成一个xml文件,可以导入到excel中过滤重复内容

ok,已解决,感谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 07:50