规则名称“电视剧宣发微博物料采集”爬取网址:https://weibo.com/p/1002066150454520/photos?from=page_100206&mod=TAB#place

规则很简单,测试窗口可以直接拉到最后一张图。
刚开始只能爬取一小半,后来发现可能是滚动刷新速度问题,将调整滚屏参数调整为2/-1。
爬取数量增多,但还是爬取到3/4时就会显示【总线索:1 Loops】然后闪几下就显示采集完成。
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-5-9 15:06

wangyong 版主 发表于 2020-5-9 14:52:39 | 显示全部楼层
滚屏参数还是小了,需要改成20/-2,超时时长改成120秒
举报 使用道具
Fuller 管理员 发表于 2020-5-9 15:06:52 | 显示全部楼层
1和-1是一样的,没有变速,2,3,4,5...越来越快,-2,-3,-4,..... 越来越慢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 19:43