2 6621

微博只能爬取16条信息

Dongsiwei 于 2020-11-22 22:07 发表 [复制链接]
大家好,我想请教一下大家一个问题:我有一个规则,定义是按照b站上的一个视频做的,也设置了翻页线索,但是我试了好几次,不管怎么改都只能爬取16条微博信息,这是哪里出错了呢
规则名字:weiboyiq

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-11-22 22:28

Fuller_test202012 初级会员 发表于 2020-11-22 22:24:15 | 显示全部楼层
我测试了你的规则,没有问题,应该是你设置爬虫软件的滚屏参数不对,要打开滚屏功能,滚屏次数设置15以上吧,博主网页很长,一个网页上有45条微博,滚屏次数一定要足够多。

如果你用的是最新版数据管家(增强版网络爬虫软件),那么设置界面是这样的。如果你用的是老的爬虫软件,是在DS打数机菜单上设置 配置-》滚屏参数。建议升级到最新版数据管家。

另外,采集微博一定要在数据管家软件的浏览器中登录微博

滚屏20201122222247.png
举报 使用道具
Dongsiwei 新手上路 发表于 2020-11-22 22:28:29 | 显示全部楼层
Fuller_test202012 发表于 2020-11-22 22:24
我测试了你的规则,没有问题,应该是你设置爬虫软件的滚屏参数不对,要打开滚屏功能,滚屏次数设置15以上吧 ...

谢谢
,十分感谢!!!!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 17:33