6 8262

数据采集不全

maple0000 于 2019-7-12 10:06 发表 [复制链接]
采集任务名:搜房网大连房产经纪人
问题1:每页数据采集不全,如一页有20条数据,只采集了15条(设置了翻页,第一页采集了15条,第二页13条,最后一个只有3条)
问题2:设置了【下一页】作为翻页记号,但只采集了38页(总数200页)就停止了。


举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2019-7-12 11:10

Fuller 管理员 发表于 2019-7-12 10:10:42 | 显示全部楼层
样例复制20190712100939.png

样例复制应该选第一条和第二条,你选的却是第二和三条,那么一定会漏数据
举报 使用道具
Fuller 管理员 发表于 2019-7-12 10:29:04 | 显示全部楼层
我已经采集到83页了,没有问题
举报 使用道具
maple0000 新手上路 发表于 2019-7-12 10:39:07 | 显示全部楼层

我是这样设置的

BEB46W7EXWEGJFOTE3N]{@C.png
1562898086(1).jpg
举报 使用道具
maple0000 新手上路 发表于 2019-7-12 10:41:28 | 显示全部楼层
样例复制应该选第一条和第二条,你选的却是第二和三条
这个我不知道怎么弄
举报 使用道具
Fuller 管理员 发表于 2019-7-12 10:51:32 | 显示全部楼层
maple0000 发表于 2019-7-12 10:41
样例复制应该选第一条和第二条,你选的却是第二和三条
这个我不知道怎么弄 ...

选中第一个人名,样例复制给第一个,选中第二个人名,样例复制给第二个
举报 使用道具
maple0000 新手上路 发表于 2019-7-12 11:10:29 | 显示全部楼层
好了,谢谢了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 17:04