timeout to loud the page/等待超时/数据抓取失败怎么解决
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2015-11-11 21:43

沙发
wangyong 版主 发表于 2015-10-16 11:40:27 | 只看该作者
本帖最后由 wangyong 于 2015-10-16 11:41 编辑

timeout to loud the page表示抓取失败没有结果文件生成,最根本的原因可能是抓取规则做的不适应,到谋数台中加载打数机底部日志显示的线索编号,谋数台会分析规则有什么错误。
按线索编号加载规则参看:http://www.gooseeker.com/doc/thread-450-1-1.html

除了规则问题还有就是打数机超时时长设置过短,在打数机配置菜单栏中可根据抓取网页实际情况设置超时时长


举报 使用道具
板凳
Anna J 中级会员 发表于 2015-11-10 11:57:22 | 只看该作者
出现验证码不管它的话,也会timeout
举报 使用道具
地板
Fuller 管理员 发表于 2015-11-10 12:27:00 | 只看该作者
Anna J 发表于 2015-11-10 11:57
出现验证码不管它的话,也会timeout

如果是需要输入验证码登录,GooSeeker有自动输入验证码功能。如果是抓取过程中出现验证码,目前版本还没有自动录入的功能
举报 使用道具
5#
Anna J 中级会员 发表于 2015-11-10 14:11:51 | 只看该作者
Fuller 发表于 2015-11-10 12:27
如果是需要输入验证码登录,GooSeeker有自动输入验证码功能。如果是抓取过程中出现验证码,目前版本还没 ...

抓取过程出现的验证码
举报 使用道具
6#
Fuller 管理员 发表于 2015-11-11 21:43:04 | 只看该作者
Anna J 发表于 2015-11-10 14:11
抓取过程出现的验证码

抓取过程出现验证码,等未来的版本吧,或者发起一个定制服务请求,专门赶制一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 23:06