网页抓取软件MetaSeeker v4.11.7 bug公告

最近,由于Firefox版本升级过快,MetaSeeker不得不快速跟进。然而,自从Firefox 4.0开始,Mozilla XULRunner的API不再承诺保持不变,Firefox每个版本的底层函数库都有改变,这给MetaSeeker的版本跟随造成很大困难。由于MetaSeeker功能很多,Firefox版本升级很快就给MetaSeeker做充分的回归测试预留的时间很少。

今天发现在滚屏抓取新浪微博时,网络爬虫引擎遇到异常,不能正常运行,在日志中显示错误“Null content Window”。

原来,到Firefox 6.0以后,Firefox窗口管理机制改变了,造成Null window错误。

请尽快下载最新MetaSeeker V4.11.7版本。版本号没有升高,只是升高了build号。

在试用滚屏抓取时需要注意:
1)只有抓取AJAX动态网页时,而且设置了AJAX抓取选项(延长模式,积极模式),滚屏抓取才有效
2)More Pages 〉0 时,滚屏抓取才生效
3)需要打开“全屏显示”选项,这样做,需要滚屏的次数就会减少