http://fund.jrj.com.cn/jjsxq/
这是我要抓取数据的地址,过程是点击lof按钮,点击股票型按钮,点击筛选按钮,可以得到37个基金,然后翻页抓取基金简称,基金代码。
就这样,我看过你们的一些教程,我发现做不来,我先是做3个点击的连续动作,但是没有下级线索,那我怎么抓取这37个基金的数据呢?
版主能不能详细的解说下。或者给个相似的教程??先写过了
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-1-9 21:43

沙发
Fuller 管理员 发表于 2016-1-8 23:03:41 | 只看该作者
前面两步要点的按钮,我要试试才行,本来下个版本才支持这样的按钮。如果能点,下面的操作就不成问题了。

37个基金,你想进入每个网页抓取详细内容对吧?所以要定义下级线索,下级线索的抓取 方法与普通内容没有太大区别,所以,你不用担心下级线索抓不到。

不要误以为立即从第一级进入第二级,不是那样的。在抓这37个基金简称的时候,只是把下级的网址抓下来。不是立即运行第二级。

第二级是分开运行的,可以在本电脑的另一个窗口同时运行,也可以在另外的计算机上运行
举报 使用道具
板凳
Fuller 管理员 发表于 2016-1-8 23:33:32 | 只看该作者
明天我试一下
举报 使用道具
地板
myz8110 初级会员 发表于 2016-1-9 21:38:46 | 只看该作者

尽快出这样的版本吧,我试过一个叫八爪鱼的网络爬虫软件,可以做到这点,但是他们也有他们的缺点,速度不快,重复数据很多,付费系统比较坑,看来网络爬虫软件的提升空间还有很大啊。
举报 使用道具
5#
myz8110 初级会员 发表于 2016-1-9 21:43:19 | 只看该作者

还有他们软件的操作比你们的还要“傻瓜式“,不过我估计你们也知道的,知己知彼,方能百战百胜嘛!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 16:19