10 23023

抓取隐藏的@style元素

leixiaola 于 2016-10-27 17:47 发表 [复制链接]
本帖最后由 leixiaola 于 2016-10-27 17:52 编辑

请教抓取隐藏的@style元素

如图所示
需求是i抓取天猫店铺的小图,但是小图在@style中,无法直接提取
请问有什么办法可以抓取到这个url地址呢

举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2016-10-28 12:03

shenzhenwan10 金牌会员 发表于 2016-10-27 17:50:49 | 显示全部楼层
自己写个xpath
举报 使用道具
shenzhenwan10 金牌会员 发表于 2016-10-27 17:51:20 | 显示全部楼层
如果在dom可以找到,就直接做内容映射就可以
举报 使用道具
leixiaola 金牌会员 发表于 2016-10-27 17:52:38 | 显示全部楼层
shenzhenwan10 发表于 2016-10-27 17:51
如果在dom可以找到,就直接做内容映射就可以

dom里面找不到这个元素,无法直接内容映射。
xpath并不是很会写,请大神请教,多谢

举报 使用道具
ym 版主 发表于 2016-10-27 17:52:44 | 显示全部楼层
@style节点是存在html里的,只是MS谋数台没有解析出来,对于这种隐藏的网页信息节点,就不能直接做映射,只能通过自定义xpath来采集。
xpath可以百度教程来学习,也可以在集搜客教程里搜索相关文章来学习。
举报 使用道具
leixiaola 金牌会员 发表于 2016-10-27 17:53:25 | 显示全部楼层
ym 发表于 2016-10-27 17:52
@style节点是存在html里的,只是MS谋数台没有解析出来,对于这种隐藏的网页信息节点,就不能直接做映射,只 ...

请大神指教这个xpath要怎么写呢???拜托
举报 使用道具
Fuller 管理员 发表于 2016-10-27 18:00:31 | 显示全部楼层
这种隐藏的节点,写自定义xpath的时候,必须使用专用定位,定位表达式用DOM上有的节点(在自定义xpath直接做内容映射也是用DOM上有的节点),内容表达式就编一个抓取@style的。

自定义xpath的教程和讨论都可以在教程首页搜索“自定义xpath”得到:http://www.gooseeker.com/tuto/tu ... AE%9A%E4%B9%89xpath
举报 使用道具
leixiaola 金牌会员 发表于 2016-10-27 18:11:20 | 显示全部楼层
xpath正在学习中,但是对于这种隐藏的dom如何精准抓取真是被难道了
有没有大神提供案例对应xpath,不胜感激,欢迎私信
举报 使用道具
leixiaola 金牌会员 发表于 2016-10-27 18:14:53 | 显示全部楼层
我写了一个//*[@class='tm-clear J_TSaleProp tb-img     ']/li[position()=2]
但是抓到的是i文字,不是url 这个要怎么改呢
举报 使用道具
Fuller 管理员 发表于 2016-10-27 18:30:05 | 显示全部楼层
leixiaola 发表于 2016-10-27 18:14
我写了一个//*[@class='tm-clear J_TSaleProp tb-img     ']/li
但是抓到的是i文字,不是url 这个要怎么改 ...

规则名是什么?我加载上来帮你看看
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 18:16