采集到的是相对网址,缺少了域名部分,要如何手工补上网址的域名部分呢?


举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-5-31 17:31

沙发
ym 版主 发表于 2016-12-20 12:00:45 | 只看该作者
本帖最后由 ym 于 2016-12-20 12:05 编辑

打开数据表,按照如下操作即可批量补上域名部分:
1、把<fullpath>列中的域名部分拷贝出来,粘贴到“链接”列左侧新插入的列里,然后移动鼠标到单元格的右下角,出现+号时,单击鼠标就会在下面的空格里自动填充上域名


2、把域名列和“链接”列拷贝粘贴到新打开的记事本txt里


3、快捷键Ctrl+H弹出替换窗口,把空格部分拷贝到“查找内容”里,然后点击“全部替换”,就可以得到完整的网址


4、最后把完整的网址拷贝粘贴回原来的网址列就完成了


举报 使用道具
板凳
maomao 论坛元老 发表于 2021-5-31 17:13:16 | 只看该作者
采集网页链接时,直接勾上补全网址
举报 使用道具
地板
wangyong 版主 发表于 2021-5-31 17:31:58 | 只看该作者

选中采集链接的抓取内容,点击设置按钮购买补全网址
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-21 00:02