1451#
Fuller 管理员 发表于 2023-10-12 15:57:30 | 只看该作者
kosmos 发表于 2023-10-12 15:11
请问爬取的字段只有截图上面这些吗

哪个微博采集工具?随着网站改版,可以采集到的内容会有些调整,最好先试采一下看看
举报 使用道具
1452#
cingo311 新手上路 发表于 2023-10-15 15:10:40 | 只看该作者
请问采集某账号某一时间段的含有某关键词的微博时,超140字长微博的话只能采集到“展开全文”这四个字,之后的该怎么办呢?
举报 使用道具
1453#
Fuller 管理员 发表于 2023-10-15 16:56:20 | 只看该作者
cingo311 发表于 2023-10-15 15:10
请问采集某账号某一时间段的含有某关键词的微博时,超140字长微博的话只能采集到“展开全文”这四个字,之 ...

把需要采集全文的网址整理出来,导入到这个快捷采集工具中:https://www.gooseeker.com/res/rule_494.html
举报 使用道具
1454#
fishhaichun 高级会员 发表于 2023-10-18 21:24:36 | 只看该作者
Fuller 发表于 2023-9-26 12:09
增加了一个快捷采集工具,可以采集到含有被转发博文的微博搜索结果:https://www.gooseeker.com/res/rule ...

能否提个改善意见。关键词搜索的收集工具能否把转发部分的微博收集也添加回去。虽然非常给力开发了新的采集工具,但是这个采集工具的分小时的网址没办法自动生成,大量采集的时候实在是很麻烦。

关键词搜索工具不能收集转发部分的微博倒也罢了,查看收集的结果发现,微博博主的部分,显示的是被转发的ID和名字,但是微博内容缺失转发人的评论,这样其实微博博主跟微博内容是不对应的。这样张冠李戴,费好多时间收集的数据就都没办法用了。
或者把新的采集工具的自动生成收集网址解决一下,那样也就跟以前的收集方式没有分别了。
非常感谢!
举报 使用道具
1455#
fishhaichun 高级会员 发表于 2023-10-24 11:46:52 | 只看该作者
请问生成的收集网址有什么办法能批量导出吗
举报 使用道具
1456#
Fuller 管理员 发表于 2023-10-24 15:50:00 | 只看该作者
fishhaichun 发表于 2023-10-24 11:46
请问生成的收集网址有什么办法能批量导出吗

生成网址的功能还在开发中,还没有开发完
举报 使用道具
1457#
Fuller 管理员 发表于 2023-10-24 18:21:46 | 只看该作者
fishhaichun 发表于 2023-10-24 11:46
请问生成的收集网址有什么办法能批量导出吗

今天已经开发完了,正在测试,明天上午就能上线生成网址功能
举报 使用道具
1458#
Fuller 管理员 发表于 2023-10-25 09:46:49 | 只看该作者
fishhaichun 发表于 2023-10-24 11:46
请问生成的收集网址有什么办法能批量导出吗

生成网址的功能已经上线了
第一步:在微博关键词搜索采集工具界面上点击“细分条件”按钮,设置细分条件,点击“预览生成的网址”

第二步:需用手工选择,只需点击“复制”按钮,就可把内容复制到剪贴板。转到快捷采集页面,用ctrl+V按钮可以粘贴上,也可以粘贴到记事本等编辑器上

举报 使用道具
1459#
fishhaichun 高级会员 发表于 2023-10-25 23:29:37 | 只看该作者
Fuller 发表于 2023-10-24 18:21
今天已经开发完了,正在测试,明天上午就能上线生成网址功能

你们的技术支持太给力了。谢谢
举报 使用道具
1460#
kento_羊林 新手上路 发表于 2023-10-26 22:44:40 | 只看该作者
很好用,谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-30 07:57