1441#
fishhaichun 高级会员 发表于 2023-9-25 17:08:31 | 只看该作者
请问收集规则是不是改了,以前微博是转发微博的话,是可以收集到被转发微博的原始内容的,现在收集结果的列数明显变少了。按理是能够实现同时抓取的啊
举报 使用道具
1442#
Fuller 管理员 发表于 2023-9-25 20:03:47 | 只看该作者
fishhaichun 发表于 2023-9-25 17:08
请问收集规则是不是改了,以前微博是转发微博的话,是可以收集到被转发微博的原始内容的,现在收集结果的列 ...

你在用哪个工具采集数据,关键词搜索?博主主页?
举报 使用道具
1443#
fishhaichun 高级会员 发表于 2023-9-25 20:32:30 | 只看该作者
Fuller 发表于 2023-9-25 20:03
你在用哪个工具采集数据,关键词搜索?博主主页?

我用的关键词搜索,去年收集到的微博内容是由转帖部分的,最近再收集就没有转发_博主id        转发_博主        转发_博主主页        转发_博主是否认证        转发_博文        转发_博文独立网址        转发_发布时间        转发_发布终端        转发_转发数        转发_评论数        转发_点赞数 这些项了

image.png (3.39 KB, 下载次数: 390)

image.png

image.png (3.39 KB, 下载次数: 410)

image.png
举报 使用道具
1444#
Fuller 管理员 发表于 2023-9-26 10:36:00 | 只看该作者
fishhaichun 发表于 2023-9-25 20:32
我用的关键词搜索,去年收集到的微博内容是由转帖部分的,最近再收集就没有转发_博主id        转发_博主        转发_ ...

此前微博网站曾经改过版,不显示被转发微博,所以,微博工具箱也做了相应调整。现在微博网站又显示这部分内容了,我们正在开发一个专门的快捷采集工具,用来采集被转发微博。快捷采集工具上线后会在这里跟帖通知您
举报 使用道具
1445#
Fuller 管理员 发表于 2023-9-26 12:09:58 | 只看该作者
fishhaichun 发表于 2023-9-25 20:32
我用的关键词搜索,去年收集到的微博内容是由转帖部分的,最近再收集就没有转发_博主id        转发_博主        转发_ ...

增加了一个快捷采集工具,可以采集到含有被转发博文的微博搜索结果:https://www.gooseeker.com/res/rule_860.html

如果要细分时间段,需要自己构造采集网址,比如每个小时一个网址,可以在excel中根据网址规律进行构造,可以参看这个例子:https://www.gooseeker.com/doc/thread-5666-1-1.html
举报 使用道具
1446#
fishhaichun 高级会员 发表于 2023-9-26 12:50:02 | 只看该作者
Fuller 发表于 2023-9-26 12:09
增加了一个快捷采集工具,可以采集到含有被转发博文的微博搜索结果:https://www.gooseeker.com/res/rule ...

谢谢!更新的速度太快了
举报 使用道具
1447#
kosmos 新手上路 发表于 2023-10-12 15:11:32 | 只看该作者
请问爬取的字段只有截图上面这些吗
举报 使用道具
1448#
Fuller 管理员 发表于 2023-10-12 15:57:30 | 只看该作者
kosmos 发表于 2023-10-12 15:11
请问爬取的字段只有截图上面这些吗

哪个微博采集工具?随着网站改版,可以采集到的内容会有些调整,最好先试采一下看看
举报 使用道具
1449#
cingo311 新手上路 发表于 2023-10-15 15:10:40 | 只看该作者
请问采集某账号某一时间段的含有某关键词的微博时,超140字长微博的话只能采集到“展开全文”这四个字,之后的该怎么办呢?
举报 使用道具
1450#
Fuller 管理员 发表于 2023-10-15 16:56:20 | 只看该作者
cingo311 发表于 2023-10-15 15:10
请问采集某账号某一时间段的含有某关键词的微博时,超140字长微博的话只能采集到“展开全文”这四个字,之 ...

把需要采集全文的网址整理出来,导入到这个快捷采集工具中:https://www.gooseeker.com/res/rule_494.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-30 03:43