B站用户信息简析

前言

免责声明

首先声明一下,本文提供的所有信息仅供参考,实际信息请以官方数据为准。如果文章出现错误请在评论区或私信指正。


样本信息

样本范围:UID1~UID1800000000(大概?)

抓取项目:用户UID,用户名称,用户简介,用户性别,用户头像(url),用户权限,用户等级,封禁信息,大会员到期时间,硬核会员信息

实际数量:764,983,159

数据库大小:66.98G(除主键外无索引)

(因为各种复杂原因可能有一百万左右的数据没有被抓取到)


想说的话

嗯。。。抓取这个的确挺折磨的,时不时就会因为各种原因导致程序停止运行。有一次调试忘了配置代理池,结果本人IP下的所有账号全部被风控并要求强制实名,基本B站大小号都废了。最后坚持到uid18亿的时候,B站的维护人员又把api返回逻辑修改了(估计是因为数据库调用压力太大)于是我不得不放弃了爬取计划。文章本来是想发在B站,因为这个搞的我挺不好意思,所以就发在喵御宅了。最后在进行数据库合并的时候内存溢出好几次,最终也未能合并,所以分析的时候还是用的分流查询。。。


正文


用户等级

抓取到的数量如下:

LV0:598,531,560

LV1:16,442,940

LV2:73,760,786

LV3:27,783,370

LV4:20,820,452

LV5:22,107,969

LV6:5,536,082

图表如下:

/static/555aa43227efc28e00bb2224459f493f38b67e9655e4785ba6a9b4039cecdaa8.jpg/static/8deecbdb953742f7e40a284aae6372b5d1fdc698501fb4f780e3d55c241da02f.jpg用户性别

抓取到的数量如下:

男性:18,412,652

女性:17,596,948

保密:728,973,559

图表如下:

/static/367ebd2816f5c6b1cc61a878427b65096f62db60411ab5b09293220c4d0ba0ff.jpg/static/dea7454bb815a43be65c49d54e0e21fb0a2987a6f88a226c60c81dcac8406744.jpg用户权限

(没太搞懂这个东西,一些值的含义参考了bilibili-API-collect项目)

0权限用户:12,526,666人

1000权限用户:1人

1002权限用户:1人

2000权限用户:1人

未答题(5000)用户:585,655,626人

普通(10000)用户:166,800,844人

字幕君(20000)用户:6人

VIP(25000)用户:11人

28800权限用户:1人

管理员(32000):1人

32767权限用户:1人(大概是测试账号,32767是short int类型的最大值)


硬核会员

(硬核会员即通过LV6答题挑战后的形态,一般会在LV6图标左边加一个小闪电,故也被称为闪电LV6)

抓取到的硬核会员数量:481,937人

相较于普通LV6,图表如下/static/16e83f29fb76f9dc527cb141826611f24b4eff6a9a8180e93200a01d8648f469.jpg封禁信息

截至样本数据入库时间

抓取到的封禁用户有:47,099,692人

约等于每16名用户中就有1人被封禁/static/ef3ad4c7e65b08f5488bc78689c30bad16010308e30fa27905a95413d5b0c06b.jpg

大会员信息

截至北京时间2025年07月23日16时22分10秒

抓取到的大会员用户有:12,168,799人

约等于每63名用户中就有1人是大会员


其中UID1085801597是拥有大会员时间最长的用户,截至当前,该用户拥有370年大会员时长(2395年09月08到期)

但是通过观察粉丝账号以及IP属地,该账号很大概率是B站开发人员测试账号,因此并不作数。

经过进一步核实,拥有大会员时间最长的用户实际为UID303940143,截至当前,该用户拥有272年大会员时长(2297年01月21日到期)


大会员占比图表如下/static/afa51e217106e07226678e03f6d4e07162fa5860b8b300fa60f4490c54228aa5.jpg

发布评论
全部评论(16)
最新
最早
加载中...