推荐算法会根据实际运行效果持续迭代优化,本文档旨在帮助创作者和用户理解推荐系统的设计思路,不具备参数时效性。
写在前面
这份算法是我一个人做的。
喵御宅作为一个以 ACGN 爱好者为主的小众平台,每天产生的内容量和用户互动量,和主流内容平台差了不止一个数量级。除了数据稀疏,我们也没有足够的人力和资金去做大型算法。很多大厂能干的事我们干不了,或者说干了效果也不会理想。
v4 算法是我目前能做到的最好版本——但我很清楚,它离"完美"还很远。如果推荐结果让你感到困惑,请多包涵;如果有建议,也请告诉我。
从 v3 到 v4,为什么需要变
v3 算法主要依赖少数几个指标来做推荐决策。这种做法的好处是简单直接,坏处也明显:容易被刷量利用,也容易埋没那些数据不"漂亮"但质量不差的内容。
v4 的核心变化可以用一句话概括:从看"数据好不好看"变成看"数据值不值得信、内容值不值得推"。
创作数据,算法怎么看?
喵御宅于2026年5月31日发布了创作数据中心,提供了一系列对创作者公开的新指标:点击率、点赞率、点踩率、收藏率、打赏率(投币人次)、访问量,以及视频的 2 秒跳出率、5 秒留存率、完播率、平均播放占比等等。这些指标不仅给创作者提供了参考价值, v4 算法也需要——但不是简单的"分高就推"。
不同的指标回答不同的问题,组合在一起才能逼近"这条内容到底好不好"的真相。
举个例子:一个视频完播率很高,但如果只是因为它只有 15 秒,那完播率高就不稀奇;另一个视频 10 分钟,完播率 30%,但收藏率和分享率极高,这反而是更有价值的内容。从行业数据来看,50秒左右的视频平均完播率约7%,而2分半的视频则不足2%。
另外,文章和视频是两回事。视频的好坏可以用跳出率、完播率这些时长维度的指标来衡量,但文章不行。目前创作数据中心里文章专属指标还在开发中,但 v4 算法已经为文章单独设计了质量评估方式——不套用视频的指标逻辑,而是基于阅读深度、停留时长、收藏复访等更适合图文内容的维度。
置信度:为什么 100 点赞不等于 100 分
这是 v4 算法里一个关键概念,值得单独说。
假设两个作品:
- 作品 A:100 个点赞,播放量 10 万
- 作品 B:90 个点赞,播放量 1000
直觉告诉你 B 的质量可能远高于 A——A 的点赞更多只是因为被推给了更多人。这就是"置信度"要解决的问题:一个数据的"可信程度"和它的大小同样重要。
v4 算法会综合考量作品的总流量规模、曝光来源(有多少来自推荐、多少来自搜索、多少来自站外引流)、用户类型(粉丝/注册用户/游客)等因素,来判断每个互动指标的可靠性。
流量很大时,各项指标趋于稳定,置信度就高——你对它的判断就更确信;流量很小时,各项指标波动很大,置信度就低——哪怕数据看起来不错,系统也会审慎对待。
但是这也给了新作品机会,假如说您的作品被错误地推送给了不感兴趣的人,获得了较差的数据,由于置信度低,系统会忽视这些减分,继续推流。作品不会因少量的样本偏差带来错误的数据,这使得结果相对v3要靠谱得多。
简单来说:数据不仅是"多或少"的问题,也是"靠不靠谱"的问题。
新内容有公平的起步机会
每个创作者都怕新发的作品因为没数据就"沉下去"。v4 算法为新发布的内容设置了专门的探索期,在发布后的一段时间内会给予额外的曝光机会——不是为了"保送",而是为了收集足够多的用户反馈,让算法认识它。
至于这份反馈好不好、能不能持续获得推荐,由用户真实的互动说了算。
旧稿件不会"过期"
v4 算法缩短了主要推荐窗口(从90天缩短到了30天),但这不代表旧内容会被遗忘。
有些内容天生"慢热"——发布时反响平平,过了一段时间才被发掘。有些内容则具有长期价值,比如教程、深度解读、设定考据,用户一直需要它们。
为此,算法设置了两条通道:
- 长青机制:在推荐窗口结束后,综合表现突出且置信度坚挺的内容会被标记为长青,持续获得推流。长青内容不受"发布时间太久"的影响。
- 复活机制:长期沉寂的作品如果某天突然被重新访问、获得新的互动,系统会重新评估它,重新给推荐机会。
同时,即便未达到长青标准,但质量仍然达标的稿件,也会走长青通道进行召回,仍然有机会跻身长青。
好内容值得被反复看见,不会因为"老"就被淘汰。
个性化的初步探索
v4 算法开始尝试理解"你喜欢看什么"——基于你的互动历史和访问偏好,在大量稿件中找到与你更匹配的内容。
但必须坦诚地说,这一能力现在还很初步。个性化推荐要做得好,需要大量行为数据来训练模型,而喵御宅目前的数据量和成本还不足以支撑高精度的个性化。因此现阶段它在推荐中的权重很低,更多是作为探索方向存在。未来随着数据积累和能力提升,会逐步增强。
推荐的多样性
你可能遇到过这样的情况:关注了几个喜欢的创作者,结果推荐页全是他们的内容。v4 算法的最终推荐结果来自多个评估通道的汇合,在汇合阶段会进行多样性处理,避免同一创作者或同一类型内容过度集中。你看到的是一个"组合",不是某一条公式的直接输出。
算法流量管理和内容审核,是两件事
这里需要特别说明一下,因为容易混淆。
喵御宅有一套独立的内容审核体系。审核的职责是判断一条内容是否合规——违规的会被驳回、删除甚至封号。被审核驳回的内容不会进入推荐池,这是第一道关。
第二道关:不同于之前v3算法实现的“一刀切”限流,v4 算法实现了推荐层的流量管理:
- 推流:对于质量评分高但曝光不足的作品,以及人工判定为优质或平台活动的作品,算法会主动增加推荐力度。
- 限流:对于通过了审核、但在推荐层面需要谨慎对待的内容——比如偏离 ACGN 社区定位较多的内容(审核规范中也提到此类内容可能"不予推荐"),或者引发争议、涉嫌引战等——算法会适当收紧其传播范围。这是为了在内容之间寻找平衡。
需要强调的是:v4算法中,除非一条内容被审核体系驳回/删除,或容易/已经引发较大争议,算法不会对合规内容彻底"掐断"推荐。 流量调节是有弹性空间的,正常稿件不会限流"限到死"。
对创作者,这意味什么
信号更多了,运气更少了。 v1算法是纯粹的运气,完全的随机数;v2算法是热门随机+冷门随机,可控的随机数;v3是漂亮数据的随机数。可以说过去的算法都相当依赖运气。
但v4带来了不同,标题和封面的吸引力、开头能不能留住人——每个维度都会被算法纳入考量。这意味着用心打磨内容的创作者有了更多被"看懂"的机会,也让纯粹依赖刷量或碰运气的路径变得更窄。
创作数据中心的每一项指标,现在都实实在在地参与到了推荐决策中。反过来看,这也是一个方向标:你可以在数据中心里看到自己哪里强、哪里弱,然后有针对性地改进。 数据中心每天早上 2-3 点更新前一日的数据,配合大盘数据做对比,你就能知道自己的表现在平台里处于什么位置。
对观众,这意味什么
推荐系统会更努力地区分"大家都在看"和"大家真的喜欢看"——后者才是推荐系统想做的。你不会被同一类内容淹没,也更容易在推荐里遇到那些"虽然播放量不高但有东西"的宝藏稿件。
最后
就像开头说的,v4 是我能做到的最好版本,但它不完美。数据不够多的时候,算法能做的事情天然受限;参数的调优也不是一次性的,需要反复观察、修正、再观察。
如果你觉得推荐结果不理想,那可能是算法还不够好——请多包涵,也欢迎找我反馈。每一条反馈都是我调整方向的重要参考。
我会继续让它变得更好。




花糕太强了
辛苦啦![[mayday-1]](https://resource.mfuns.net/image/sticker/51/劳动最光荣.png)