喵御宅 v4 推荐算法说明

推荐算法会根据实际运行效果持续迭代优化,本文档旨在帮助创作者和用户理解推荐系统的设计思路,不具备参数时效性。

写在前面

这份算法是我一个人做的。

喵御宅作为一个以 ACGN 爱好者为主的小众平台,每天产生的内容量和用户互动量,和主流内容平台差了不止一个数量级。除了数据稀疏,我们也没有足够的人力和资金去做大型算法。很多大厂能干的事我们干不了,或者说干了效果也不会理想。

v4 算法是我目前能做到的最好版本——但我很清楚,它离"完美"还很远。如果推荐结果让你感到困惑,请多包涵;如果有建议,也请告诉我。

从 v3 到 v4,为什么需要变

v3 算法主要依赖少数几个指标来做推荐决策。这种做法的好处是简单直接,坏处也明显:容易被刷量利用,也容易埋没那些数据不"漂亮"但质量不差的内容。

v4 的核心变化可以用一句话概括:从看"数据好不好看"变成看"数据值不值得信、内容值不值得推"。

创作数据,算法怎么看?

喵御宅于2026年5月31日发布了创作数据中心,提供了一系列对创作者公开的新指标:点击率、点赞率、点踩率、收藏率、打赏率(投币人次)、访问量,以及视频的 2 秒跳出率、5 秒留存率、完播率、平均播放占比等等。这些指标不仅给创作者提供了参考价值, v4 算法也需要——但不是简单的"分高就推"。

不同的指标回答不同的问题,组合在一起才能逼近"这条内容到底好不好"的真相。

举个例子:一个视频完播率很高,但如果只是因为它只有 15 秒,那完播率高就不稀奇;另一个视频 10 分钟,完播率 30%,但收藏率和分享率极高,这反而是更有价值的内容。从行业数据来看,50秒左右的视频平均完播率约7%,而2分半的视频则不足2%。

另外,文章和视频是两回事。视频的好坏可以用跳出率、完播率这些时长维度的指标来衡量,但文章不行。目前创作数据中心里文章专属指标还在开发中,但 v4 算法已经为文章单独设计了质量评估方式——不套用视频的指标逻辑,而是基于阅读深度、停留时长、收藏复访等更适合图文内容的维度。

置信度:为什么 100 点赞不等于 100 分

这是 v4 算法里一个关键概念,值得单独说。

假设两个作品:

  • 作品 A:100 个点赞,播放量 10 万
  • 作品 B:90 个点赞,播放量 1000

直觉告诉你 B 的质量可能远高于 A——A 的点赞更多只是因为被推给了更多人。这就是"置信度"要解决的问题:一个数据的"可信程度"和它的大小同样重要。

v4 算法会综合考量作品的总流量规模、曝光来源(有多少来自推荐、多少来自搜索、多少来自站外引流)、用户类型(粉丝/注册用户/游客)等因素,来判断每个互动指标的可靠性。

流量很大时,各项指标趋于稳定,置信度就高——你对它的判断就更确信;流量很小时,各项指标波动很大,置信度就低——哪怕数据看起来不错,系统也会审慎对待。

但是这也给了新作品机会,假如说您的作品被错误地推送给了不感兴趣的人,获得了较差的数据,由于置信度低,系统会忽视这些减分,继续推流。作品不会因少量的样本偏差带来错误的数据,这使得结果相对v3要靠谱得多。

简单来说:数据不仅是"多或少"的问题,也是"靠不靠谱"的问题。

新内容有公平的起步机会

每个创作者都怕新发的作品因为没数据就"沉下去"。v4 算法为新发布的内容设置了专门的探索期,在发布后的一段时间内会给予额外的曝光机会——不是为了"保送",而是为了收集足够多的用户反馈,让算法认识它。

至于这份反馈好不好、能不能持续获得推荐,由用户真实的互动说了算。

旧稿件不会"过期"

v4 算法缩短了主要推荐窗口(从90天缩短到了30天),但这不代表旧内容会被遗忘。

有些内容天生"慢热"——发布时反响平平,过了一段时间才被发掘。有些内容则具有长期价值,比如教程、深度解读、设定考据,用户一直需要它们。

为此,算法设置了两条通道:

  • 长青机制:在推荐窗口结束后,综合表现突出且置信度坚挺的内容会被标记为长青,持续获得推流。长青内容不受"发布时间太久"的影响。
  • 复活机制:长期沉寂的作品如果某天突然被重新访问、获得新的互动,系统会重新评估它,重新给推荐机会。

同时,即便未达到长青标准,但质量仍然达标的稿件,也会走长青通道进行召回,仍然有机会跻身长青。

好内容值得被反复看见,不会因为"老"就被淘汰。

个性化的初步探索

v4 算法开始尝试理解"你喜欢看什么"——基于你的互动历史和访问偏好,在大量稿件中找到与你更匹配的内容。

但必须坦诚地说,这一能力现在还很初步。个性化推荐要做得好,需要大量行为数据来训练模型,而喵御宅目前的数据量和成本还不足以支撑高精度的个性化。因此现阶段它在推荐中的权重很低,更多是作为探索方向存在。未来随着数据积累和能力提升,会逐步增强。

推荐的多样性

你可能遇到过这样的情况:关注了几个喜欢的创作者,结果推荐页全是他们的内容。v4 算法的最终推荐结果来自多个评估通道的汇合,在汇合阶段会进行多样性处理,避免同一创作者或同一类型内容过度集中。你看到的是一个"组合",不是某一条公式的直接输出。

算法流量管理和内容审核,是两件事

这里需要特别说明一下,因为容易混淆。

喵御宅有一套独立的内容审核体系。审核的职责是判断一条内容是否合规——违规的会被驳回、删除甚至封号。被审核驳回的内容不会进入推荐池,这是第一道关。

第二道关:不同于之前v3算法实现的“一刀切”限流,v4 算法实现了推荐层的流量管理

  • 推流:对于质量评分高但曝光不足的作品,以及人工判定为优质或平台活动的作品,算法会主动增加推荐力度。
  • 限流:对于通过了审核、但在推荐层面需要谨慎对待的内容——比如偏离 ACGN 社区定位较多的内容(审核规范中也提到此类内容可能"不予推荐"),或者引发争议、涉嫌引战等——算法会适当收紧其传播范围。这是为了在内容之间寻找平衡。

需要强调的是:v4算法中,除非一条内容被审核体系驳回/删除,或容易/已经引发较大争议,算法不会对合规内容彻底"掐断"推荐。 流量调节是有弹性空间的,正常稿件不会限流"限到死"。

对创作者,这意味什么

信号更多了,运气更少了。 v1算法是纯粹的运气,完全的随机数;v2算法是热门随机+冷门随机,可控的随机数;v3是漂亮数据的随机数。可以说过去的算法都相当依赖运气。

但v4带来了不同,标题和封面的吸引力、开头能不能留住人——每个维度都会被算法纳入考量。这意味着用心打磨内容的创作者有了更多被"看懂"的机会,也让纯粹依赖刷量或碰运气的路径变得更窄。

创作数据中心的每一项指标,现在都实实在在地参与到了推荐决策中。反过来看,这也是一个方向标:你可以在数据中心里看到自己哪里强、哪里弱,然后有针对性地改进。 数据中心每天早上 2-3 点更新前一日的数据,配合大盘数据做对比,你就能知道自己的表现在平台里处于什么位置。

对观众,这意味什么

推荐系统会更努力地区分"大家都在看"和"大家真的喜欢看"——后者才是推荐系统想做的。你不会被同一类内容淹没,也更容易在推荐里遇到那些"虽然播放量不高但有东西"的宝藏稿件。

最后

就像开头说的,v4 是我能做到的最好版本,但它不完美。数据不够多的时候,算法能做的事情天然受限;参数的调优也不是一次性的,需要反复观察、修正、再观察。

如果你觉得推荐结果不理想,那可能是算法还不够好——请多包涵,也欢迎找我反馈。每一条反馈都是我调整方向的重要参考。

我会继续让它变得更好。

发布评论
全部评论(4)
avatar
熙林#1186349

花糕太强了

avatar
秀下木吉#1186313

辛苦啦[mayday-1]