喵御宅 v4 推荐算法说明

花糕2026-06-01 22:2325610分钟原创声明，未经作者许可禁止转载

推荐算法会根据实际运行效果持续迭代优化，本文档旨在帮助创作者和用户理解推荐系统的设计思路，不具备参数时效性。

写在前面

这份算法是我一个人做的。

喵御宅作为一个以 ACGN 爱好者为主的小众平台，每天产生的内容量和用户互动量，和主流内容平台差了不止一个数量级。除了数据稀疏，我们也没有足够的人力和资金去做大型算法。很多大厂能干的事我们干不了，或者说干了效果也不会理想。

v4 算法是我目前能做到的最好版本——但我很清楚，它离"完美"还很远。如果推荐结果让你感到困惑，请多包涵；如果有建议，也请告诉我。

v3 算法主要依赖少数几个指标来做推荐决策。这种做法的好处是简单直接，坏处也明显：容易被刷量利用，也容易埋没那些数据不"漂亮"但质量不差的内容。

v4 的核心变化可以用一句话概括：从看"数据好不好看"变成看"数据值不值得信、内容值不值得推"。

喵御宅于2026年5月31日发布了创作数据中心，提供了一系列对创作者公开的新指标：点击率、点赞率、点踩率、收藏率、打赏率（投币人次）、访问量，以及视频的 2 秒跳出率、5 秒留存率、完播率、平均播放占比等等。这些指标不仅给创作者提供了参考价值， v4 算法也需要——但不是简单的"分高就推"。

不同的指标回答不同的问题，组合在一起才能逼近"这条内容到底好不好"的真相。

举个例子：一个视频完播率很高，但如果只是因为它只有 15 秒，那完播率高就不稀奇；另一个视频 10 分钟，完播率 30%，但收藏率和分享率极高，这反而是更有价值的内容。从行业数据来看，50秒左右的视频平均完播率约7%，而2分半的视频则不足2%。

另外，文章和视频是两回事。视频的好坏可以用跳出率、完播率这些时长维度的指标来衡量，但文章不行。目前创作数据中心里文章专属指标还在开发中，但 v4 算法已经为文章单独设计了质量评估方式——不套用视频的指标逻辑，而是基于阅读深度、停留时长、收藏复访等更适合图文内容的维度。

这是 v4 算法里一个关键概念，值得单独说。

假设两个作品：

直觉告诉你 B 的质量可能远高于 A——A 的点赞更多只是因为被推给了更多人。这就是"置信度"要解决的问题：一个数据的"可信程度"和它的大小同样重要。

v4 算法会综合考量作品的总流量规模、曝光来源（有多少来自推荐、多少来自搜索、多少来自站外引流）、用户类型（粉丝/注册用户/游客）等因素，来判断每个互动指标的可靠性。

流量很大时，各项指标趋于稳定，置信度就高——你对它的判断就更确信；流量很小时，各项指标波动很大，置信度就低——哪怕数据看起来不错，系统也会审慎对待。

但是这也给了新作品机会，假如说您的作品被错误地推送给了不感兴趣的人，获得了较差的数据，由于置信度低，系统会忽视这些减分，继续推流。作品不会因少量的样本偏差带来错误的数据，这使得结果相对v3要靠谱得多。

简单来说：数据不仅是"多或少"的问题，也是"靠不靠谱"的问题。

每个创作者都怕新发的作品因为没数据就"沉下去"。v4 算法为新发布的内容设置了专门的探索期，在发布后的一段时间内会给予额外的曝光机会——不是为了"保送"，而是为了收集足够多的用户反馈，让算法认识它。

至于这份反馈好不好、能不能持续获得推荐，由用户真实的互动说了算。

v4 算法缩短了主要推荐窗口（从90天缩短到了30天），但这不代表旧内容会被遗忘。

有些内容天生"慢热"——发布时反响平平，过了一段时间才被发掘。有些内容则具有长期价值，比如教程、深度解读、设定考据，用户一直需要它们。

为此，算法设置了两条通道：

同时，即便未达到长青标准，但质量仍然达标的稿件，也会走长青通道进行召回，仍然有机会跻身长青。

好内容值得被反复看见，不会因为"老"就被淘汰。

v4 算法开始尝试理解"你喜欢看什么"——基于你的互动历史和访问偏好，在大量稿件中找到与你更匹配的内容。

但必须坦诚地说，这一能力现在还很初步。个性化推荐要做得好，需要大量行为数据来训练模型，而喵御宅目前的数据量和成本还不足以支撑高精度的个性化。因此现阶段它在推荐中的权重很低，更多是作为探索方向存在。未来随着数据积累和能力提升，会逐步增强。

这里需要特别说明一下，因为容易混淆。

喵御宅有一套独立的内容审核体系。审核的职责是判断一条内容是否合规——违规的会被驳回、删除甚至封号。被审核驳回的内容不会进入推荐池，这是第一道关。

第二道关：不同于之前v3算法实现的“一刀切”限流，v4 算法实现了推荐层的流量管理：

推流：对于质量评分高但曝光不足的作品，以及人工判定为优质或平台活动的作品，算法会主动增加推荐力度。
限流：对于通过了审核、但在推荐层面需要谨慎对待的内容——比如偏离 ACGN 社区定位较多的内容（审核规范中也提到此类内容可能"不予推荐"），或者引发争议、涉嫌引战等——算法会适当收紧其传播范围。这是为了在内容之间寻找平衡。

需要强调的是：v4算法中，除非一条内容被审核体系驳回/删除，或容易/已经引发较大争议，算法不会对合规内容彻底"掐断"推荐。 流量调节是有弹性空间的，正常稿件不会限流"限到死"。