推荐系统∩语言模型


June 14, 2025

笔者在2020年之前完全是个推荐系统的门外汉,五年来机缘巧合地往里踏了半只脚,却发现这一领域的研究者和从业者当下似乎抱有对它成为“夕阳产业”的担忧,或是已经跳到了语言模型的赛道去追赶风口。

我对推荐系统的兴趣,更多地来源于自己作为具有“人肉推荐系统”的性格特质的个体(因为有限的阅读能力和较少的注意力资源,常年通过将学习材料推荐给朋友的方式靠在日常沟通中学“二手知识”维生),出于本能地一边探索前人是如何通过计算机自动化了推荐这件事情并产生经济效益,一边通过加速其中各个子模块混口饭吃。

虽然依旧是个半瓶醋(能够理解、复现、修正和加速推荐系统中的模块,还在逐渐培养独立的建模与系统构建能力),但我在这次“局部技术平台期”里却乐观不少。在此以自问自答的形式留下三言两语,望未来继续与诸君共勉。

自问:推荐还算是当下风口么?

自答:不是了,除非多生孩子。

自问:那你问什么还要做推荐?

自答:我更多的是为推荐系统服务,而非站在上一波技术发展的重心,有很多心中的未解之谜想继续一探究竟。同时,虽然未来一段时间内可能没有亮眼的增长,但在相关技术资产如何转化为未来生产力,以及如何促进算法向善的道路上,我们依然有很长的路要走。

自问:推荐会被大模型取代么?

自答:我觉得不会,推荐很多时候是以一种侵入性的形式出现在用户侧,至少在在语言模型会以可接受的方式追着你问问题以及安利各种东西之前不会。况且眼下还有许多智能助手的广告还需要推荐系统去分发(如果把广告看成把用户推荐给信息的“反向”推荐系统的话)。而且,最重要的,虽然表面上的重合度很高,但推荐系统和语言模型,至少在当下,是在解两种不同的问题,推荐系统所强调的个性化在一定程度上是要推动“熵增”的,而包括语言模型在内的很多前言工作其实是在做一个“熵减”的过程,只有“熵减”,才能粹炼出知识,但长时间里会朝着消弭掉“一千个读者眼中有一千个哈姆雷特”的方向走,新的模型可能会分走一些用户时长,但很难撼动为泛娱乐化推动“熵增”影响经济过程中的分配环节的推荐系统的根基。长线上,两者可能会逐渐融合,推荐系统从社会尺度解构人性并加以利用(大白话: 给每个用户每个物品编个号就能从一堆记录x用户交互过y物品的整数对里把大家喜好猜个八九不离十,说明人在个体粒度上的行为也许很随机,但在社会尺度上,还是有规律可循的)的特点也许能补足语言模型的一些能力。

自问:你打算做推荐系统到什么时候?

自答:直到对系统有充分的理解,直到工具箱里有完备的推动信息平权的工具(或者至少让推荐系统能帮我完成之前没上完的网课。。。),可能在此之前,这个技术方向就和大模型交融了。

自问:人工智能是否具有真的智慧?

自答:那可能得看它背后所用的一些随机数是否真的“随机”,总体而言,这一系列的技术,既非凭空产生,也不会突然消失,如果暂时屏蔽感官上的刺激,它们更像是用以实现

许倬云先生口中所说的“拿全人类走过的路,都算我走过的路之一”的新兴工具,直到人类的智慧跃升至下一个阶梯之前,我们可能都无从知晓这海量的比特里是否有硅基生命存在,但擅用工具,从来都是人类完成智慧跃迁的秘诀。