~ / writing / n°046

AI 圈最大的秘密不是技术,是术语

AI 圈最大的秘密不是技术,是术语 把吓人的术语拆开,很多只是普通动作换了个贵名字。

上个月我面了一个应届生。简历写得像科幻片的制作名单——

「大模型微调、RAG落地、多轮对话系统、Prompt工程。」

我看着挺高兴:这年头年轻人可以啊。

我随口问了句:「你做的RAG,具体是怎么把外部知识拿进来用的?」

他解释了三分钟。

三分钟里我一个字没听懂。不是他讲得太深——是他每句话里的单字我都认识,放一起我就不知道他在说什么了。向量库。语义检索。上下文拼接。我说你等等,我能不能用一句外行的话问你——这个RAG,它到底在干嘛?

他想了一会儿说:就是让模型在回答问题之前先去查一下资料。

对。就是查资料。考试前翻一下书。

那天面试完,我没觉得他不行——他底子其实是有的。但我坐在那儿想了很久:AI圈是不是已经发展出一套完整的话术体系了?明明一句话能说清楚的事,非要用五个你听不懂的词说出来。专业交流需要术语,但拿术语压普通人,就是另一回事了。

今天就当个翻译活干。


“字块”在AI圈叫Token

你去吃面,老板说按根算钱。你吃一碗面,他数了数,800根,一根一分钱。你觉得这老板有病,就不能按碗吗?

按根算钱 Token 的核心不是神秘,是把话切块后按块计费。

AI就是这么计费的。

你跟机器说了一句话,它不会整句吞进去。它先把这句话切成小碎块——“今天”、“天气”、“真好”——分成了三小块。每块就是一个小字块。你说多少、它回多少,全按块算钱。

翻译成大白话:按根算钱的面条。

不叫”按根算钱”叫”Token”——因为后者听起来像一张能写进报价单的词。一位做AI报价的朋友跟我说过,他试过用”按块计费”代替”Token计费”写报价单,客户第一反应就是”你这算法是不是贵了”。换成Token,没人问。

你说这东西坑不坑?


加减乘除叫了神经网络

这个名字太成功了。你一听”神经”两个字,大脑自动补画面:神经元、生物电信号、大脑切片泡在营养液里接了几根线到服务器。

数字叠出来 神经网络听着像大脑,落到计算上是一层层数字变换。

真实情况:它对普通人来说,就是大量数字运算叠出来的。

给你一串数,乘上一堆权重,加上一堆偏置,再套个规则压住不让它跑飞。真正复杂的地方在规模、训练和调参——但它不是电子大脑。

我见过一种更准确但没人爱听的说法:“神经网络本质上就是一个可微分的函数逼近器。” 写了句最准确的解释,但也没人看得懂。为什么非得把话说成这个样?

答案很简单:改个名字就能问投资人要更多钱。你给投资人看一张写满四则运算的纸,他觉得你在糊弄他。你给投资人看一张画着神经元突触的图,他觉得你在改变世界。


“大”的意思就是大

我跟你打个赌。我让我妈猜”大模型”是什么意思,她一定说:模型很大呗。

大的就是大 大模型的大,先别想玄学,就是数据、参数、算力都大。

她是对的。

幼儿园小朋友都知道大的好。大房子、大蛋糕、大屏幕。大模型的大,数据多、参数多、烧的显卡多。把”大”从幼儿园级别的逻辑,包装成”多少亿参数、多少万亿字训练数据、Transformer 架构”——听起来像一项人类还没掌握的技术。

但它不就是大吗?

你问他们公司在干什么,他说”我们在推进大模型战略”。翻译一下就是:我们买了更多显卡,雇了更多人灌数据。不是说这件事不对——堆东西确实是这个阶段的路。但你不必把”买了更多显卡”说成”大模型战略”,然后让全国的董事长都以为这是什么高阶哲学问题。


考试翻书叫了RAG

这个要重点说。RAG现在几乎是每个AI方案里的标配,名字对外行很不友好。

你被人问了一个问题。你不知道答案。你怎么办?

先查再答 RAG 的概念很朴素:不会就先翻资料,再回答。

翻一下百度,翻一下教材,看完再回答。

这不是人类每天都在干的事吗?

RAG干的事一模一样:AI遇到一个问题→它先到一个资料库里去搜→把搜到的资料和问题放一起→看完资料再回答。三步走完。

你在公司里听到的版本是: “RAG架构通过向量检索与大型语言模型结合,实现知识增强。” 翻译成人话:先查再看,少点胡说。

RAG在实现上确实有些技巧——怎么查得快、怎么查得准。但这些技巧解决的是”怎么翻书翻得快”,不是”翻书”这个概念本身。概念本来就是考试翻书,你把它叫”企业级知识增强架构”,然后新人进来第一天就开始恐惧。


调料叫了温度

这个最气人。

你打开一个AI产品,里面通常有个叫”温度”的滑块。拉低的时候AI回答保守,拉高的时候它开始放飞自我。技术文档告诉你:温度控制模型的对数几率分布的采样随机性。

稳点还是野点 温度不是玄学按钮,本质是在调回答的随机程度。

翻译:你做饭放盐。

放少了菜淡,放多了菜咸。低温度=今天让AI好好干活别整幺蛾子;高温度=让它多来点创意不要那么死板。就这么软的事,非要给一个硬词,搞得跟物理实验似的。

为什么叫温度?它在数学上是对概率分布做缩放的一个参数,借了物理里的命名。但你不用记这个。落到你手里的滑块,作用就一个:决定今天让AI稳一点,还是野一点。

你下次在界面上看到”温度0.7”——请直接理解为”不咸不淡,再来一碗”。


排位置叫了Embedding

最后一个最坑。因为中文里根本找不到一个靠谱的翻译。有人叫”嵌入”,有人叫”向量化”,有人叫”语义编码”——没一个正常人能听懂的。

本质特简单:你把词、句子或一段话变成一个坐标。

给意思排坐标 Embedding 就是在意义地图上给词和句子标位置。

想象一个宇宙,里面每个意思都有一个位置。意思接近的靠在一起。“苹果”和”香蕉”离得很近,“苹果”和”卡车”离得很远。你给AI输入”我想吃水果”,它就在这个宇宙里找到”水果”的坐标,然后去附近找”苹果""香蕉""葡萄”。那个宇宙的地图,就叫Embedding。

翻译成人话:用数字帮词排位置,让AI知道哪些东西是一类。

跟你在地图上标注”家的位置和公司的位置”是一回事,只不过它给每个词标了一个点。别把它想得太高级。


拆完这六个,你会发现AI圈那些吓人的词,拆开了特别老实。Token算量、神经网络算数、大模型量大管饱、RAG翻书再答、温度是咸淡、Embedding就是排坐标。

术语的本质是封装,不是骗人。 每一层封装都让使用变得更方便——你不需要知道你的手机芯片是怎么刻出来的才能打电话。但对刚入门的人来说,这层封装也是一堵墙。问题不在专业词,在它被拿来中断追问。

你叫它”氯化钠”,他就不敢往菜里放。

我不是说你要学会所有术语。我是说下次有人用术语砸你的时候,你知道怎么笑着问他一句——

“你说的这个,它到底在干什么?”

这句话,比背一百个术语管用。

【引用出处】

DAVID YIN · 2026 · 06 · 09 · 杭州
← Older · N°047
你被钉钉 DING 过吗?那不是产品功能,是有人替你决定了"你不能假装没看到"
Newer →
— 这是最新一篇 —