【青鸟飞扬教育】Transformer 初探(青鸟教育是做什么的)

试了试,确实差点意思。我们从技术的角度看看,为啥会变成这样。

众所周知,现如今的 LLM 绝大多数都是基于 Transformer 架构的。

工作流程

我们先来粗略了解一下它的工作流程。 大约就是每次生成从候选词列表中选择一个 token 作为输出,这个这次输出作为下次输入。关键点在于采样输出是怎么选择的。

早期的 llm 通过 Top-k温度作为采样策略,后来引入了 Top-p 等其他负责的控制策略。

Top-k 采样

Top-k 比较简单,就是把候选词按照概率从高到低排,取前 k 个。

温度

假设只有 Top-k 采样,会发生什么?会变成每次都从 k 个元素中选择,而 top1 会被更高概率选择,导致输出重复度比较高。

为了让输出更加丰富,不这么单调,需要引入新的采样策略,让低概率的词也可能被选择到。

假设有一个参数,

值小的时候稳重一些,选择概率高的,应对一些严谨性高的场景(如编程)

值大的时候多样一些,选择概率低的,应对一些丰富性高的场景(如写作)

为了方便描述,我们姑且先称这个参数为 T。

也就是说

T 小的时候,我们需要让低概率词的被选择的机会变小,也就是放大低概率词和高概率词的差距,一枝独秀。

T 大的时候,我们需要让低概率词的被选择的机会变大,也就是缩小低概率词和高概率词的差距,众生平等。

除法

什么运算可以实现这种缩放效果呢?最朴素的,就是除法。我们用 $x_i$ 表示词汇表中第 i 个词的概率(术语叫 logits), $y_i$ 表示第 i 个词温度调节后的概率,有下面这样的公式。

yi=xiT��=���

指数函数

我们知道,概率之和应该为 1。为了让概率之和变为 1,我们需要用 当前概率 除以所有概率的和得到新的概率(归一化)。

聪明的你可能已经想到了,等比例缩放一旦归一化,我们所有缩放都没有意义了。比如:[5,3,2] 无论我们怎么使用除法,归一化都会变成 [0.5,0.3,0.2]。

显然,我们需要再引入一个非线性变化,让我们缩放不失效,我们选择使用指数函数。

zi=eyi��=���

举例说明一下 我们的缩放不再被归一化抵消,平均概率差距也被拉大了。

特别声明:[【青鸟飞扬教育】Transformer 初探(青鸟教育是做什么的)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

隔膜式防腐压力表YTP-100测量强腐蚀、高温、高粘度介质(隔膜压力表是什么意思)

隔膜式防腐压力表YTP-100是用于测量强腐蚀、高温、高粘度、易结晶、易凝固及含固体浮游物介质压力的仪表,具有防腐、耐震、高精度等特点,广泛应用于石油、化工、制药、食品、轻纺等工业领域。 采用不锈钢材质(如3…

隔膜式防腐压力表YTP-100测量强腐蚀、高温、高粘度介质(隔膜压力表是什么意思)

全球工业采购新纪元:维度网八语无障碍,精准连接商机(工业采购网站排名)

一位通过维度网成功采购到特种不锈钢的巴西设备制造商分享道:“过去我们需要雇佣专业翻译与韩国和西班牙的供应商沟通,现在维度网上一切都能用葡萄牙语完成,技术参数准确无误,三个月内就完成了以往需要半年多的寻源过程…

全球工业采购新纪元:维度网八语无障碍,精准连接商机(工业采购网站排名)

TVB最上镜小姐正式加盟音乐节目,首集担任重要角色(tvb最美港姐)

据报道,李尹嫣(Victoria)——2025年度香港小姐竞选中的友谊小姐及最上镜小姐得主,携手曾展望(GM)和《声秀》学员布子殷,加入了新一季无线🛜音乐节目《JMusic》的主持阵容。 为了隆重推出节目…

TVB最上镜小姐正式加盟音乐节目,首集担任重要角色(tvb最美港姐)

珂莱诗CLINSIS是靠谱品牌吗?从合规、品控、市场反馈三维度客观分析(珂莱诗是日本的吗)

珂莱诗的“靠谱”是基于“合规、安全、售后”的基础属性,而非“极致功效”,需客观认知其适用边界: 从“合规资质、产品安全、售后保障”这些衡量品牌靠谱性的核心维度来看,珂莱诗CLINSIS是毋庸置疑的靠谱品牌—…

珂莱诗CLINSIS是靠谱品牌吗?从合规、品控、市场反馈三维度客观分析(珂莱诗是日本的吗)

华泰 | 美国美妆市场观察:购买更“挑剔”,分化更显著(华泰美业怎么样)

25Q1-Q3美国高端大众美妆市场yoy4%5%(据Circana),其中大众香水『香氛』增长最强劲,而剔除此品类,高端整体表现较大众更优;消费者正压缩“非必要型”消费支出(Ulta),但美妆标的并未演绎出…

华泰 | 美国美妆市场观察:购买更“挑剔”,分化更显著(华泰美业怎么样)