LLM 采样入门到进阶:理解与实践 Top-K、Top-P、温度控制(flm采样)
与其说采样仅仅是挑出概率最高的那个词,不如理解为它通过不同的策略(如 Top-K、Top-P 以及 Temperature 调节)在确定性与随机性之间取得平衡。在语言模型生成中,这意味着模型会先根据概率对所有…
与其说采样仅仅是挑出概率最高的那个词,不如理解为它通过不同的策略(如 Top-K、Top-P 以及 Temperature 调节)在确定性与随机性之间取得平衡。在语言模型生成中,这意味着模型会先根据概率对所有…
T 小的时候,我们需要让低概率词的被选择的机会变小,也就是放大低概率词和高概率词的差距,一枝独秀。我们用 $x_i$ 表示词汇表中第 i个词的概率(术语叫 logits), $y_i$ 表示第 i 个词温…