大语言模型拆解——推理流程

1. 推理流程

从获取用户输入开始到生成文本,整个推理过程大概分为几个步骤:

  1. 分词: 输入文本先经过tokenizer分词器转换为数字形式的序列,这些数字就是单词在词典(vocab)中的索引编号;
  2. 向量嵌入: 将数字序列通过embedding得到高维度的向量;
  3. 解码器运算:将这些向量通过解码器进行复杂的推理运算,生成下一个词的数字索引,循环多次运算就能生成整个索引序列;
  4. 输出: 用tokenizer分词器来还源这些数字序列,得到人类可以理解的自然语言。

在这里插入图片描述

其中对于解码器的运算部分,有两个主要特点:

  • 采用的是自回归方式解码,逐词生成输出序列,并且每次输入时模型都会带上上一次输出的结果。

例如:生成的第一个单词I后会作为生成第二个单词的输入,生成的第二个单词am又会作为生成第三个单词的输入。

生成式语言模型的任务特点:在阅读前n个单词后预测句子中下一个单词,输出取决于过去和现在输入,与未来无关。

  • 采用多层解码器堆叠结构,每一层的计算模型相同而参数矩阵不同,目的是从不同层次逐步提取和转换输入的特征。

每个token的生成都要经过所有层逐步计算获得,每经过一层后计算的结果都会更准确。

另外,在decode layer之后有一个linear+softmax层,是为了对hidden_states生成语言模型中下一个词元的概率分布。

具体过程:通过线性变换将hid

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉下心来学鲁班

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值