谷歌公布模型训练框架ASPIRE，可让AI自我判断输出内容正确性

谷歌公布模型训练框架ASPIRE，可让AI自我判断输出内容正确性 - 果核剥壳

2024年1月23日上午11:32 • 圈内新闻

1 月 23 日消息，谷歌日前发布新闻稿，介绍了一款专为大语言模型设计的 ASPIRE 训练框架，该框架号称可以增强 AI 模型的选择性预测能力。

谷歌提到，当下大语言模型在自然语言理解和生成内容方面发展迅速，已被用于构建各种创新应用，但要应用于高风险决策类场合依然不妥。这是由于模型预测具有不确定性及“幻觉”可能，因此谷歌开发了一款 ASPIRE 训练框架，为系列模型引入了“可信度”机制，即 —— 模型会输出一系列答案，每个答案都会具有正确概率评分。

在技术层面，网友注意到该训练框架主要分为三阶段，分别为“特定任务调整”、“答案采样”和“自我评估学习”。

其中“特定任务调整”阶段是对已接受过基础训练的大型语言模型进行深入训练，专注于强化模型的预测能力。研究人员主要为模型引入一系列可调参数，在特定任务的训练数据集上微调预训练语言模型，从而提升模型预测性能，让模型能够更好地解决特定问题。

第二阶段为“答案采样”，经过特定微调后，模型可以利用先前学习到的可调参数，为每个训练问题生成不同的答案，并创建用于自我评估学习的数据集，生成一系列可信度较高的答案。研究人员同时使用 “集束搜索（Beam Search）”方法及 Rouge-L 算法来评估答案的质量，并将生成的答案及评分重新输入给模型开启第三阶段。

而在第三阶段“自我评估学习”中，研究人员为模型添加一组可调参数，专门用于提升模型自我评估能力。该阶段的目标是让模型学会“自己判断输出的答案准确性”，从而让大语言模型在生成答案时，还会附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果，据称“经过 ASPIRE 调整的 OPT-2.7B 小模型，表现远超更大的 OPT-30B 模型”。而这项实验结果也同时表明，只要经过适当的调整，即使是小语言模型，在部分场景下也可以超越大语言模型。

研究人员总结称，ASPIRE 框架训练能够显著提升大语言模型输出准确率，即使是较小的模型，也可以在经过微调后进行“准确且有自信”的预测。

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

32545i 2025年5月8日

11有没有方法自动登录？12又没方法可以去掉广告？

评论于迅雷12 v12.1.6.2780
32545i 2025年5月8日

可以记住登录密码么？

评论于迅雷12 v12.1.6.2780
嘉靖 2025年5月8日

Windows 11, version 24H2 于 ‎2024/‎10/‎18 成功安装

评论于微软Win11 24H2已开始自动下载
DragonSauce 2025年5月8日

我也是经常卡99%

评论于 Free Download Manager v6.27.0.6265 便携版/安装版
迷瞪 2025年5月8日

请问：这个能编辑视频封面么？

评论于 Kdenlive(视频剪辑) v25.04.0
迷瞪 2025年5月8日

反过来，为什么不能用这个呢？

评论于 Kdenlive(视频剪辑) v25.04.0
srover 2025年5月7日

我是三系统用户，我一般要求软件支持三平台

评论于 PDF24 Creator(PDF工具箱) v11.25.1 官方版
welkin 2025年5月7日

这个不错

评论于 MusicTag(音乐标签编辑器) v1.0.9.0 绿色版
adc 2025年5月7日

这个可以啊，简洁无广告，流程，就是功能还没做完

评论于 Android Emotion(情绪日记) v1.0.0
198922 2025年5月7日

没有全屏选项a啊，截取全屏还要手动拉

评论于 PixPin(截图工具) v2.0.0.3

谷歌公布模型训练框架ASPIRE，可让AI自我判断输出内容正确性 - 果核剥壳

相关推荐

发表回复

分享到：