阿里研发了一种新的大语言模型情境学习框架

2023-07-06 10:16:54来源:科技头条

(资料图片)7月6日消息,据报道,阿里巴巴研究团队研发出一款名为 D...

(资料图片)

7月6日消息,据报道,阿里巴巴研究团队研发出一款名为 Deep-Thinking 的大语言模型情境学框架。

这个框架是一种迭代式的前向训练框架,旨在让大模型能够深度思考和快速定制专属模型。它摒弃了传统的模型训练方法,通过情境学(In-context Learning)使该模型功能更为强大。

情境学框架是在大模型时代的背景下提出的新兴框架。

大模型具有思维链、情景学等涌现能力,能够执行人类的指令,并可以直接与人类进行对话。其核心作用是突破数据标注的困境,通过学海量无标注的数据来进行预训练,从而提升大模型的知识水,并在后续的下游任务中应用。

这个框架的提出将有助于大模型更好地理解和适应不同的情境,为人工智能的发展带来新的可能,有望在语言处理和人工智能领域发挥重要作用。

关键词: 阿里巴巴 大语言模型 大语言模型情境

责任编辑:hnmd004