继OpenAI合作额ChatGPT后，微软再推出全能型人工智能模型Kosmos-1

编辑： 发布：2023-03-06 11:33

微软日前公布名为「Kosmos-1」的多模式大型语言模型，将能同时理解文字与图像内容，以对应更复杂、多元的人工智能技术应用。在进一步朝多模式大型语言模型发展后，微软预期将能在全能型的人工智能技术发展迈进一大步，不再让现有人工智能局限对应特定领域应用发展。

Kosmos-1 可以分析图像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。

研究人员在他们的学术论文中写道：“作为智能的基本组成部分，多模态感知是实现人工智能的必要条件”。Kosmos-1 论文中的视觉示例显示模型分析图像并回答有关图像的问题，从图像中读取文本，为图像编写标题，并以 22-26% 的准确度进行视觉智商测试。

微软表示，它计划向开发人员提供 Kosmos-1，尽管该论文引用的GitHub页面在本文发表时没有明显的 Kosmos 特定代码。

CFM闪存市场