权威的存储市场资讯平台English

继OpenAI合作额ChatGPT后,微软再推出全能型人工智能模型Kosmos-1

编辑: 发布:2023-03-06 11:33

微软日前公布名为「Kosmos-1」的多模式大型语言模型,将能同时理解文字与图像内容,以对应更复杂、多元的人工智能技术应用。在进一步朝多模式大型语言模型发展后,微软预期将能在全能型的人工智能技术发展迈进一大步,不再让现有人工智能局限对应特定领域应用发展。

Kosmos-1 可以分析图像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。

研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1 论文中的视觉示例显示模型分析图像并回答有关图像的问题,从图像中读取文本,为图像编写标题,并以 22-26% 的准确度进行视觉智商测试。

微软表示,它计划向开发人员提供 Kosmos-1,尽管该论文引用的GitHub页面在本文发表时没有明显的 Kosmos 特定代码。

推荐:电脑用的少,手机扫一扫,资讯快一步!

扫码关注我们