编辑: 发布:2023-03-06 11:33
微软日前公布名为「Kosmos-1」的多模式大型语言模型,将能同时理解文字与图像内容,以对应更复杂、多元的人工智能技术应用。在进一步朝多模式大型语言模型发展后,微软预期将能在全能型的人工智能技术发展迈进一大步,不再让现有人工智能局限对应特定领域应用发展。
Kosmos-1 可以分析图像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。
研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1 论文中的视觉示例显示模型分析图像并回答有关图像的问题,从图像中读取文本,为图像编写标题,并以 22-26% 的准确度进行视觉智商测试。
微软表示,它计划向开发人员提供 Kosmos-1,尽管该论文引用的GitHub页面在本文发表时没有明显的 Kosmos 特定代码。
深圳市闪存市场资讯有限公司 客服邮箱:Service@ChinaFlashMarket.com
CFM闪存市场(ChinaFlashMarket) 版权所有 Copyright©2008-2023 粤ICP备08133127号-2