比 ChatGPT更强大,微软推出全能型模型 Kosmos-1

作者:科技黑 902文章阅读时间:2分钟

文章摘要:Kosmos-1可以处理文本、图像、音频和视频等内容。比如,该模型可分析图像的内容,进行文本识别以及理解自然语言指令等。

沃丰科技

从二十世纪初开始,人们就在科幻作品中憧憬人工智能(AI)给社会带来各种各样的便利。但随着技术的发展,这些憧憬也变成了担忧,我们看到了在各种科幻作品中,AI取代或者是奴役人类又或者是毁灭世界。而其中最现实的一点忧虑便是AI取代了大部分人类的工作。今年,随着Chatgpt的横空出世,这些担忧似乎马上要成为现实了。

微软于近日推出了更全能型的多模式大型语言模型Kosmos-1。

Kosmos-1可以处理文本、图像、音频和视频等内容。比如,该模型可分析图像的内容,进行文本识别以及理解自然语言指令等。

微软聊天机器人

论文显示,KOSMOS-1可根据图像回答有关问题、从图像中读取文本、为图像编写标题,根据图形推理(准确度为26%)。相比于纯文本语言模型ChatGPT,多模态语言模型的KOSMOS-1将更适合应对复杂、多元的人工智能技术应用。

同时用于训练Kosmos-数据同样源自网络,同时为了让Kosmos-1能进一步理解图像内容,研究人员通过事先将图像以文字内容加上大量标记,让此大型语言模型可以进一步理解图像内容,以实现多模式大型语言模式。加入图像内容理解能力之后,将有助于Kosmos-1识别文字以外的图像内容,甚至进一步判断动态视频描述内容。

文章为沃丰科技原创,转载需注明来源:https://www.udesk.cn/ucm/report/39687

ai聊天机器人人工智能

上一篇: 下一篇:

数字化转型

比 ChatGPT更强大,微软推出全能型模型 Kosmos-1的相关推荐

最新文章推荐

展开更多
 

手机登录下载

 

使用手机登录账号,免费下载白皮书

 
手机登录