比 ChatGPT更强大,微软推出全能型模型 Kosmos-1
作者:科技黑 902文章阅读时间:2分钟
文章摘要:Kosmos-1可以处理文本、图像、音频和视频等内容。比如,该模型可分析图像的内容,进行文本识别以及理解自然语言指令等。
从二十世纪初开始,人们就在科幻作品中憧憬人工智能(AI)给社会带来各种各样的便利。但随着技术的发展,这些憧憬也变成了担忧,我们看到了在各种科幻作品中,AI取代或者是奴役人类又或者是毁灭世界。而其中最现实的一点忧虑便是AI取代了大部分人类的工作。今年,随着Chatgpt的横空出世,这些担忧似乎马上要成为现实了。
微软于近日推出了更全能型的多模式大型语言模型Kosmos-1。
Kosmos-1可以处理文本、图像、音频和视频等内容。比如,该模型可分析图像的内容,进行文本识别以及理解自然语言指令等。
论文显示,KOSMOS-1可根据图像回答有关问题、从图像中读取文本、为图像编写标题,根据图形推理(准确度为26%)。相比于纯文本语言模型ChatGPT,多模态语言模型的KOSMOS-1将更适合应对复杂、多元的人工智能技术应用。
同时用于训练Kosmos-数据同样源自网络,同时为了让Kosmos-1能进一步理解图像内容,研究人员通过事先将图像以文字内容加上大量标记,让此大型语言模型可以进一步理解图像内容,以实现多模式大型语言模式。加入图像内容理解能力之后,将有助于Kosmos-1识别文字以外的图像内容,甚至进一步判断动态视频描述内容。
文章为沃丰科技原创,转载需注明来源:https://www.udesk.cn/ucm/report/39687
上一篇: 网站在线客服系统有哪些优势功能?下一篇: 外呼机器人——提高客服效率和客户满意度的利器