中国对话式AI产品白皮书
智能会话系统是自然语言处理、人工智能和机器学习等技术融合的产物,它允许人们通过语音、文本与机器人进行交流,而机器人基于语音识别、自然语言理解、自然语言生成、语音合成等技术,对用户进行应答。
详情介绍
第一章 对话式AI产品市场概述
1. 产品定义
智能会话系统是自然语言处理、人工智能和机器学习等技术融合的产物,它允许人们通过语音、文本与机器人进行交流,而机器人基于语音识别、自然语言理解、自然语言生成、语音合成等技术,对用户进行应答。
广义的智能对话系统,包括消费硬件类产品和对话AI产品,本报告主要研究对象为对话AI产品。
l 消费硬件产品:典型产品包括Siri、小爱同学等语音助手产品;天猫精灵、百度小度等智能音箱产品;车载语音助手;智能家居产品。
l 对话AI产品:将智能对话系统加载在服务场景的对话式AI产品中,以文本、语音和多模态数字人等产品形式与终端用户交互,应用在客服、营销与泛交互等服务场景。
2. 产品分类
(1)产品类型
对话式AI产品按照产品定位的不同可分为替代类对话AI产品、辅助类对话AI产品。
替代类对话AI产品:即对话式AI产品的替代性功能,可替代人类完成咨询应答、业务办理、营销推荐和智能外呼等任务,主要包括文本机器人、语音机器人、虚拟数字人。
辅助类对话AI产品:即对话式AI产品的辅助性功能,包括对人工工作流程的引导、对话监测、对话洞察、对话引导。主要产品包括坐席助手、会话分析两类产品。
(2) 功能分类
对话式AI产品按照功能角度可以分为问答型、任务型和闲聊型。
问答型:通常为访客期望就自己提出的问题,机器人能给出相应的专业解答,表现为一问一答的形式。机器人相当于一个“知识顾问”,做“答疑解惑”的事情。常见的有FAQ、基于知识图谱的问答(KBQA)、表格问答(Table QA)和文档问答(Passage QA)等。
l FAQ检索型问答是根据用户的Query,匹配FAQ知识库最合适的答案并反馈给用户。
l KBQA会将知识以RDF三元组的形式进行存储,模型能够将答案定位到具体某个实体/属性,相比于FAQ,KBQA能够实现“推理”能力。
l 表格问答中,表格也可以看作是二维的知识图谱,模型会把用户的自然语言转化成SQL查询语句,直接从数据库里定位到答案。
l 文档问答在当前的工业界不常见,模型会基于用户的问题,将答案定位在文档的具体段落或者是某句话、某个词语。
任务型:通常为访客期望就自己提出的问题,机器人不仅能给出专业解答,还能主动反问获取相关信息,根据不同信息给出不同的解答。同时还可完成一些任务指令。广义上,无论是“专业解答”,还是“完成任务指令”,都是完成任务,故为“任务型”。
闲聊型:访客的预期是可陪伴自己聊天的机器人。无论访客说什么问题,机器人都可以接得上,聊得上。访客期待的不是某个具体目标的完成,而是情感上的陪伴。
(3) 对话领域分类
对话式AI产品按照对话领域可以分为限定域和开放域。
限定域:指的是机器人仅能在某个限定的领域内提供对话服务,而用户如果与机器人聊限定域之外的内容,机器人则回答不上来,工业界大部分的客服机器人都是限定域的对话式AI产品。
开放域:与限定域相反的则是开放域。用户可以与机器人聊各种各样的话题,机器人也能够给予丰富多样的回复,比如微软小冰。
限定域对话式AI产品往往能够很好地解决该领域内的用户问题,例如客服机器人能够代替传统人工客服解答大量重复性的问题,节省企业人力成本,因此在工业界应用最为广泛。而开放域对话式AI产品在当前市场上应用场景有限,且开放域对话式AI产品通常采用生成式实现方式来回复用户,回复内容不可控,因此在企业中的实际应用较少。