语音对话不再“一根筋”
一直以来,让机器能够具有人性化的语音交互能力都是人工智能研究中的重难点。人类的交互则是自由而任性的,单纯的“一根筋”式的语音识别,根本不能满足自由的人机口语沟通的需求。上海交大电子信息与电气工程学院计算机系“东方学者”特聘教授、博导、联合实验室负责人俞凯表示,传统语音识别只解决特定环境下语音到文字转换,模拟耳朵的感知功能,而解决完整的口语人机交互,则是模拟人脑的全套认知功能,具有适应和思考能力的人机口语对话系统是一个人性化的“语音机器人”。
与传统语音识别和合成相比,认知型智能语音技术融入了自适应、理解纠错、智能反馈等认知技术。这使得机器可以适应更多环境和口音,具有进化调整的能力,从“能听会说”变成“会听能做”。
光能简单听懂还不够,新型人性化智能语音交互技术还包括“深度理解”以及“自动纠错”技术。“环境嘈杂程度、用户性别或方言特点、上下文、诗歌等都不再是识别难题。这些因素将从大数据重提取,并进行二次计算,实现自动纠正。”不仅如此,语音机器人可以被随时打断,还可以进行多轮人机对话,大幅提升人工智能化程度。
“智能老师”显身手
语音技术在课堂教学、口语考试及家庭学习中也能一显身手。俞凯团队在多个省市的中考英语中进行了自动口语评估的实践,以专家评测标准为基准,结果机器自动评测的准确程度高达89.4%,超过了普通老师(75%)。这项技术能实现人机交互式教学,一对一口语辅导,帮助用户随时随地练习地道口语,并实现针对口语发音及外语交流能力的自动化评估。
目前,俞凯团队研究的应用涉及语音识别、合成、理解、对话、声纹、口语评估等智能语音交互技术的各个领域,在智能语音技术方面取得了一系列在国内外领先的技术成果。
上海交大与思必驰信息技术有限公司合作发布的人性化智能语音交互技术平台“对话工场”,进入市场将打造以用户为中心的“语音机器人”,引领人机口语交互的“人工智能”潮流。