新民晚报数字报-语音机器人：从听得见到听得懂

A08：上海新闻

本版列表新闻

	新婚1周妻患重病夫13年不离弃
	虹桥地区添生态新绿
	“互联网+菜篮子” 加出122家智慧微菜场
	上海打造物联网“生活圈”
	语音机器人：从听得见到听得懂

2015年05月21日 星期四

放大

缩小

默认

语音机器人：从听得见到听得懂

上海交大智能语音技术突破传统语音识别

易蓉

　　本报讯（记者易蓉）想去车管所，结果导航导去了厕所；想语音拨号，结果因为口音不对需要纠错……这些因不够“智能”造成的尴尬都将被解决，记者昨天从中德“有反馈的计算机辅助方法在二语习得及语音训练中的应用”双边研讨会上获悉，上海交通大学-思必驰智能语音技术联合实验室研发的认知型人机对话系统技术，将打造以用户为中心的“语音机器人”，能聪明识别口音、自动纠错，引领人机口语交互的“人工智能”潮流。

　　语音对话不再“一根筋”

　　一直以来，让机器能够具有人性化的语音交互能力都是人工智能研究中的重难点。人类的交互则是自由而任性的，单纯的“一根筋”式的语音识别，根本不能满足自由的人机口语沟通的需求。上海交大电子信息与电气工程学院计算机系“东方学者”特聘教授、博导、联合实验室负责人俞凯表示，传统语音识别只解决特定环境下语音到文字转换，模拟耳朵的感知功能，而解决完整的口语人机交互，则是模拟人脑的全套认知功能，具有适应和思考能力的人机口语对话系统是一个人性化的“语音机器人”。

　　与传统语音识别和合成相比，认知型智能语音技术融入了自适应、理解纠错、智能反馈等认知技术。这使得机器可以适应更多环境和口音，具有进化调整的能力，从“能听会说”变成“会听能做”。

　　光能简单听懂还不够，新型人性化智能语音交互技术还包括“深度理解”以及“自动纠错”技术。“环境嘈杂程度、用户性别或方言特点、上下文、诗歌等都不再是识别难题。这些因素将从大数据重提取，并进行二次计算，实现自动纠正。”不仅如此，语音机器人可以被随时打断，还可以进行多轮人机对话，大幅提升人工智能化程度。

　　“智能老师”显身手

　　语音技术在课堂教学、口语考试及家庭学习中也能一显身手。俞凯团队在多个省市的中考英语中进行了自动口语评估的实践，以专家评测标准为基准，结果机器自动评测的准确程度高达89.4%，超过了普通老师（75%）。这项技术能实现人机交互式教学，一对一口语辅导，帮助用户随时随地练习地道口语，并实现针对口语发音及外语交流能力的自动化评估。

　　目前，俞凯团队研究的应用涉及语音识别、合成、理解、对话、声纹、口语评估等智能语音交互技术的各个领域，在智能语音技术方面取得了一系列在国内外领先的技术成果。

　　上海交大与思必驰信息技术有限公司合作发布的人性化智能语音交互技术平台“对话工场”，进入市场将打造以用户为中心的“语音机器人”，引领人机口语交互的“人工智能”潮流。

放大

缩小

默认

	第A01版：一版要闻
	第A02版：广告
	第A03版：评论·随笔
	第A04版：要闻
	第A05版：焦点
	第A06版：上海新闻
	第A07版：上海新闻
	第A08版：上海新闻
	第A09版：社会新闻
	第A10版：中国新闻
	第A11版：国际新闻
	第A12版：国际新闻
	第A13版：财经新闻
	第A14版：文化新闻
	第A15版：文化新闻
	第A16版：广告
	第A17版：专版
	第A18版：体育新闻
	第A19版：体育新闻
	第A20版：医技/新民健康
	第A21版：新民健康/互动
	第A22版：夜光杯
	第A23版：夜光杯
	第A24版：阅读/连载
	第B01版：新民环球
	第B02版：论坛/新民环球
	第B03版：新民环球/博览
	第B04版：社会/新民环球
	第B05版：军界瞭望
	第B06版：人物/军界瞭望
	第B07版：军界瞭望/战例
	第B08版：兵器/军界瞭望
	第B09版：广告
	第B10版：好吃周刊
	第B11版：好吃周刊/美食物语
	第B12版：我家厨房/好吃周刊
	第B13版：好吃周刊/美食地图
	第B14版：美食大观/好吃周刊
	第B15版：市场之窗/资讯
	第B16版：地产资讯/新民楼市
	第B17版：新民楼市
	第B18版：地产资讯/新民楼市
	第B19版：广告
	第B20版：地产资讯/新民楼市
	第B21版：广告
	第B22版：地产资讯/新民楼市
	第B23版：广告
	第B24版：广告