新民晚报数字报-巧用人工智能识别身体语言

A23：星期天夜光杯/新智

本版列表新闻

	巧用人工智能识别身体语言 ~~~
	智能视频系统自动识别手枪 ~~~
	神秘“消音室” 世上最安静 ~~~

2017年07月16日 星期日

放大

缩小

默认

巧用人工智能识别身体语言

凌启渝

■ 研究广场舞者

■ 舞者的动作被抽象成轮廓

■ 两位研究生为计算机大摆姿势

　　美国卡内基-梅隆大学机器人研究所（CMU RI）的科学家正在研究一种计算机系统，能读懂人的身体语言。这里所说的身体语言，甚至包括了手指的位置。新程序是实时运行的，并能针对人群中的每个人同时进行，这为人机互动开辟了更自然的通路。

　　说到与计算机的交流，目前最直观的还是打字、点击鼠标、触摸屏幕，当然现在又多了语音交流。但人类的交流方式其实并不限于语言，任何处理过犯罪青少年的人都知道，一半的交流来自于肢体语言。如果没有肢体语言的帮助，人们相互间的交流会变得事倍功半。

　　所以，尽管问题很棘手，还是得让计算机学会识别人的姿势。人的姿势通常非常微妙，有很多细节，包括诸如手指的位置；肢体还可能被物件或其他人遮挡。而另一方面，我们的大数据库中尽管有各种面部表情和身体位置的资料，但还鲜有关于手势和姿势的数据。

　　卡内基-梅隆大学机器人学副教授亚瑟·谢赫领衔的团队，结合多种方法来解决这个问题。最直观的，就是让两位研究生站在摄像机前，摆出成千上万种不同的手势和姿势，让计算机读入，从而为后者提供更多的数据。

　　团队的另一个研究思路，是改变计算机读取姿势的惯常方式。他们让计算机不看整个人，也不看身体的姿势，而只是盯着人的手、胳膊、腿和脸等部位，然后再将它们联系到人体。这对观察成群的人（比如，跳广场舞的大妈）特别有用。

　　研究中他们使用的是CMU全景工作室，这是由许多正六边形板材搭成的两层穹顶，内部嵌有500台摄像机。这使计算机能从数百个不同角度，对大量对象的姿势同时进行研究。

　　“系统每拍摄一下，就能采集到某人一只手的500帧视图，还自带标注手的位置，”机器人学博士生Hanbyul Joo说，“人手的面积小，我们的大多数摄像机难于处理。所以这次采用了31台高清晰度摄像机，以有效地建立庞大的数据集。”

　　团队目前正在研究如何从二维模型过渡到三维，以便提高识别质量。最终的目标是建立一个系统，能借助单一摄像机和单一笔记本电脑，读出一群人的姿势。

　　不言而喻，这项技术一旦成熟会有大量的应用，不只是让人通过简单指点与机器打交道。比如，帮自动驾驶车推断行人想何时跨入道路；跟踪场上的运动员，解读他们的行为动机；舞蹈大团导演轻松地找出“不协调”的舞者或动作等等。CMU RI团队甚至别出心裁地借助系统研究了特朗普总统和希拉里前国务卿在辩论会上的身、手动作，试图解读背后的含义。

　　该研究将于7月21日至26日在美国夏威夷火奴鲁鲁举行的2017计算机视觉与模式识别会议上发表。（图：CMU）凌启渝

放大

缩小

默认

	第A01版：一版要闻
	第A02版：要闻
	第A03版：阅读上海100胜15
	第A04版：上海新闻
	第A05版：上海新闻
	第A06版：2017年夏令热线特别报道
	第A07版：国际新闻
	第A08版：目击/新民印象
	第A09版：目击/新民印象
	第A10版：新视界
	第A11版：新视界
	第A12版：家装专版
	第A13版：文体汇
	第A14版：动态/文体汇
	第A15版：文体汇/聚焦
	第A16版：动态/文体汇
	第A17版：星期天夜光杯
	第A18版：读书/星期天夜光杯
	第A19版：/夜光杯
	第A20版：夜光杯/星期天夜光杯
	第A21版：星期天夜光杯/都市专栏
	第A22版：译文/星期天夜光杯
	第A23版：星期天夜光杯/新智
	第A24版：纪实/星期天夜光杯
	第A25版：星期天夜光杯/上海珍档
	第A26版：快乐作文/星期天夜光杯
	第A27版：康健园
	第A28版：健康养生/康健园
	第A29版：金色池塘
	第A30版：晚晴风景/金色池塘
	第A31版：金色池塘/长命百岁
	第A32版：银发社区/金色池塘

	巧用人工智能识别身体语言
	智能视频系统自动识别手枪
	神秘“消音室” 世上最安静