新民晚报数字报

B16：新智

本版列表新闻

	描述性相机真奇特
	新型壁纸可防网络信息泄露
	气垫船飞起来

新民报系媒体：
新民网 |
新民晚报 |
社区版 |
大学版 |
新民周刊 |
新民地铁 |
美国版

业主周刊家庭周刊

街镇报系列

2012年06月01日 星期五

放大

缩小

默认

按下快门按钮输出文字描述

描述性相机真奇特

凌启渝

　　这台相机的用法，乍一看与普通相机大同小异：对准对象，按下快门按钮，拍摄下场景。然而，它输出的不是图像，而是对场景的文字描述。它是由纽约大学电子交互工程团队马特·理查逊等研发的所谓“描述性相机”。

　　请注意，我们所说的文字描述不是拍摄数据（如拍摄地点、日期时间），这些数据，是台数码相机就能提供的；描述性相机以文本方式输出有关照片内容的元数据。

　　它的确称得上另辟蹊径。

　　大家知道，人类积累了数量难以置信的照片，管理这个“图像海洋”变得越来越难。如果每张照片在拍摄当场就有相关的描述文本：照片里是谁、在做什么、环境如何，以后的事情就好办些，图片信息变得可以检索、过滤，可以交叉引用。在尚未有成熟技术实现图片内容检索的当下，描述性相机提供了可能的选择。

　　描述性相机的核心技术是亚马逊的土耳其机器人（Mechanica1TurK）Web服务应用程序接口。开发人员用它提交人工智能任务（HIT），让互联网上的相关人员去完成，在这里是为照片添加描述性文本。研究团队还为网上愿意参加工作的人设计了具有接受任务、预知报酬、提报结果等功能的用户界面。

　　描述性相机拍了一张照片，应用程序就会将照片通过Mechanica1TurK处理，发送到执行任务的人。后者会按规定写下描述，发回给服务器，再给相机。

　　相机快门按钮被按下后等待，通常3-6分钟内结果文本就能返回，并打印输出。每张照片的HIT价格约为1.25美元，执行者得到报酬，而亚马逊则收取百分之十的费用。

　　描述性相机在得州仪器嵌入式Linux平台Beag1eBone上运行，它连接着一台USB口网络摄像头、小型热敏打印机、状态指示灯和快门按钮。一系列Python脚本定义了各种接口，把从抓取场景、处理、错误掌控，到打印输出的不同部件整合起来。设备通过以太网连接到互联网，外接5伏电源。正在开发电池/无线的版本。

　　那么，描述性相机写下的文本长得怎样呢，我们不妨选几个场景让它描述一下：

　　●这是破旧建筑的模糊照片。它像是要倒塌，需要修理。

　　● (如图)看起来像个老旧的柜子，有名字牌、立柱灯连接到它。

　　●木地板的房间角落，工具箱，自行车，一摞书，书架靠在墙上，双门关闭，袋子挂在门把手，带手柄的线。

　　凌启渝

放大

缩小

默认

	第A01版：一版要闻
	第A02版：要闻
	第A03版：要闻
	第A04版：评论
	第A05版：焦点
	第A06版：广告
	第A07版：综合新闻
	第A08版：广告
	第A09版：科教卫新闻
	第A10版：民生新闻
	第A11版：法治新闻
	第A12版：社会新闻
	第A13版：早间点击
	第A14版：中国新闻
	第A15版：中国新闻
	第A16版：广告
	第A17版：财经新闻
	第A18版：财经新闻
	第A19版：财经新闻
	第A20版：国际新闻
	第A21版：国际新闻
	第A22版：广告
	第A23版：文娱新闻
	第A24版：文娱新闻
	第A25版：文娱新闻
	第A26版：广告
	第A27版：体育新闻
	第A28版：体育新闻
	第A29版：体育新闻
	第A30版：广告
	第A31版：职场方圆
	第A32版：地产新闻
	第A33版：新民环球
	第A34版：新民环球/聚焦
	第A35版：新民环球/人物·博览
	第A36版：新民环球/社会
	第B01版：家庭周刊
	第B02版：家庭/女性世界
	第B03版：休闲/全家乐
	第B04版：休闲
	第B05版：夜光杯
	第B06版：夜光杯
	第B07版：连载
	第B08版：阅读
	第B09版：现代家居
	第B10版：现代家居/实用谋划
	第B11版：家装之窗
	第B12版：广告
	第B13版：广告
	第B14版：地产新闻
	第B15版：新智/人与自然
	第B16版：新智
	第B17版：E生活
	第B18版：E生活/数字世界
	第B19版：E生活/数字家庭
	第B20版：E生活/家电生活