B07:星期天夜光杯/新智
     
本版列表新闻
     
2016年09月04日 星期日 放大 缩小 默认   
机器人记者来了
凌启渝
  小明,中国人最普通的名字。从算术题,到造句讲故事,谁都能麻烦到他。不过这次在里约奥运会上,张小明可真是“高大上”了一回。他的大名变成了《奥运IT小记者张小明》,更有注脚是“基于大数据分析、自然语言理解和深度学习的人工智能机器人”。

  这位机器人记者Xiaomingbot,由今日头条实验室与北京大学计算机所(万小军团队)联合开发,结合了最新的自然语言处理、机器学习和视觉图像处理的技术,通过语法合成与排序学习,自动生成新闻。

  小明提前一周到奥运“上岗”,任务是报道乒乓球、网球、羽毛球和女足的赛事。机器人天生勤快,不知劳累,8月14日他一天“写”了58篇稿件;整个奥运时段发稿超过450篇。内容包括比赛名称、场地、开赛时间、运动员姓名国籍和年龄、世界排名、比赛持续时间、大比分、小比分,并能根据新闻人物添加了不同的配图。除了短讯,小明也能自动撰写长达千字的赛事报道。

  当然,里约奥运会上,小明并不孤单。美国《华盛顿邮报》派出一支机器人报道团队,以Heliograf软件从运动数据公司stats.com获取数据,自动生成多句子的短新闻,编辑成快讯在邮报及其推特上实时发布,或供通过邮报APP阅读。Heliograf报道的内容略少,提供每天的赛事时间表、比赛结果、奖牌榜等,不过也有“贴心”之举,比如会在某赛事开赛前15分钟提醒读者。奥运期间推送的实时消息不下600则。

  “自动成稿有可能改变邮报的报道。借助大数据和机器学习讲更多故事,将导致更个性化的定制新闻经验,”华盛顿邮报战略计划主任杰米·吉尔伯特说,“奥运会是证明该技术潜力的完美方法。两年前我们的体育记者还花很多时间手动发布赛况。被解放的记者和编辑将能添加现场分析和花絮,以自己独特的视角洞察故事。”

  数据科学工程总监山姆·汉说,“Heliograf接下来的挑战是扩大涵盖的主题,深化可能的分析种类,为我们的新闻编辑室确定潜在选题。”

  Heliograf将继续提高,适应对数据驱动的大型重要新闻的报道,包括即将到来的美国大选。这项技术也将能整合不同的数据源,如犯罪和房地产数字,根据个人用户的喜好定制故事,并会关注可能引发潜在新闻的异常数据。

  看来,机器人写手不仅是写个天气预报、股市行情那么简单,在奥运连发快讯也只是小试身手。百度的度秘就更加专业化,报道时能与人互动而更显加人性化。他甚至在先前的中美男篮比赛中展示过“资深篮球评论员”的风范。而主播风格灵活多变的微软小冰,则依托微软的人工智能体现了高超的预测技能。

  一个不得不想的问题是,智能机器人逐渐进入寻常百姓家,作者记者编者会不会失业。我的想法是,双方都得努力才行。不过,如果法制节目老有“一个身影进入了刑警的视线”;致富节目总是“就在她信心满满大干一场时,意想不到的厄运降临”的话,让机器人学会这几句,是“小菜一碟”的。 凌启渝

     
放大 缩小 默认   
   第A01版:一版要闻
   第A02版:G20在杭州
   第A03版:G20在杭州
   第A04版:G20在杭州
   第A05版:G20在杭州
   第A06版:新民邻声·热线/上海新闻
   第A07版:上海新闻
   第A08版:中国新闻
   第A09版:文体汇
   第A10版:动态/文体汇
   第A11版:文体汇/聚焦
   第A12版:动态/文体汇
   第A13版:广告
   第A14版:新视界
   第A15版:新视界
   第A16版:国际新闻
   第B01版:星期天夜光杯
   第B02版:读书/星期天夜光杯
   第B03版:星期天夜光杯/夜光杯
   第B04版:夜光杯/星期天夜光杯
   第B05版:星期天夜光杯/阅读·连载
   第B06版:都市专栏/星期天夜光杯
   第B07版:星期天夜光杯/新智
   第B08版:译文/星期天夜光杯
   第B09版:星期天夜光杯/市井故事
   第B10版:纪实/星期天夜光杯
   第B11版:星期天夜光杯/上海珍档
   第B12版:快乐作文/星期天夜光杯
   第C01版:金色池塘
   第C02版:晚晴风景/金色池塘
   第C03版:金色池塘/长命百岁
   第C04版:银发社区/金色池塘
机器人记者来了
新技术开辟新领域 毛皮也能三维打印
幼小向日葵 为何『追』太阳
机器人章鱼 全身软无骨
新民晚报星期天夜光杯/新智B07机器人记者来了 2016-09-04 2 2016年09月04日 星期日