这位机器人记者Xiaomingbot,由今日头条实验室与北京大学计算机所(万小军团队)联合开发,结合了最新的自然语言处理、机器学习和视觉图像处理的技术,通过语法合成与排序学习,自动生成新闻。
小明提前一周到奥运“上岗”,任务是报道乒乓球、网球、羽毛球和女足的赛事。机器人天生勤快,不知劳累,8月14日他一天“写”了58篇稿件;整个奥运时段发稿超过450篇。内容包括比赛名称、场地、开赛时间、运动员姓名国籍和年龄、世界排名、比赛持续时间、大比分、小比分,并能根据新闻人物添加了不同的配图。除了短讯,小明也能自动撰写长达千字的赛事报道。
当然,里约奥运会上,小明并不孤单。美国《华盛顿邮报》派出一支机器人报道团队,以Heliograf软件从运动数据公司stats.com获取数据,自动生成多句子的短新闻,编辑成快讯在邮报及其推特上实时发布,或供通过邮报APP阅读。Heliograf报道的内容略少,提供每天的赛事时间表、比赛结果、奖牌榜等,不过也有“贴心”之举,比如会在某赛事开赛前15分钟提醒读者。奥运期间推送的实时消息不下600则。
“自动成稿有可能改变邮报的报道。借助大数据和机器学习讲更多故事,将导致更个性化的定制新闻经验,”华盛顿邮报战略计划主任杰米·吉尔伯特说,“奥运会是证明该技术潜力的完美方法。两年前我们的体育记者还花很多时间手动发布赛况。被解放的记者和编辑将能添加现场分析和花絮,以自己独特的视角洞察故事。”
数据科学工程总监山姆·汉说,“Heliograf接下来的挑战是扩大涵盖的主题,深化可能的分析种类,为我们的新闻编辑室确定潜在选题。”
Heliograf将继续提高,适应对数据驱动的大型重要新闻的报道,包括即将到来的美国大选。这项技术也将能整合不同的数据源,如犯罪和房地产数字,根据个人用户的喜好定制故事,并会关注可能引发潜在新闻的异常数据。
看来,机器人写手不仅是写个天气预报、股市行情那么简单,在奥运连发快讯也只是小试身手。百度的度秘就更加专业化,报道时能与人互动而更显加人性化。他甚至在先前的中美男篮比赛中展示过“资深篮球评论员”的风范。而主播风格灵活多变的微软小冰,则依托微软的人工智能体现了高超的预测技能。
一个不得不想的问题是,智能机器人逐渐进入寻常百姓家,作者记者编者会不会失业。我的想法是,双方都得努力才行。不过,如果法制节目老有“一个身影进入了刑警的视线”;致富节目总是“就在她信心满满大干一场时,意想不到的厄运降临”的话,让机器人学会这几句,是“小菜一碟”的。 凌启渝