B03:新民环球/博览
     
本版列表新闻
个人特有遣词造句方式有助于专家识别“罪犯”~~~
个人特有遣词造句方式有助于专家识别“罪犯”~~~
     
2015年07月09日 星期四 放大 缩小 默认   
个人特有遣词造句方式有助于专家识别“罪犯”
“语言指纹”成为破案新技术
袁原
■ 英国作家J·K·罗琳以笔名出新书被语言分析技术识别“真身” 图GJ
  指纹是警察破案的重要线索,因其唯一性成为有效证据。如今,法医专家试图识别“语言指纹”,即每个人特有的遣词造句、行文布局的方式。

  在网聊和短信交流主导的数据时代,这项刑侦技术的应用前景广阔。然而,要成为拿得出手的证据,“语言指纹”必须提供更可靠的数据和理论支持。

  分析文本抓获罪犯

  多年前调查一起凶杀案时,美国联邦调查局前探员詹姆士·R·菲茨杰拉德在大量办案材料中意外发现一条线索:一个词。

  这是一起发生在亚拉巴马州的凶杀案,虽然将疑犯锁定为一个名为欧内斯特·泰德·斯托克斯的男子,调查人员却没有证据对其提出指控。这时候,他们收到一封匿名信件,其中内容若属实,案情走向将全然不同。

  菲茨杰拉德注意到,信中居然用“灯虫”(light bug)一词指代“灯泡”(light bulb)。这是作者笔误还是固有的习惯表达?菲茨杰拉德回放了询问斯托克斯的录音,惊喜地发现,疑犯居然也用“灯虫”指代“灯泡”。这条线索让菲茨杰拉德坚信,斯托克斯就是匿名信的作者。他想借此把调查引入歧途,却不慎在信件中留下了自己特有的语言指纹,被抓个正着。

  这不是菲茨杰拉德第一次通过分析文本抓获罪犯。

  纽约州女子斯泰茜·卡斯托在2005年杀死丈夫却逍遥法外,两年后又欲对亲身女儿下毒手。幸运的是,她一贯将“防冻剂”(antifreeze)错误地拼写、拼读为antifree,因此败露了罪行。

  长期写日记的乔斯琳·欧内斯特被发现突然死亡,身边遗留一张83字的留言条似乎是她的“自杀”遗言。

  然而,菲茨杰拉德断定,如此短促、简约的遗言不可能出自死者本人,因为日记显示她的写作风格绚丽、篇幅较长。法院最后判决,欧内斯特的丈夫才是谋杀她的凶犯。

  菲茨杰拉德并非唯一一个从语言表达习惯中寻找蛛丝马迹的探案人员。英国警方2008年说服陪审团相信,一名年轻女子失踪后,其手机发出的短信皆为疑犯所发,因为其中涉及“我”和“自己”的表达均为利物浦方言,与受害人表达习惯不一致。

  随着电子邮件、手机短信、社交网站留言的普及,越来越多匿名文本信息成为涉案材料。辨别这些信息的真实出处对破案至关重要,语言鉴定学日益成为一种受重视的侦探手段。

  通过识别“语言指纹”,警察能够推测谁发出了死亡威胁电子邮件,或者辨别自杀现场的遗书真伪。私人侦探甚至也被雇用调查,究竟是哪个不满的职员在互联网上发布了关于公司或老板的负面消息。

  催生法医语言鉴定学

  与采集犯罪现场的指纹不同,试图在文本资料中寻找罪犯留下的蛛丝马迹,既要有直觉,也要懂科学,因此催生法医语言鉴定学这门新兴学科。

  见识了“语言指纹”的破案威力后,菲茨杰拉德专门修读了霍夫斯特拉大学全美唯一的法医语言学硕士学位,并在2007年退休后加入法医行为学的智库“学术集团公司”,专事语言文本分析。

  这个工作听上去有趣,其实枯燥、繁琐。通常,菲茨杰拉德会把自己所接触的文本资料分为“问题文档”和“已知文档”两大类。前者是作者不详或可疑的涉案文档,后者是作者明确的比对文件。

  坐在办公桌前逐字阅读这些文档是菲茨杰拉德的主要工作,任何一个错误的拼写、误用的标点符号或省略掉的词缀都可能成为破案线索。这个工作需要灵感。整个过程像“行为分析”,但更科学。

  坚信文本分析价值的语言学家认为,无论用词选择、拼写习惯还是标点符号都是带有鲜明个人特色的“语言指纹”。至于句子结构、文章布局等微妙层面,更是作者潜意识的自然流露。

  已退休的语言学教授罗杰·舒伊可谓美国法医语言鉴定的奠基人。在一起著名案件中,他帮助警察分析绑架信,指出“魔鬼带”(devil strip)是俄亥俄州阿克伦城特有的表达习惯,指人行道和马路之间的绿化带。警察果然在当地抓到了绑匪。

  为说服陪审团或法官相信“语言指纹”的科学性,越来越多从事法医鉴定的语言学家致力打造一个庞大的数据库。每当发现文本中有特色表达,菲茨杰拉德都将其与数据库比对,衡量这种表达出现的频率。

  在互联网搜索、查阅美国地区方言字典并咨询多位语言学家之后,菲茨杰拉德判定,“灯虫”是一种集合了方言特色的个人化表达,使用者只有一人,因此锁定了疑犯身份。

  科学性仍然存在争议

  通过文本分析推断作者,这终究是主观性极强的工作,不少语言学家都曾失手。用这种分析手段取证、定罪,自然存在争议。

  在美国,并非所有法官和陪审团都接受“语言指纹”为证据。布鲁克林法学院教授劳伦斯·索兰说,争论关键在于语言学鉴定是否足够科学,其准确率是否足够高。

  目前在美国,从事语言学取证的法医鉴定人员主要分为两个流派。一类是菲茨杰拉德那种凭借灵感和直觉行事的专家,在拼写和用词方面寻找作者的个人特点。另一类是电脑派,他们运行软件分析大量文本,比对数据寻找作者。

  这两种方法都有不少问题。特拉华州的语言证据研究所创始人戴维·A·哈里斯认为,除非总结出一套可供每个案例复制的语言鉴定方法,否则所谓的“语言指纹”难以成为令人信服的证据。除非提供可核实的数据,否则这种方法“被DNA证明抓错人只是时间问题”。

  关于“语言指纹”的争议还引发了何为科学鉴定的讨论。即使是准确率较高的指纹取证也并非完全可信。“指纹大部分时候可信,”哈里斯解释,但如果视其为绝对标准则有违科学的存疑精神。

  “法医鉴定学诞生于警察局的实验室,不是科学实验的产物,很大程度上取决于人为的解释和判断,不是严格意义上的科学。”哈里斯说。20世纪80年代DNA鉴定问世后,专家们终于能够确保鉴定结果准确。

  不过,语言鉴定仍然是有价值的刑侦手段。菲茨杰拉德说,自己从未需要证明准确性。在许多案子中,刚提到“语言指纹”,疑犯就供认不讳了。袁原

  相关链接

  用语言分析找出畅销书真正作者

  英国作家J·K·罗琳因为创作了哈利·波特系列小说而闻名世界。盛名之下,欲掩其踪,罗琳故意化名一个新手作家投稿,想摆脱“哈利·波特之母”的光环创作。

  她化名退伍军人罗伯特·加尔布雷思,写作了推理小说《杜鹃的呼唤》。这本名为《杜鹃的呼唤》的书中,主人公是一名曾在战争时期当过兵的私家侦探,名叫科尔莫朗·斯特莱克。他在书中对一位模特从伦敦闹市区阳台坠楼身亡的事件进行了调查。

  该书在2013年4月出版后引来评论。一篇书评称这是“一个璀璨的首次亮相”,另外一个则惊叹于这位“男性”作家对女性服装的理解程度。因此人们猜测加尔布雷思可能是一位作家的化名。

  《星期日泰晤士报》通过调查发现了这位“新晋作家”的秘密。英国《星期日泰晤士报》在语言学家帕特里奥·尤奥拉的帮助下,终于在4个月后识破了《杜鹃的呼唤》真实作者的身份。尤奥拉用电脑软件分析比对了该书和罗琳先前的作品,确定她为这本书的作者。

  最初让人联想到罗琳的线索是,这本新书的出版商就是出版了她《偶发空缺》的出版商。在《哈利·波特》系列完结之后,罗琳曾一度想过封笔。沉寂4年后,她出版了第一部成人小说《偶发空缺》。由于《偶发空缺》毁誉参半,罗琳在出版这本侦探小说时,选择了隐蔽度很高的男性名字作为笔名。然而最终还是被语言分析技术“识破”。

  J·K·罗琳称她本想让秘密保持得更久些,“因为作为罗伯特·加尔布雷思是一个很自由的经历,出版的时候没有炒作,也没有公众过高的期许,只有作为另外一个身份获得反馈时的欢愉。”

     
放大 缩小 默认   
   第A01版:一版要闻
   第A02版:时政·要闻
   第A03版:时政新闻
   第A04版:焦点
   第A05版:评论/随笔
   第A06版:2015年夏令热线特别报道
   第A07版:2015年夏令热线特别报道
   第A08版:上海新闻
   第A09版:广告
   第A10版:上海新闻
   第A11版:上海新闻
   第A12版:新民资讯
   第A13版:社会新闻
   第A14版:互动
   第A15版:中国新闻
   第A16版:中国新闻
   第A17版:国际新闻
   第A18版:国际新闻
   第A19版:专版
   第A20版:文体新闻
   第A21版:文体新闻/文娱
   第A22版:体育/文体新闻
   第A23版:文体新闻/体育
   第A24版:财经新闻
   第A25版:新民健康/互动
   第A26版:医技/新民健康
   第A27版:市场之窗/资讯
   第A28版:夜光杯
   第A29版:夜光杯
   第A30版:大购网专版
   第A31版:阅读/连载
   第A32版:广告
   第B01版:新民环球
   第B02版:论坛/新民环球
   第B03版:新民环球/博览
   第B04版:社会/新民环球
   第B05版:好吃周刊
   第B06版:吃遍中国/好吃周刊
   第B07版:好吃周刊/我家厨房
   第B08版:广告
   第B09版:新民楼市
   第B10版:地产资讯/新民楼市
   第B11版:广告
   第B12版:地产资讯/新民楼市
   第B13版:新民楼市/地产资讯
   第B14版:地产资讯/新民楼市
   第B15版:广告
   第B16版:广告
“语言指纹”成为破案新技术
广告
新民晚报新民环球/博览B03“语言指纹”成为破案新技术 2015-07-09 2 2015年07月09日 星期四