一家软件公司对一位记者进行了一次电话采访,他被问及:“你星期天通常都做些什么”、“你如何庆祝圣诞节”、“你喜欢什么样的同事”……采访时间总共不到15分钟。事后,软件工程师告诉记者说:“其实,你答复的内容根本就不重要;我们感兴趣的是你说话的声音以及说话的方式方法。我们的软件将通过分析为你制作出一份关于你的性格特征的资料。”
这位工程师还告诉记者,他的软件完全具有科学性,按定量分析的方式工作。对语句中的大量单词进行研究,但研究的不是内容,而是外表;换言之,软件在测量句子的长度、选择的单词是正面的还是负面的、某些词类的应用频率、话语的语调、重音、语速和单词之间的停顿……这一软件被称为“心理软件”,采用115个测量点,对语言进行分析并归纳成75类。
近几年来,全球在悄悄兴起各种“天才职业”,美国IBM-Kenexa公司和德国的SAP公司联合成立了一家合资公司,利用人事评价算法软件,打算研发一个“数据挖掘系统”,以便在劳务市场有的放矢地打探出货真价实的“行业达人”。数据挖掘系统的本领在于能从大量的数据中获得信息,通过分析、比对、研究,给出一个人的性格特点,供用人单位参考,比如一个求职者的敬业精神、证券公司的职员是否有风险意识、一个管理人员是否经受得住紧张……
对一个词或一句话进行分析归类时,不仅要注意句子结构和语法特点,而且不能疏忽说话声音,一个被强调的“我”和一个顺便说说的“我”是有区别的。软件可承担18万个性格特征的制作,在计算某一个性格时会用到多达50个的不同参数,好在这一切全是自动进行的。不过系统在执行任务前,先要为其输入许多语言样本,这些样本来自不同年龄组和不同社会阶层的5000名受试志愿者——滴水不漏地涵盖了整个公民横截面,他们的性格特征非常明显,事先分别作过各种心理测试并经心理学家评价过,他们的所有表述(包括自由说话、电子邮件、网络聊天等)都经加工后成为软件系统的数据资料。全部数据是制作新的性格特征的基础,随着参与者的不断增加,系统也就掌握了“机器学习”和“智能升级”的本领。至今为止的80多种基本性格特征还在不断扩大和细化,有关的性格特征也不断通过研究和测试受到检验并加以优化。
数据挖掘系统的用途很广,比如在刑侦破案中也能用到,但有人提出问题:作案嫌疑人通过故意改变声音或说话的方式方法,能否逃避语言检查。答案是:首先我们说话的方式方法是很难作较长时间改变的;其次,改变是没有多大意义的,因为没有人知道,在大量的语言碎片中,哪一种会在什么情况下出卖自己的精神状态;再次,系统能识别在电话里用假声说话的伪装者;另外,强制作出的放松状态也会被系统揭露。