“大数据”这个词汇是随着信息时代的来临出现的,它表明我们的生存状态。面对海量的信息,如何能够从中甄别、分析、整理出新的资料,延伸成为自己生存需要的数据,这是一个不断的追问。在这样的时代,无论是政府、商业组织,还是个人都面临着终极考验,对于数据的整理能力成为最终的决定因素,国家的治理尤其如此。于是,涂子沛的《大数据》就是这样展示给读者一个最新领域的理念,因为我们已经生活在里面,所以不得不面对和思考。
作者整本书的例子是美国政府面对数据的经历,从《信息自由法》的出台引发政府所有的文件需要公开到《电子信息自由法》涉及到的电子文档公开。政府信息公开的目的在于建设一个完全透明的政府,在于公众交纳税收的付出必须具备知情权,在于大法官布兰代斯所说“阳光是最好的防腐剂”。但是,在信息公开的过程中尤其是在收集信息的过程中往往涉及到隐私的羁绊,于是数据整合和隐私保护之间的矛盾成为信息时代不得不面对的课题。一方面,政府在不断收集全社会的数据,另一方面这些数据必然涉及到个人的隐私。如何权衡和取舍,关系到大数据时代的发展裂变。
尽管,作者所列的都是美国的例子,但对于大数据时代如何整理也有着核心的考虑。那就是,在这样的一个信息爆炸的时代,首先需要开发有效的开发工具将数据有效挖掘出来;其次要开发高效的数据分析软件将挖掘出来的数据进行分析;最后的关键需要有效的数据管理人员,这才是信息时代的宠儿。如果一个国家能够有效进入这样的时代程序内,历史学家黄仁宇所谓的“数目字管理”便会有效推进,也成为治国的有效手段。但是同样需要警惕的是乔治·奥威尔在《一九八四》中所描绘的“老大哥”的形象,因为大数据的整理必然会在技术上显得“无孔不入”而入侵到个人隐私的方方面面。
所以,大数据作为一个新课题,对于政府来说,公开透明、公民参与、多方合作将成为主流;对于商业组织来说,如何把握数据的潮流趋向从数据中探寻到商业机会;对于个人而言,知情权和隐私权的较量也将持续不断。但终极的原则仍旧需要在法律保护隐私的基础之上实现信息的公开,这乃是信息时代的生存法则。