新年伊始,上海图书馆基于馆藏家谱文献,通过关联数据技术,发布了《华人家谱总目:上海图书馆家谱知识服务平台》(jp.library.sh.cn)。
简单地说,就是把藏在家谱中的部分内容放到网站上,同时通过手机端开发出“踏上寻根问祖的文化之旅”的检索系统,按百家姓A至Z顺序排列,读者即可快速地寻根问祖。
数字化平台刚刚起步
从无到有,开放一个家谱内容和知识的数据库,上图家谱上线,被业界誉为一次了不起的起步。记者登录后发现,查阅起来很便捷。
以“赵姓”为例,赵姓家谱在上海图书馆家谱数据库中共有765种,排名第20,谱籍地覆盖29个省,所录先祖名人共552位。这些开放数据提炼出“赵姓”族人的分布情况,也公布了有关姓氏家族的知识。比如,每一个姓氏的来源是什么?从古到今它有怎样的变迁?每个姓氏又有哪些家谱,被哪些机构收藏?有多少先祖名人?
据了解,以前读者要获得这些知识,先要去查目录,找到相关的收藏单位,把文献拿到手或找到电子版后,才能获得里面的知识。上图表示,类似的知识原来没有系统支持统计研究,馆员用关联数据技术从家谱文献中提取出来做成结构化的数据,读者就能够直接接触到数据、事实和知识,查起来更便利。
查不到家谱不要灰心
上海图书馆系统网络中心主持着上图家谱数字人文项目,是对家谱进行数字化服务的技术平台。中心副主任赵亮告诉记者,项目从今年起上线,前来上图寻根问祖的人很多,这是一个热点。这个系统成立后,很多老百姓很重视这件事,但也有人因找不到自己的确切谱系而感到灰心。“读者的个性查询,从目前看,还难以做到有查必应。因为按照中国两千年的家谱编修传统,往往是盛世修谱,兵祸战乱时散失。此外,在中国古代,修谱者中名门望族居多。”
上海图书馆中文家谱馆藏数量在全世界居于第一位(总量在6万部左右),但对比全球华人人口,3万多部的馆藏数量还是有限的,更何况,目前在上图网络平台上对外开放的家谱只有500余种,上图力争在数字平台开放的家谱数量升至2000部。
专家建议,普通读者来查家谱时,先要明确自己的祖籍地,知晓自己的堂号族号,还有辈分名等线索。“发展中的数字化技术的关联功能,能够交叉比对,有望在未来将原本孤立的宗族分支联系起来。在纸本家谱上没关联的家谱,通过数字化技术,有望建立关联,甚至合二为一。如果是印刷性的静态资源,可能就永远是孤立的存在了。只有做成了数据关联,把关系植入后才会有新的发现。”
数据库将不断改进
上图方面表示,原来的家谱总目是印本书,有错误需要等下一次改版时修订。现在提供这样一个平台,希望可以不断吸引专家、机构、读者参与,让他们把知识贡献出来,这个平台就会成为一个不断进化的平台。
有些家谱专家,特别是民间研究者,他们在家谱研究方面有自己的特色,对某个姓氏某个家族了解更深入。他们也可以把自己了解的知识输入到这个平台中来。比如,他们发现了某一文献的标引不准确,如谱籍地名,就可以把这个地名改正确。由于关联数据技术的使用,他只要改一次,就可以对整个知识库作贡献。随着专家知识的积累,这个数据库就变成了一个可以随时自我修正的活的知识库。
本报记者 乐梦融