新系统采用了太赫兹辐射,也就是波段介于微波和红外光之间的电磁辐射。由于不同的化学物质吸收不同频率太赫兹的程度不同,每一种化学物质(比如纸张上的油墨)都有独特的频率签名,这就可能用来分辨油墨和空白处。而这是X射线做不到的,尽管它也能穿透表面;另外,太赫兹波还有比超声波更好的深度分辨率。
“白纸和油墨材料吸收光谱的状况不同。”麻省理工研究员巴马科·赫西迈特说,“我们又使用算法调整光谱对比度,使字符尽可能清晰,为后续的字符识别算法见到字母作好准备。”
下一个关键是书页的分辨。相邻页面之间微小空隙的折射率与纸张有所不同,系统需要利用这个特性。实验中采用标准的太赫兹相机来发射超短脉冲,用内置的传感器测量其反射回来所需要的时间,随后用算法确定到书本中每页纸的距离,做到分辨书页。
书页能分辨了,各页表面的化学性质信息也提取了,还采取了一些措施过滤掉那些绕页辐射所造成的“噪声”。尽管如此,得到的图像还是经常失真,或者残缺,难以识别。佐治亚理工学院团队就配合开发了一套专门的算法,能解析这些扭曲或不完整的图形,将其解释成一个个独立的字母。
那么,目前的设备能不能读合着的书呢?其实还远远不能。更别说“标题党”所言:“不必买书了,带仪器逛书店把全场的书都扫描了”。据发表在《自然通信》杂志上的介绍,研究人员是用一叠纸来测试他们的样机的,每张纸上只打印了一个字母。结果,系统能准确地识别最上面9张纸上的字母(包括附图中的这个“T”)。再往下,反射的太赫兹信号能量太低,传感器无法分辨不同太赫兹频率的签名,“书”就念不下去了。
未来的研究将努力提高探测器的精度和辐射源的功率,实现更深的渗透。希望该技术有朝一日能用来读那些老得掉渣、不敢再翻动的书籍,做到“不开卷,就受益”。稼正