拜 IoT 物联网之赐,我们早已进入 PB 级(Petabyte)资料量的大数据时代,未来 Metaverse 元宇宙真的来到,全球资料量势必再翻好几个数量级达到 EB 级(Exabyte)的可怕程度。如今,全球每一天累积的资料量就达到 2.5PB,长此以往,每年全球所产生的资料将会呈现非常惊人的指数性增长,人们很快就会面临“储存能力赶不上资料产生速率”的棘手难题。或许专门储存我们基因资讯的 DNA,将会成为解决未来资料储存难题的圣杯。
在 EB 级超大数据量的冲击下,传统储存媒体完全不够看。根据《自然》期刊预测,如果我们所有影片、照片及文件都储存到传统闪存芯片上的话,那么到了 2040 年,该芯片所消耗的硅,将会是预期供应量的 10 到 100 倍。由此可见,面对未来资料储存,我们已到了非改弦更张不可的地步。
在寻求未来储存的诸多努力中,DNA 储存成为最有潜力的解决方案之一。与华盛顿大学分子资系统实验室("Molecular Information Systems Laboratory, MISL)合作的微软,即为当前 DNA 储存的先驱之一,该公司最近在将 DNA 作为资料储存的研究中取得一些突破与进展。
该公司在最新的一份研究论文中,宣布推出第一款“奈米级”DNA 储存写入器,该研究团队预计其 DNA 写入密度可达每平方公分 25 x 10^6 个序列,比之前产品写入密度高出“三个数量级”(1,000 倍)。其最重要的地方在于,该产品首度表明其成功达到 DNA 储存所需要的最低写入速度。
相对硬盘是使用 0 与 1 来储存,DNA 储存则使用 4 个化学碱基:腺嘌呤(adenine, A)、鸟嘌呤(guanine, G)、胞嘧啶(cytosine, C)和胸腺嘧啶(thymine, T)。这些化合物会成对连接,在双螺旋梯形结构上形成梯级。事实证明,透过 DNA 将 0 与 1 转换成 A/G/C/T 四个字母来储存复杂大数据绝对可行。
身为全球最大云端储存服务供应商之一的微软,就是看好 DNA 储存在密度、永续性及储存寿命上无与伦比的优势。据称,DNA 具备每平方英寸储存 1EB 资料的惊人储存密度,这是当前目前支援最大储存量之最佳储存方案 LTO 磁带远远无法达到的水准。而且磁带储存年限顶多 30 年,但 DNA 储存可延续保存数千年之久。
然而 DNA 却具备两大致命伤:写入速度与成本,尤其高昂的成本让人望之却步,目前数 MB 的 DNA 储存就要数千美元。随着微软奈米级 DNA 储存写入器的推出,以及最小写入速度阈值的掌握,DNA 写入速度已经进展到可行性的另一个阶段。微软接下来的重点研发工作就是嵌入数位逻辑芯片,让数百万电极点的个别控制,能以每秒储存数 KB 资料的速度写入 DNA 之中,一旦达成,届时 DNA 储存的效能与成本表现将达到与磁带相提并论的等级。
- Microsoft Makes Breakthrough in the Quest to Use DNA as Data Storage
(首图来源:Microsoft)