您的位置:首页 >Nature杂志 > 生理学 >

研究克服了扩大DNA数据存储的主要障碍

导读 北卡罗来纳州立大学的研究人员开发了基于DNA的信息存储系统中标记和检索数据文件的新技术,解决了广泛采用DNA数据存储技术的两个主要障碍。

北卡罗来纳州立大学的研究人员开发了基于DNA的信息存储系统中标记和检索数据文件的新技术,解决了广泛采用DNA数据存储技术的两个主要障碍。

“DNA系统因其潜在的信息存储密度而具有吸引力;理论上它们可以存储在相当大小的传统电子设备中存储的数据量的十亿倍,”詹姆斯塔克说,他是一篇关于这项工作的论文的共同通讯作者。北卡罗来纳州电气和计算机工程副教授。

“但这里面临的两大挑战是,你如何识别包含你正在寻找的文件的DNA链?一旦你识别出这些链,你如何删除它们以便它们可以被读取 - 并且如果没有摧毁了这股?“

“以前的工作已经提出了一个系统,它将短的,20个单体长的DNA序列称为引物结合序列,存储信息的DNA链的末端,”该论文的共同作者Albert Keung说道。北卡罗来纳州化学与生物分子工程助理教授。“您可以使用与相应引物结合序列匹配的小DNA引物来鉴定包含所需文件的合适链。但是,这些结合序列估计只有30,000个,这对于实际应用是不够的。我们想要找到克服这种局限的方法。“

为了解决这些问题,研究人员开发了两种技术,它们一起称为DNA富集和嵌套分离,或DENSe。

研究人员使用两个嵌套的引物结合序列解决了文件识别挑战。系统首先识别包含初始结合序列的所有链。然后,它对该子集的子集进行第二次“搜索”以挑出包含第二个结合序列的那些链。

“这使估计文件名的数量从大约30,000增加到大约9亿,”塔克说。

一旦确定,仍然需要提取文件。现有技术使用聚合酶链式反应(PCR)来制备相关DNA链的许多(和大量)拷贝,然后对整个样品进行测序。因为有很多拷贝的靶DNA链,它们的信号会压倒样品中其余的链,从而可以识别靶DNA序列并读取文件。

“这种技术效率不高,如果你试图从高容量数据库中检索数据,它就不起作用 - 系统中存在太多其他DNA,”Kyle Tomek博士说。北卡罗来纳州立大学学生,该论文的共同主要作者。

因此,研究人员采用了不同的数据检索方法,将几个小分子标记中的任何一个附加到用于鉴定靶向DNA链的引物上。当引物找到目标DNA时,它使用PCR制作相关DNA的拷贝,并将拷贝附加到分子标签上。

研究人员还利用涂有分子的磁性微珠,这些分子与给定标签特异性结合。这些功能化的微珠“抓住”靶DNA链的标签。然后可以用磁铁取回微珠,用它们带来靶DNA。

“这个系统允许我们检索与特定文件相关的DNA链,而不必制作每条链的许多拷贝,同时还保留数据库中的原始DNA链,”Keung说。

“我们已经使用样本文件实验性地实现了DENSe系统,并且已经证明它可以用于存储和检索文本和图像文件,”Keung补充道。

“这些技术在串联使用时,为开发具有现代容量和文件访问功能的基于DNA的数据存储系统打开了大门,”Tomek说。“接下来的步骤包括扩大规模并使用更大的数据库测试DENSe方法,”Tuck说。“成本面临巨大挑战。”该论文“推动基于DNA的信息存储系统的可扩展性”发表在ACS Synthetic Biology期刊上。

免责声明:本文由用户上传,如有侵权请联系删除!