我们可能都有不同容量的存储设备,如 SSD、闪存设备和 SD 卡,但我们可能需要一个新的存储设备,因为它们都会随着时间的推移而变满,但现在我们可能不必像纽约的科学家一样担心它们的容量基因组中心提出了一种在 DNA 中编码数字数据的新方法,以创建有史以来密度最高的大规模数据存储方案。它能够在一克 DNA 中存储 215 PB(2.15 亿千兆字节)(这意味着它可以将人类记录的每一位数据存储在一个容器中,大约有几辆皮卡车的大小和重量)并且它可以可能持续数十万年。这不是很酷吗?
他们是如何做到的呢?
我们细胞中的 DNA 包含构建所有维持我们运转的蛋白质的指令。 DNA 由核酸腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶(A、G、C 和 T)的重复序列组成,有时称为碱基对。每个三个碱基的序列转化为不同的氨基酸,它们是蛋白质的组成部分。它的数据存储就像我们使用硬盘驱动器所做的那样,但具有更高的潜在密度。
DNA 的四字母核碱基字母表(A、C、G 和 T)可以转换为二进制代码——例如,A 为 00,C 为 01,G 为 10,T 为 11。科学家们研究了算法用于对数据进行编码和解码,首先将文件转换为 1 和 0 的二进制字符串,将它们压缩成一个主文件,然后将数据拆分为二进制代码的短字符串。他们设计了一种称为DNA 喷泉的算法,该算法将字符串随机打包成小滴,然后添加额外的标签将文件重新组合在一起。
他们从六个文件开始,包括一个完整的计算机操作系统和一个计算机病毒。总之,研究人员生成了一个包含 72,000 条 DNA 链的数字列表,每条链的长度为 200 个碱基。他们将这些作为文本文件发送,然后将序列输入计算机,计算机将遗传密码翻译回二进制文件,并使用标签重新组装六个原始文件。该方法非常有效,以至于新文件不包含任何错误,并且还能够制作几乎无限数量的文件无错误副本。
优点:
存储限制
基于细菌遗传学的估计表明,数字 DNA 有朝一日可能与当今的存储技术相匹敌或超越。
Hard Disk | Flash Memory | Bacterial DNA | |
---|---|---|---|
Read-write speed (µs per bit) |
~3,000 – 5,000 | ~100 | <100 |
Data retention (years) |
>10 | >10 | >100 |
Power usage (watts per gigabyte) |
~0.04 | ~0.01 – 0.04 | <10-10 |
Data density (bits per cm3) |
~1013 | ~1016 | ~1019 |
DNA 在存储数字数据方面具有许多优势。
- 它是超紧凑的。
- 如果保存在阴凉干燥的地方,它可以持续数十万年。
- 只要人类社会在读取和写入 DNA,他们就能够对其进行解码。
- DNA 不会像盒式磁带和 CD 那样随时间降解,也不会过时。
缺点:
- 高成本。
- 与传统的计算机晶体管相比,DNA 的读取难度要大得多,速度也更慢,也就是说,就访问速度而言,它实际上比我们普通的计算机 SSD 或旋转磁性硬盘驱动器更不像 RAM。