DNA密码学
密码学是处理信息编码以隐藏信息的科学分支。它在通信安全的基础设施中起着至关重要的作用。在 Leonard Max Adleman 在 1994 年展示了分子计算能力之后,Ashish Gehani 等人和 Amin 等人完成了这项开创性工作。这为 DNA 计算铺平了道路。 DNA密码学结合了密码学和现代生物技术。
为什么选择 DNA 密码学?
- DNA密码学是世界上发展迅速的技术之一。
- Adelman 向世界展示了它如何用于解决复杂问题,例如有向 Hamilton 路径问题和 NP 完全问题(例如旅行商问题)。因此,用户可以设计和实现更复杂的加密算法。
- 它为打破牢不可破的算法带来了新的希望。这是因为 DNA 计算提供了更高的速度、最小的存储和功率要求。
- DNA 以大约 1 位/nm3 的密度存储内存,而传统存储介质需要 1012 nm3/位。
- 在进行计算时,DNA 计算不需要电源。
- 令人惊讶的是,一克 DNA 包含 1021 个 DNA 碱基,相当于 108 TB 的数据。因此可以以几毫克的形式存储世界上所有的数据。
DNA密码学可以定义为根据DNA序列隐藏数据。就像 RSA 和 DES 算法一样,在 DNA 密码学中,用户拥有诸如“使用 DNA 作为密钥分发的单向函数的公钥系统”、“DNASC 密码系统”、DNA 隐写系统、三级 DNA 密码学、加密等 DNA 算法受 DNA 和混沌计算启发的算法。
那么,如何在主要由 4 个含氮碱基组成的 DNA 链中编码数据,即:
- 腺嘌呤 (A)
- 胸腺嘧啶 (T)
- 胞嘧啶 (C)
- 鸟嘌呤 (G)
最简单的编码方法是将这四个单元表示为四个数字:
A(0) –00
T(1) –01
C(2)–10
G(3)–11
- 通过这些编码规则,有 4!=24 种可能的编码方法。基于一些原则,例如 A 和 G 成对,而 T 和 C 成对。
- 在这 24 种方法中,只有 8 种符合 DNA 配对规则,但最佳编码方案是 0123/CTAG。
所以现在理论上将我们的初始数字转换为 A、T、G 和 C 的序列。然后使用各种 DNA 合成技术(例如化学寡核苷酸合成和寡核苷酸合成平台(包括基于列的寡核苷酸合成、基于阵列的寡核苷酸合成、复杂链和基因合成以及纠错))在物理上实现这一点。
让我们以经典的 XOR One Time Pad 为例,看看它是如何使用 DNA 密码学实现的:
示例 –设 M 为消息,K 为键。通过找到 M xor K = C 获得密文。用户可以通过执行以下操作再次获得 Encoded 消息:C xor K = M xor K xor K= M。因此,得到我们的原始消息。实施它所涉及的步骤是:
- 消息和 OTP 密钥被转换为 ASCII 位
- 零填充被添加到消息和密钥中,以使其二进制代码的大小均匀
- 消息和密钥被异或在一起
- XOR 输出以 DNA 碱基格式表示。这是我们的加密文本。
解密过程涉及以下过程,因此也容易被窃听:
- 所有的 DNA 碱基都转化为比特。
- 然后将这些位与 OTP 密钥位进行异或运算,以重现原始纯文本。
- 这个以二进制格式获得的文本随后被转换为 ASCII字符序列。
同样,用户可以实现其他加密算法,如 AES 甚至 DES。不是将数据存储为 0 和 1 的序列,而是将它们存储为含氮碱基的序列。以 DNA 的形式存储信息使我们能够在一个小区域内存储大量数据。