DNA是自然界存储生物基因信息的核心载体。基于DNA的数据存储有非常高的存储密度(10的9次方GB/mm的立方)、存储容量、和持久性(半衰期500年)且能量消耗很低。

DNA链由4种不同的核苷酸组成,每个核苷酸携带腺嘧啶(A)、鸟嘧啶(G)、胸腺嘧啶(C)和胞嘧啶(G)四种碱基中的一种,代表其携带不同的信息,比如A→00, G→10, C→01, T→11。

在DNA合成和测序的过程中,可能发生许多错误,导致无法正确恢复存储的信息,可借助编码的手段,通过引入冗余使编码具备纠错的能力,即将原始信息序列(取自某个有限域)映射到(符号集{A, G, C, T}上的)DNA码字空间里,并保证码字之间的最小汉明距离超过一定的阈值,在解码过程中利用合适的判别准则正确地恢复原始序列。

此外,DNA码字还必须满足如下四种重要约束:

  1. GC-Content约束。按照碱基互补配对原则,A=T,G≡C。G与C之间的化学键较强,DNA链中G和C的比例会影响其稳定性和退火温度。通常G和C的比例保持在50%左右的DNA链的稳定性最高,因此基于DNA的数据存储选择接近50%的GC比例。
  2. Homopolymer Run-Length约束。DNA序列中由相同碱基连续排列组成的子串称作Homopolymer Run,其最大长度称作序列的Run-Length。在DNA序列的合成和测序过程中,Run-Length较高的子串更易产生错误,所以要尽可能避免出现较长的Homopolymer Run。
  3. 反转(Reversible)约束。任意DNA码字的反转与其他码字的汉明距离必须超过码字的最小汉明距离,从而避免序列反转后译码出现错误。
  4. 反转互补约束(Reversible-Complement)约束。任意DNA码字的反转互补与其他码字的汉明距离必须超过码字的最小汉明距离。

此外,由于组成不同的DNA链形成二级结构的倾向不同,展开二级结构需要额外的能量,影响实际存储效率。所以,设计具备特定结构的DNA码以避免二级结构形成也是一项约束。

参考文献

​1. On DNA Codes Over the Non-Chain Ring  with , https://doi.org/10.48550/arXiv.2211.13925

2. Construction of Multiple Constrained DNA Codes, https://doi.org/10.48550/arXiv.2211.16096​

编码与DNA存储——DNA码的构造相关推荐

  1. 让DNA说Hello!微软成功研制用DNA存储读取数据的全自动系统

    大数据文摘出品 来源:微软 编译:林安安.夏雅薇.周素云 现代存储技术已经无法满足字节的海啸式增长,但是大自然也许已为这个难题提供了解决方案. 比如,DNA. 上个月,来自微软和华盛顿大学的研究人员宣 ...

  2. DNA存储,拯救人类数据危机的良方?

    来源:脑极体 开一个脑洞:如果地球正在面临一场马上到来的毁灭性星际灾害,人类又想尽可能地保存地球的生命和文明,在现有条件下,该怎么办? 像大刘一样让地球停止自转然后逃离太阳系,这恐怕来不及了.而如果像 ...

  3. [解密] DNA存储技术究竟牛在哪里?

    针对未来存储密度市场,前期在文章"50TB ExaDrive SSD投入商用"和"HP忆阻器内存和IBM原子磁盘"中,分别介绍了大容量SSD.忆阻SCM和原子存 ...

  4. 存储新图谱:DNA存储的边界与天地

    数字信息时代,无论是生产数据的各大视频网站.应用平台等,还是消费者们使用的各类电子设备,都无不在时时刻刻产生数据. 拿自动驾驶举例来说,平均每辆自动驾驶车每天产生的数据量高达10TB.根据IDC机构的 ...

  5. DNA存储:这些公司正在开启数据存储的未来

    来源:资本实验室 随着数字化时代的到来,可以毫不夸张地说,数据存储与安全正在成为整个社会正常运行的基础.同时,物联网.人工智能.虚拟现实.自动驾驶等新技术的应用则进一步大幅提升了数据存储要求. 据ID ...

  6. DNA存储技术创造新纪录 存储容量已达200MB

    DNA存储技术是利用人工合成的脱氧核糖核酸(DNA)作为存储介质,具有高效.存储量大.存储时间长等优点.据外媒报道,近日来自微软和华盛顿大学的一组研究人员宣布他们已经在DNA存储技术方面创造新纪录,目 ...

  7. 存储新纪元:在DNA存储海量信息,商业化才是硬道理

    概述:如今,将数据信息存储在DNA上的成本已经足够便宜,因此该技术有望实现商业化. 数据已经是21世纪不可或缺的东西,当然数据存储也就成了人们重点关心的,没有足够的容量去存储,数据不断的流失这也是很大 ...

  8. 微软黑科技:DNA存储技术催生方糖大小的数据中心

    凤凰科技讯 北京时间4月12日消息,据科技网站Computerworld报道,微软和华盛顿大学研究人员已经展示了利用人工合成DNA作为数据存储介质的技术. 研究人员表示,如果这一技术成熟到适合主流应用 ...

  9. 微软拟用DNA存储数据:一段就能顶一个数据中心

    5月24日消息,据Technologyreview报道,微软公司旗下研究院的研究人员表示,在早期利用NDA存储电影和文档的研究基础上,该公司正在研发利用生物学取代磁带驱动器的存储装置. 微软研究院的计 ...

最新文章

  1. 新的工作电脑 神州优雅A550-i7
  2. vue 多页面iframe不刷新_Vue中iframe保持活动状态(不刷新)
  3. input type=file change事件只触发一次
  4. TCP的那些事(转载)
  5. oracle多线程类连接数,数据库连接数,服务器进程,线程之间什么关系?
  6. html 无效源,IE bug无效源HTML5音频 - 解决方法
  7. iOS动画:带时分秒指针的时钟动画(上)
  8. 京东下拉词框推广是什么?
  9. python︱处理与使用json格式的数据(json/UltraJSON/Demjson)、pickle模块、yaml模块
  10. sublime text3创建文件时生成头部注释
  11. 金融评分卡项目—9.违约预测模型的后续工作
  12. wireshark display reference: https://www.wireshark.org/docs/dfref/
  13. 阿里云企业做网站备案流程
  14. 数据库系统工程师考试试题分类精解pdf
  15. 微分中的dx和delta x
  16. linux虚拟机安装配置vsftpd,Linux 使用 vsftpd 搭建 FTP 服务器
  17. 郑厂长系列故事——排兵布阵 状态压缩DP
  18. 微信公众平台微信支付打通流程
  19. splice、slice详解
  20. span与label的区别

热门文章

  1. 忙里偷闲第三弹:开发成绩查询微信公众号
  2. 学生网页制作源代码下载HTML5+CSS大作业——个人博客(2页)HTML+CSS 本网页作业为一个展示产品类型的网页设计作业作品成品
  3. 如何使用AKShare
  4. 《追龙2》不好看,下面8部“枭雄”港片才是经典中的经典
  5. 自定义View之案列篇(一):魔方
  6. tushare pro的token凭证码设置教程详解
  7. html 填表模板,WEB前端开发简历自我评价填写样本
  8. 如何查看域名所对应的证书有效期?
  9. ELM饿了么获取COOKIE教程附吃货豆脚本
  10. Brendan Gregg: 一个实战派大神