针对未来存储密度市场,前期在文章“50TB ExaDrive SSD投入商用”和“HP忆阻器内存和IBM原子磁盘”中,分别介绍了大容量SSD忆阻SCM原子存储技术,但今天给大家普及的是另外一种前卫技术——DNA存储技

DNA存储则能提供极大密度,是未来大容量存储较理想的介质,也是下一代冷存储的替代品。从原理上来讲,DNA存储是通过DNA中G、T、A和C 4种碱基代表二进制数据(0、1、2和3),理论上1克DNA可存455EB数据。DNA存储的读取技术则是采用DNA测序技术实现,DNA测序技术发展迅速,性能每次可达960Gb,成本也很低,性价比已经接近商用;目前的难题在于DNA存储的写性能,当前写性能每天只能达到Mb量级,极高写成本使得离商用还有很长的路要走。

由于DNA存储还有很多技术难题需要攻克,DNA存储目前还是原型概念验证阶段,主要是学术研究机构在从事,至少还需要5年时间才可能有DNA存储商业产品应用,但从长期投入来看,微软等厂商觉得是很有投入价值的,这很可能是未来存储介质市场的切入点,DNA芯片技术、芯片电路设计测序合成技术结合将可能是继原子存储、SCM介质之后的下一个存储技术热点

DNA存储是将二进制文件通过编码映射成DNA里A、T、G和C碱基序列,按序列顺序通过人工合成技术形成长链DNA来保存数据的方法成为DNA存储技术,数据写入即人工合成DNA数据读取即DNA测序数据拷贝即DNA复制,利用DNA中碱基序列编码存储二进制数据具体实例如下所示。

DNA存储从架构上讲,主要包括类似于存储控制器的编解码器、数据读取写入设备和数据存储设备,从技术成熟度上讲,DNA技术可以支持开发DNA存储原型,但在成本和自动化等方面还面临技术的挑战。

  • 编解码器(存储控制器)完成二进制转换为DNA碱基序列(碱基对A,T,G和C可对应0,1,2和3),对误码进行误码纠正、文件索引的方法对效率影响大。

  • 写入设备(写磁头)通过DNA合成含有A、T、G和C的DNA数据链保存数据,人工合成DNA。当前DNA合成技术已经可以按程序任意组合在DNA链条上加入碱基,使得DNA写入成为可能。

  • 存放设备(磁盘柜)实现DNA存放,单个细胞核23对染色体含30亿对碱基可存12Gb数据,1克DNA可存储EB级数据。

  • 读取设备(读磁头) 实现DNA存储的读取,基于DNA测序(Sequencing)技术,目前最常用的测序方法是桑格测序法(Sangar)。

Sanger测序的原理是将测序DNA进行大量复制(PCR),将DNA分装不同试管中,分别加入有剪切作用的染过色的双脱氧核苷酸ddNTP,反复PCR循环让DNA复制,当遇到ddNTP复制断裂,形成长短不一的DNA单链,加电出现电泳现象,短链DNA游速快,长链游速慢,形成长短排序,激光照相,形成排序光谱。

DNA存储优势是显然意见的,密度理论上1克DNA可存储455EB数据量,DNA存储时间也很长,在干冷条件下,可保持100万年以上,常温下可保持2000年以上,常温保存能耗很低,基本不需要电力。但是技术挑战也与之并存,存储密度受到编码效率、备份数量、分类索引等方面的制约,通常比理论密度低。

      DNA存储编纠错挑战: 编码纠错的原则是避免重复,重复导致读错概率大,最常用的方法是加入验证信息。在解决误码问题上,微软采用了三进制编码原理,在4个碱基中,其中一个碱基用作前一位指示,后三位用作0,1,2编码。

    DNA存储编索引挑战: 目前比较流行的一种DNA存储索引方法叫KV方式,针对文件,以Key-Value的方法形成Key值,将Key值形成文件头DNA索引和地址,再将文件内容和索引合成DNA。

DNA存储写入合成挑战: DNA合成过程是控制4种碱基分别加入DNA合成片段中,将片段链接合成较大的片段的过程。DNA合成依然较困难,小片段合成可以在实验室,但是大规模合成需要专门基因合成服务公司才能完成(如GeneArtTwist Biosicence)。

  DNA存储拷贝技术: DNA复制通常采用成熟的PCR方法,该方法在1983年发明。大致过程是先将DNA双链加热分开,加入聚合酶、DNA引物和碱基,DNA单链开始产生双链实现DNA的复制。

关于DNA存储的技术研究和应用前景十分广阔,当前主流方向聚焦在密度、保存时间、低能耗等优点,DNA存储的存取技术(合成和测序技术)得到了快速发展,如果能很好地解决成本性能问题,那么在未来,会极大限度加速DNA存储取代现有存储的可能性和进程。

DNA存储在归档场景具备占地小、能耗低、密度大的特点,美国国家图书馆、维基百科、Google有意愿将资料备份在DNA存储上;在军事用途应用中,可以通过人体携带DNA数据,有了DNA存储技术,我们人体就是“云硬盘”。在个人应用中,未来个人可以随身携带超大容量的DNA USB数据盘。

但归根结底,DNA存储商用很大程度依赖DNA合成技术和测序技术的发展,当前测序技术发展较快如Pacbio、Illumina等公司,DNA合成技术发展慢,需要较大的理论和技术突破才可能,在另一方面,这也可能导致未来商用的不确定性。

DNA存储技术如其他技术发展,DNA存储技术的发展也离不开所处的生态环境,目前值得关注的生态圈领域主要包括,DNA芯片DNA合成技术DNA测序等。

DNA芯片主要包括AffymetrixIllumina和Affymetrix公司,Affymetrix利用基因芯片,通过原位合成法,大规模生产DNA探针。Illumina和Affymetrix合作开发DNA探针芯片由于测序。DNA合成包括美国IDT美国、德国GeneART、中国华大基因和提供DNA合成服务的Twist公司和微软合作。

DNA存储至今已有很多成功尝试,哈弗大学George Church 在2012年首次650KB数据写进DNA存储;EMBL欧洲生物信息实验室2013年将20MB数据写进DNA存储;这些都是科研机构的尝试,但在2016年7月,微软研究院和华盛顿大学2016年发布DNA存储原型论文,并在同年7月将200MB的数据放入一段DNA中,引发极大关注,微软发布DNA存储原型,并决定推进其商用。

这次试验打破之前20MB的最高纪录,发布了新的Error-Correcting Code,适合DNA读写错误的纠正,同时对DNA数据可以随机读取。试验的成功促使微软加速推进DNA存储商业应用的研究。

>>>推荐阅读

  • 昨天的存储战场留下什么值得回忆?

  • NAND Flash是如何生产出来的?

温馨提示:
请搜索“ICT_Architect”或“扫一扫”二维码关注公众号,点击原文链接获取更多技术资料。

点击原文链接获取技术资料

[解密] DNA存储技术究竟牛在哪里?相关推荐

  1. DNA存储技术创造新纪录 存储容量已达200MB

    DNA存储技术是利用人工合成的脱氧核糖核酸(DNA)作为存储介质,具有高效.存储量大.存储时间长等优点.据外媒报道,近日来自微软和华盛顿大学的一组研究人员宣布他们已经在DNA存储技术方面创造新纪录,目 ...

  2. 微软黑科技:DNA存储技术催生方糖大小的数据中心

    凤凰科技讯 北京时间4月12日消息,据科技网站Computerworld报道,微软和华盛顿大学研究人员已经展示了利用人工合成DNA作为数据存储介质的技术. 研究人员表示,如果这一技术成熟到适合主流应用 ...

  3. 微软与华盛顿大学合作研发DNA存储技术

    在信息爆炸的时代硬盘容量的需求大幅提升有相关报道预计明年全球存储容量最大可达16ZB以上.为解决这一问题微软研究院与华盛顿大学的分子信息系统实验室MISL合作正在研发高密度DNA串数据存储技术.研究人 ...

  4. 你可能还没听过DNA存储技术,但微软已经打算三年内将其商用了

    如果未来我们能够像使用磁带一样用DNA存储数据,那么理论上可以将人类有史以来记录的所有数据存储在大约两个车库大小的空间里. 本周,微软研究院的计算机网络架构师们跟外媒分享了他们的愿景.他们表示,希望在 ...

  5. DNA存储技术—让信息保存万年

    一个1亿年前的琥珀化石最近被发现了,中间封存着一只蚊子,假设这只蚊子的DNA中存储了1亿年前的地球数据,那么现在的人类将这些数据读取出来之后徐徐展开的是否就是1亿年前恐龙时代的壮美图景? 这是电影&l ...

  6. 【10.23头条】阿里云存储负责人吴结生:安全可靠是云存储立身之本, 智能技术将激活存储技术新变革...

    戳蓝字"CSDN云计算"关注我们哦! 作者 |  刘丹 责编 | 阿秃 人类以日新月异的速度刷新着科技的成果,其中存储的发展历史尤其悠久,堪称万年进化史.自文明诞生以来,我们就一直 ...

  7. 阿里云存储负责人吴结生:安全可靠是云存储立身之本, 智能技术将激活存储技术新变革...

    作者 |  刘丹 出品 | CSDN 云计算 人类以日新月异的速度刷新着科技的成果,其中存储的发展历史尤其悠久,堪称万年进化史.自文明诞生以来,我们就一直在寻求能够更有效存储信息的方式,从4万年前的洞 ...

  8. DNA存储,拯救人类数据危机的良方?

    来源:脑极体 开一个脑洞:如果地球正在面临一场马上到来的毁灭性星际灾害,人类又想尽可能地保存地球的生命和文明,在现有条件下,该怎么办? 像大刘一样让地球停止自转然后逃离太阳系,这恐怕来不及了.而如果像 ...

  9. 存储新图谱:DNA存储的边界与天地

    数字信息时代,无论是生产数据的各大视频网站.应用平台等,还是消费者们使用的各类电子设备,都无不在时时刻刻产生数据. 拿自动驾驶举例来说,平均每辆自动驾驶车每天产生的数据量高达10TB.根据IDC机构的 ...

最新文章

  1. 【错误记录】Android 应用安装后出现两个启动图标 ( 排查应用及依赖库中配置了 android.intent.category.LAUNCHER 的 Activity )
  2. typescript设置默认值_TypeScript 中神奇的 this 类型声明
  3. 【ArcGIS遇上Python】ArcGIS Python将多个文件夹内的分幅数据整合到同一个文件夹内——以Globeland30数据为例
  4. php 怎么从memcache缓存数据中统计某一字段总数,php和memcache统计在线人数的方法...
  5. linux 下的csp 模块,linux kernel 中MIGRATE_TYPES的理解
  6. python 元组 列表 字典区别_Python列表、元组、字典、集合、字符串的异同总结
  7. iphone开发中sqlite3说明
  8. 随想录(再论内存屏障)
  9. body 没有被撑开_父div没有被撑开,该怎么解决?_html/css_WEB-ITnose
  10. python连oracle数据库参数变量_带绑定字符串变量的Python cx_Oracle SQL
  11. 云原生数据中台的 What、Why、Who、How和Where
  12. AI芯片,为何现在成为新军备竞赛?
  13. 优化理论03----优化导论和无约束问题的最优条件、优化问题的类型、局部、全局和严格优化、梯度和Hessian 黑塞矩阵和方向导数、无约束问题的最优条件
  14. 操蛋!新来的同事竟然不会在javaee项目中使用WebSocket~
  15. CF1157D N Problems During K Days(简单构造)
  16. 微信小程序商城后台服务器,首先【基础配置】:完成小程序关联商城后台及配置微信支付...
  17. delphi 剪切板变量_Delphi监视剪贴板内容
  18. AMP—Rover移植
  19. 上一页 1 2 3 ... 10 下一页 固定分页
  20. 后端程序员看前端想死(二)进入页面之后js分析

热门文章

  1. 基于 Amazon Amplify 构建自己的首个 iOS 应用程序(二)
  2. SpringBoot - OAuth2第三方登录之新浪微博登录
  3. 《An Industrial-Strength Audio Search Algorithm》译文
  4. SDIO wifi Marvell8801/Marvell88w8801 介绍(三) ---- Marvell8801/Marvell88w8801寄存器介绍
  5. E. The Humanoid Codeforces Round #834 (Div. 3)(暴力dfs?)
  6. Symantec Backup Exec 2010 安装报 bad ELF interpreter: No such file or directory
  7. Java泛型应用之打造Android中ListView和GridView万能适配器【CommonAdapter】--超简洁写法
  8. 读书笔记『Kotlin实战』
  9. 手机游戏开发培训: 手机游戏开发培训渐入成熟 、技术培训打造IT金领
  10. 奋斗吧,程序员——第五十三章 万里赴戎机,关山度若飞