几年前,连研究人员都不愿使用DNA来存储数据,觉得这么做太超前了,不具有任何实用价值。而在前不久,科学家宣称可以使用合适的软件和生化模块来扩展PostgreSQL,并在DNA上运行SQL,一时间关于大数据与生命科学的讨论甚嚣尘上。

对大多数人而言,DNA数据存储是一项非常神奇的技术。在自然界,亿万年来,各种生物都是利用DNA携带的遗传信息来保证物种的繁衍生息。其实早在上世纪60年代,就有科学家提出了利用DNA存储信息的想法。

而现在,生命科学大数据整个话题已经火了很长时间了,小编也一直关注这方面的动态,今年早些时候还有人宣布将16G的维基百科储存进了一个DNA分子,前不久有人说代谢分子也能存储数据,甚至有人提出用质谱的等等。虽说科学技术需要超前的想象力,但是科学也必须要正视任何现实,以及它所带来的一切影响与后果。

首先,很多人奇怪为什么要用DNA这种生物质来储存数据?

其实原因很简单,传统存储系统的存储能力和更新速率已经远远落后了,这么说可能很多人都没有概念,举个例子,大约30年后,也就是2040年左右,全球将产生3× 10²⁴的数据量。

这个数据有多大呢,大约等于3万亿个1TB的硬盘,这么说好像还不具体,假如这些硬盘中全部存放了5分钟一首的mp3音乐,那么全球70亿人一起昼夜不分地听这些音乐需要1000亿年才能听完

可是按照现在传统存储系统的升级速度,30年后这些数据将无处容身,现在传统硬盘已经达到了超负载的状态下,我们庆幸还有云端可以存储海量数据,那么30年、50年后呢?

正是因为这个原因,很多人把目光聚集到了DNA这种生物化学质上,因为它足够稳定、足够庞大,在很多人眼中DNA就像是古老的神灵,质朴地如大自然一样神秘而强大,书本可能会消失、硬盘可能会消失、云端可能会消失,但是DNA不会,因此选择DNA作为数据存储的良性载体看上去是相当明智和有前途的。

此外, DNA 能作为信息载体,主要基于它这种聚合物的组合复杂性,在极端温度、压力和机械力的条件下,分子记忆比电子记忆更稳定,所以分子存储还可以让人们告别云储存,使离线存储大量数据成为可能,从而保护数据安全,不被黑客随意攻击。

生物存储很难做到吗?难点是什么?

前面已经提到,现在很多实验已经成功将数据存入到DNA中了,甚至有人将全本的古兰经储存在了自己的身体中,可见这种技术已经实现了从0到1的突破,但是它仍然面临着更加艰难的困境:

1、成本问题。制约科学技术发展和推动科学技术发展的都是成本问题,目前来说DNA存储的技术成本相当之大,其投入之多让很多机构都无法承担。就拿2002年完整基因组测序工作来说,当时集中了20个研究所的专家,利用这些研究所所配置的基础设施,经历13年,投入30亿美元获得了约30亿核苷酸序列。

基因测序

但是成本问题毕竟是与技术成熟程度相辅相成的,随着未来研究人员不断开发方法,处理大数据的量、速度和可变性方面的问题将不再受到成本的制约。

2、读写速度。目前来说不管是DNA的存储速率还是读写速率都不及普通的传统硬盘,说出来可能有人会大跌眼镜,只有4M每秒,也许有人会说这种速度连我家的网速都比不上,读写速率的话就更不用多说了,这也是现在DNA存储技术急需解决的问题。

但是有报道称,传统的 DNA 测序产品已经在生物技术市场上销售,可以读取 DNA 数据,这一全新的序列技术用例将有助于提高速度,其真实性就不得而知了。

3、准确率问题。目前科学家声称的DNA存储技术的数据准确率大约在99%,这个数字放在传统存储系统中也许无关紧要,但是如果是放在人体的DNA中就显得远远不够了。因为人们目前已知的人体内部DNA、信息遗传、分子代谢等问题不过是冰山一角,1%的数据差别也许会导致非常严重的后果。

无论是数据丢失还是数据差误,只要一旦有漏洞就足以引发人们巨浪一般的恐慌,更不要说未来的黑客也许会利用DNA数据技术对人体本身发起攻击,其后果已经是难以预估了。

回到问题,生命科学究竟能否带来新的数据革命?

答案是肯定的,但不是现在,也许是20年后,也许是50年后,也许是100年后,也许永远不会。

例如,DNA 数据已经被研究人员用作为分子识别,正被用于大大加快化学工程、材料科学和纳米技术等领域的研究步伐,帮助科学家研究如何对抗耐药性和防止癌症转移。

例如,数据也许可能跟随DNA一起遗传给下一代,比如通过人造海马体完成了短时记忆向长期储存记忆的转换,这项技术可以完成对人脑记忆的备份,并复制到其他人的大脑中。

例如,这种DNA数据科学是否有可能实现“永生”的人类终极目标?原来信息竟然可以通过神经代代相传,加之这次 DNA 可以存储海量数据,不知道这是不是另一种「永生」的方式呢?

还有很多很多,留给人们想象的空间是无限的,不可否认的是生命科学也为数据发展带来了新的思路和空间,我们无法阻止这种趋势,我们唯一能做的,就是期待他们不会践踏人类不容侵犯的边界和底线。

大数据有多可怕?科学家成功在DNA上编写sql,或能实现永生相关推荐

  1. 在数智化时代,寻找发光的你!——2022大数据能力提升项目宣讲会成功举行

    9月2日晚,由清华大学研究生院和软件学院共同举办的清华大学大数据能力提升项目新生宣讲会通过线上方式成功举行,来自校内二十多个院系的300多名学生参会. 大数据能力提升项目责任教师.<数智安全与标 ...

  2. 发挥大数据及其产业在推动发展方式转变上的作用

    大数据时代的到来,互联网成为基础设施,数据变成重要资源,这不仅意味着海量.多样.快速的数据处理和技术创新,更为重要的是改变了传统要素的组合方式.这种变化客观上要求必须转变传统的经济增长方式,实现创新驱 ...

  3. 《大数据》2015年第2期“前沿”——大数据技术发展的十个前沿方向(上)

    大数据技术发展的十个前沿方向(上) 吴甘沙 英特尔中国研究院 doi:10.11959/j.issn.2096-0271.2015023 Ten Fronties for Big Data Techn ...

  4. 大咖 | “大数据之父”达文波特:成功的数据科学家不一定要有研究生学位

    大数据文摘作品 作者:托马斯·H·达文波特 2006年6月,乔纳森•高德曼(Jonathan Goldman)进入商务社交网站LinkedIn工作.作为斯坦福大学物理学博士,他醉心于无处不在的链接和丰 ...

  5. 深圳市大数据研究院政务大数据实验室招聘研究科学家和数据工程师

    关注公众号,获取更多AI领域发展机会 公司介绍 深圳市大数据研究院政务大数据实验室成立于2020年3月,职责是将深圳市大数据研究院雄厚的科研资源与政府部门丰富的政务数据资源相结合,建设现代化完备的政务 ...

  6. 跨界融合,筑梦前行 | 清华大学大数据研究中心RONG奖学金答辩会成功举办

    2023年3月29日,清华大学大数据研究中心大数据能力提升项目2022年度 "RONG"奖学金答辩会于东主楼成功举办.为服务国家大数据发展战略,打造多层次.多类型的大数据人才队伍, ...

  7. 2021年大数据研究中心支持项目交流会成功举行

    12月28日上午,清华大学大数据研究中心支持项目交流会在清华大学东主楼举行.本次交流会共有来自校内六个院系在做的七个项目进行集中交流汇报,包括医工结合类四个项目: ▪ 电子系王贵锦.清华长庚医院张萍 ...

  8. 打造交叉复合型数据人才的高地:清华大学大数据能力提升项目宣讲会成功举行!...

    2021年8月30日晚,由清华大学研究生院和清华大学大数据研究中心(以下简称:中心)共同举办的清华大学大数据能力提升项目(以下简称:项目)新生宣讲会在清华大学东阶火热开启.虽然疫情期间大多数学生尚未返 ...

  9. 站立潮头、无问西东 | 第二届“大数据在清华”高峰论坛成功举办

    2018年4月27日,由清华-青岛数据科学研究院主办.清数大数据产业联盟协办的第二届"大数据在清华"高峰论坛于主楼接待厅拉开帷幕.此次论坛以"站立潮头.无问西东" ...

最新文章

  1. 深划痕需要大面积补漆吗_剐蹭了需要立马补漆吗?这些小技巧能省不少!
  2. 医学计算机教学计划,医学院教学计划
  3. leetcode刷题 15.三数之和
  4. Springboot环境下mybatis配置多数据源配置
  5. Java高并发编程详解系列-线程池原理自定义线程池
  6. android 字体切换快捷键,Android stdio 字体设置及快捷键
  7. C# 浅拷贝与深拷贝(复制)
  8. G盘文件系统RAW要怎么办啊
  9. 起床困难综合症(位运算)
  10. c语言实验--九九乘法表,C语言实验报告(四)
  11. 主成分与因子分析异同_主成分分析和因子分析有什么区别?
  12. 带你实现完整的视频弹幕系统
  13. 深入理解Symbol
  14. 安卓P 自动调节亮度打开的状态下,手动拖动亮度条后,自动调节亮度失效
  15. 8.五言律诗和绝句的句型及平仄格式
  16. java合肥工业大学考试题库_合肥工业大学java程序设计实验二
  17. Django开发实战2-5 模型- 基础条件查询
  18. 安卓13来了,快!扶起我来!
  19. 南宁1号线开创802.11ac地铁PIS应用新时代
  20. 打造“拉动式”企业培训管理方案,释放人才潜能

热门文章

  1. 技术驱动才是2B市场的主旋律
  2. (深入.Net平台和C#编程)第五章.体检套餐管理项目.20170408
  3. matlab在线版 免费,NeuroSolutions for MATLAB
  4. 【bug】mysql tinyint boolean 插入无效问题
  5. Java精品项目系统源码第89期慢病报销管理信息系统
  6. 20176单招计算机专业,对口升学信息技术(计算机)类2017年专业课考试大纲
  7. 京东商城招聘软件工程师(北京)
  8. sas数字转日期格式_sas—日期格式及函数
  9. jquery中添加属性和删除属性--------------------
  10. 查游戏台式计算机软件的工具,怎么查看电脑配置是否达到游戏要求