微软将单词“Hello”存储到DNA中并读取出来

DNA当硬盘,靠谱吗

齐鲁晚报     2019年04月01日

  DNA存储需要通过液体来移动分子。
  近日,微软公司宣布自家的研究员联合华盛顿大学成功进行了DNA数据存储和读取实验。微软称,其团队成员在一次试验中成功地将“Hello”这个英语单词存储在了DNA信息中,并且成功地使用一套全自动化的系统将相关信息重新以数字形式读取了出来。

  本报记者 任志方        
  
  仓库大小的数据中心,可压缩至几个骰子
  据美国华盛顿大学官网消息,来自该校和微软的科学家在DNA储存数据方面的研究更进了一步:他们通过将1和0编码转换成腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶这四种构成DNA的核苷酸序列,把图片和视频成功储存在DNA片段中,并实现了数据的无损读取,最新研究或将彻底变革计算机存储方式。
  据英国《每日邮报》近日报道,人类“数字宇宙”的数据总量有望在2020年达到44万亿GB,届时将超出我们的存储能力,为了弥补存储空间的不足,科学家们尝试将数据信息存储在DNA内。
  与目前的数字存储技术相比,DNA分子将数据存储的紧密度提高了数百万倍,而且我们目前使用的闪存、硬盘及光介质等存储数据的设备会在数年后有所损坏,但新方法可将信息保存数个世纪。
  在最新研究中,研究人员将来自图像和视频的数字数据中的0和1长序列转化成了DNA序列的四个化学组成。随后,数字数据被分成片段并通过合成为大量人造DNA分子进行存储,这种分子能被脱水并保存很长时间,而且使用DNA测序技术,研究人员能“阅读”这一数据并将其转化为最初的形式,实现了图片的无损读取,这一研究将能填满整个沃尔玛超市的数字数据压缩成一块方糖大小。
  根据微软的计算,DNA存储技术能将一个仓库大小的数据中心中的所有数据压缩至仅有几个骰子大的体积,并且DNA还具有其他存储介质所不具备的稳定性,就如同我们能够在数万年之后提取到化石中的DNA信息一样。
  目前只能在实验室的“化学汤”中运行
  不过,科研人员称目前也面临一个巨大的挑战,即提升新方法的性价比和效率,从而使其能大规模地应用。
  微软指出,与传统计算系统不一样,DNA存储需要通过液体来移动分子,然而液体的行为和电子完全不同,需要全新的制造解决方案。除了和微软合作之外,华盛顿大学的团队也在开发一个可编程的系统,以通过控制液体中的电极矩阵属性的方式,将存储有信息的DNA溶液在不同区域间移动。
  几十年来,分子编程领域的学者一直在研究如何让DNA分子拥有计算能力。这个课题包含构建在分子层面上能够有效运行的算法以及确定分子计算的基本原理。
  这些分子机器通常是由合成的DNA链组成的,其中链的序列决定了信息相互作用的方式。这些设备在未来的可能应用包括病原体的体外诊断、生物制造材料、智能医疗、用于成像和生物实验探测的高精度方法。
  但是,目前大多数生物计算设备还只能在实验室的“化学汤”中运行,其中数十亿个DNA分子依赖于相对较慢的随机扩散过程相互碰撞并执行计算步骤。这种方式限制了计算速度和有效组分的数量,因为自由扩散的DNA分子可以随机自由碰撞,这意味着研究人员必须进行仔细设计,以避免这些碰撞发生时产生意外计算。
  就在3月20日,《自然》杂志发表研究报告称,计算机科学家建造了第一台可广泛编程的DNA计算机,朝着利用化学计算的路途上迈出了至关重要的一步。
  该系统利用DNA编写的指令来执行不同的6位程序。以前的DNA计算机本质上都是定制的系统,只能够解决特定的问题。但现在,研究人员用新系统来执行21个测试程序。在可编程物质中,化学软件会自动指导具有复杂、可编程纳米材料的构建。虽然仅由DNA和盐水组成的新系统本身不足以成为科技应用,但是,它让自组装可编程物质的发展更进了一步。这项研究主要在加州理工学院进行,研究负责人、计算机科学和生物工程学教授埃里克·温弗里解释说,新系统的创造者“试图找出将计算行为嵌入化学的方式,从而控制化学的行为”。 
  DNA计算机可能成为未来的主流形态
  在这个新系统中,DNA会形成一个由两条长链组成的梯状结构,每条链都有四种化学物质。这台计算机的原理就在于,单链DNA会因化学序列的互补性和其他DNA链配对。我们可以这么理解:随着一层又一层的连接,算法最后编织了一个包含计算过程的纳米级围巾。
  温弗里和他的团队把这些“电路”抽象地想象成四方形的瓦片,瓦片两边都有固定装置,只允许它们连接到带有互补装置的瓦片上,就像拼图一样。计算机的全套指令由355种不同类型的瓦片组成。实际上,每块瓦片上并非一条DNA单链而是四条,这样就增加了足够的余地来克服意想不到的错误。
  为了使计算有序进行(本质上是合成一种可以计算的晶体),研究人员需要某种既可以作为起点,又能承载DNA进行组装的结构。达米安·伍兹曾从事DNA计算机研究,现在就职于爱尔兰的梅努斯大学。他说,“我们想让DNA有序地连接在一起形成回路,而不是像在溶液里一样随机粘在一起”。这种DNA使用了一种叫做DNA折纸的技术,设计成一个长150纳米、宽20纳米的纳米管。计算晶体在纳米管上进行组装,方式类似于冰糖在裹着糖衣的绳子上结晶。
  想要在这台6位DNA计算机上运行一个程序,首先需要一个自定义编译器。“大量的想法和科学会投入到编译器中。”伍兹如是说道。它允许研究人员编写任何他们想要的软件算法,并通过各种抽象层次将算法转换为:逻辑到块、块到纠错子块、子块到DNA序列等等。最后,它产生了一个指南,即指导DNA序列添加的内容、时间及温度。DNA折纸纳米管需要一到两个小时的时间来合成,而完成计算则需要一天左右的时间。
  虽然DNA计算机的研制处于雏形阶段,但它有可能成为未来计算机的主流形态,作为一种生物计算机,DNA拥有惊人的存储容量、极快的运算速度和极低的能耗。DNA具有在极小空间里存储大量信息的特性,每秒钟的运算次数甚至可以达到1万亿亿次以上,而消耗的能量却微不足道。




上一篇 下一篇