随着“互联网+”时代的到来,BT与IT的“拥抱”变得越来越“火花四射”。当基因组测序技术和生物信息大数据的应用发展日趋成熟,以此为基础的精准医疗便不再是梦想。借助IT技术的东风,大数据正成为注入医疗的一剂“精准”药。“数据是待开采的矿,只要持续挖掘,总能淘到金子。”华大基因研究院副院长、信息技术中心主任方林如是说。
小基因与大数据是“天生一对”
在间隔0.34纳米的字符间距里,在只有1.5个皮克的DNA里面,蕴藏着30亿个字母。这30亿个字母,蕴藏着人所有的可能性……可以想象,如果让生物学家描述生命,大概是上述“套路”。毕竟,我们的生与死,出生缺陷和肿瘤疾病,都记录在小小的基因组合中。从这个角度看,生命的语言是数字化的,而基因研究则是典型的大数据应用。小基因与大数据是“天生一对”。
“从生物样本的基因测序到遗传疾病的识别、预防与治疗,都需要处理海量的数据。华大基因的起点就是BT与IT资源的整合。”方林认为,随着时间的推移,“大数据”的概念在不断变化。与每天产生几十兆数据的过去相比,现在以P为单位的数据规模无疑是更“大”的。据不完全统计,目前华大基因一年的数据产生量就高达10PB,这是该领域内最大的数据。但“大”不仅仅指代数据的量。“以前我们只说基因大数据,后来,我们发现除了基因,还有很多其它因素在影响着我们的健康。包括蛋白质组、医学影像、各种各样的生物传感器数据以及空气、水的质量等环境因素,这些都是我们需要引入的参数,是健康‘全景’大数据。”方林说,将不同参数系统的大数据横向串联整合,描画的就是精准医疗未来图景的底色。大数据使“精准”成为可能。
目前,华大基因正在推动的“国际精准医学联盟”(简称“精医盟”)也“瞄准”了大数据。“我们用各种方法收集数据,建立起医学研究、诊疗的基因数据库,发展精准医疗;与此同时,随着精准医疗的推进,更多的大数据不断产生。这是个螺旋上升的过程。”方林介绍。
挖掘大数据“宝藏”
在数据呈爆炸式增长的今天,面对一片大数据的汪洋,谁掌握了有效管理和应用的方法,谁就可能获得开启生命科学、健康医疗新世界大门的钥匙。
“华大基因一直致力于让基因技术更好地为人类服务,效率是影响基因技术全面普及的重要因素。”华大基因CEO杨爽表示,“大数据、云计算技术是加速基因研究成果输出和应用的重要途径。”
在BT与IT融合方面,过去的一年里华大基因收获颇多——与华为共同签署了《基因大数据存储系统联合开发协议》,双方将针对基因处理工作流特征,联合设计和开发专为基因研究优化的大数据存储系统,消除基因研究工作流中的重复数据,使整体效率提升30%以上;与英特尔、阿里云携手建立了中国乃至亚太地区首个定位精准医疗应用的云平台,此举被业内誉为“中国精准医疗的创举之作”;今年,华大基因在阿里云计算平台部署的服务产品BGI Online国内beta版本正式上线,堪称基因行业的应用商店,也标志着BT、IT巨头合作后重要成果的诞生。
大数据、云计算技术的加持,大大加快了基因测序和解读速度,也不断降低成本。“一切才刚刚开始。”在方林眼里,数据是待开采的矿,是贫矿还是富矿,要挖了才知道。即使在贫矿里也可以找到闪光的东西。“以前我们觉得NT(Nuchal Translucency,指胎儿颈项透明层)数据没有太多利用价值,放着闲置,现在我们深入研究这些数据,发现它可能预测癌症的风险,持续研究,还会挖掘到越来越多有意思的东西。”方林坚信,数据里淘金具有无限可能。
目前,方林和他的团队正积极与医院合作,研究开发一套融电子病历、电子健康档案、影像数据、基因数据等于一体的医疗生态系统,形成贯穿前端实验室与后端信息分析的闭环,为广大患者带来更精准的医疗服务。
“云”上的健康
从PC到移动设备,随时随地获取自己的信息;触控和声控可以实现信息的交互和处理,从而创建漂亮而实用的文件;无感知的设备实现数据即时上传、存储、运用……谈及自己对未来数字化生活的畅想,方林的描述充满画面感。
对于每个人关心的健康管理,方林坦言,现在个人的数据很分散,很难找到一个完整的个人健康数据入口。虽然可穿戴的健康设备越来越多,但这些设备普遍太笨重,不够便捷。比如体重秤必须有地方安放,每天吃的食物没办法完全记录下来。“如果周围的环境里有一些传感器,或许你只需要戴一块手表,甚至不需要穿戴任何设备,你行走的路线和速度,吃饭的食物成分、卡路里,都会自动上传。”方林说,这样的场景,可能在不远的将来就能实现。
(来源:华大基因)