哈佛刘军:中国医疗大数据现状及前景
来源: 作者: 发布时间: 2015-11-19

精英访谈嘉宾:刘军

哈佛大学统计系终身教授、清华大学统计学研究中心主任。在贝叶斯分析、蒙特卡洛方法、生物信息学、遗传学等领域做出了一系列奠基性工作,对统计理论、复杂系统优化、基因组学、信号处理等领域都产生了非常深远的影响。2002年获得统计学界的最高荣誉COPSS奖,2010年获得华人数学界的最高荣誉晨星应用数学金奖,2012年获得泛华统计协会杰出成就奖。2010至2013年间担任《美国统计学会会刊》(JASA)的联合主编,国际数理统计学会会士(IMS Fellow)和美国统计学会会士(ASA Fellow) 。

医疗大数据领域正在成为新的风口。麦肯锡研究报告估计,美国的医疗大数据产业总产值在3000亿美元(约合1.9万亿人民币)左右,而中方许多专家的观点认为中国的这一数字可能远不止于此。国务院近日通过了《关于促进大数据发展的行动纲要》,鼓励和规范有关企事业单位开展医疗健康大数据创新应用研究。

哈佛大学统计系终身教授、清华大学统计学研究中心主任刘军近日在北京接受财新记者专访时表示,对医疗数据的融合和利用将是未来数年健康医疗领域发展非常重要的一部分,非常看好中美未来在大数据领域的合作。

由刘军牵头的清华大学医疗大数据中心近日在清华大学校园内揭牌成立。该中心由清华大学统计学研究中心与安诺析思国际咨询(Analysis Group)联合发起成立。

如何看待中国医疗大数据领域前景?美国有哪些经验可以为中国所借鉴?医疗大数据将为普通民众提供哪些便利?政府在医疗大数据领域可以发挥什么作用?财新记者近日在北京专访了刘军。

财新记者:如何看待中国医疗大数据领域现状及前景?

刘军:我觉得对医疗数据的融合和利用是未来数年健康、医疗领域非常重要的一部分。怎么把这些数据有效地利用起来,是包括政府、民间都非常关注的问题。

医疗数据有很大的复杂性。与其它领域的大数据相比起来,其深度要大很多,有非常多的层次和知识在其中。过去医药界和生物界的研究揭示了非常多的自然规律和知识,怎么把知识和数据融合起来一直是一个非常重要的课题。如果只是说把数据简单做一些集成,形成简单的观察表象上的相关性,画几个图,其实是把很多本质性的东西忽略掉了。在这基础上怎么进一步去挖掘、去寻找、去预测这些数据,是一个非常大的问题,不论是从学术上还是到实践上都是非常具有挑战性的。

我们中心成立的一个很重要的目的就是希望能够发展一些数学统计方法,把一些前沿性的知识和大数据结合起来。尤其在医疗方面,确实存在很多的难点和具体工作的挑战。我们在与医院进行合作的时候就发现,有许多医院的构架、构造以及数据平台存在缺陷。如何将第一线真正的经验和需求与理论方面的数据研究打通,是我们所做的非常重要的一个课题。

财新记者:提到大数据,在很多国家都会遇到一个难题就是数据从哪里来,尤其是医疗大数据,你认为应当如何应对这个问题?

刘军:数据员、科学研究工作者和实际接触员如何处理数据是一个非常大的挑战,包括如何把数据互相共享,如何处理。处理既需要计算机专业知识,也需要医疗和生物方面的专业知识。我们通过与合作伙伴AG共同构建的平台,与医院展开合作。具体数据仍在洽谈中。

财新记者:在中国进行医疗大数据的研究最大的价值在哪里?

刘军:我觉得中国非常需要医疗大数据。从医疗民生的角度来讲,医疗大数据是一个非常重要的课题。中国人口多,随着老龄化,疾病健康的需求会越来越高,而医疗资源相对来讲还有很大局限性。如何把医疗在平均意义上提高,尤其在一些偏远地区,在一些不容易接触到好的医疗设施的地区进行提高,这是国家层次上非常重要的问题。通过数据平台和人工智能方面的研究发现,来提高一般人的病情诊断、疾病预测和疾病预防等等,都会起到非常好的作用。

从商业上来讲,医疗大数据也是非常重要的一个课题。以后的医疗、药物发展或者精准医疗与大数据的利用都是分不开的。比如将生物分子、遗传因子、病症病状的数据相结合,更精准地来预测哪种药物更有效,这是未来要实现的一个目标。

还有就是某些药是否可以去治其他的病。我在《自然》杂志发表过一篇文章上,就是讲把一种药做别的用处。如果把这些数据整合起来,可以实现更好的治病效果。

财新记者:你怎么看美国医疗大数据现状,有哪些经验值得中国借鉴?

刘军:美国的医疗大数据发展了许多年,投入很大,从国家层面上的布局比较早也比较合理。美国在全国范围内建立起了二十几个中心,负责收集附近州县的医疗数据并整合,中心内有专门的研究人员,各中心之间也有联系,搭建了一个可研究的数据平台。美国医疗大数据研究刚刚开始进入比较有成果的阶段,今后五到十年,会有更大的、更全局性的效果出来。

在这一点上,我觉得中国可以借鉴,而且如果中国从政府方面下一些条文和指令其实效率可能要比美国的要高。中国也可以建立一些这种中心,重要的一点是可以把数据结构统一化,将医疗具体的病例、案例或者诊断做一个标准化,把数据结构进行推广。作为医院来说可以用,也可以遵循。也可以从国家的角度来调动数据。

财新记者:在医疗大数据研究方面,你们希望从政府得到哪些支持?

刘军:政府可以从布局上做一些大的战略性决策,例如建一些中心,做一些标准出来。另一点就是在法律上,对数据运用做出规定或者指导。美国国立卫生研究院(NIH)有很多规定,比如如果是政府资助的项目就一定要在多长时间内把数据提交到国家的平台,然后国家根据各种办法,把数据的敏感性去掉之后再给研究人员用。用的过程也是非常严格,从怎么申请到最后国家批准都依照规定。但是确实提供了一个比较通畅的官方渠道可以把数据让大家共享。

大数据的一个重要特点就是需要共享。数据是非竞争性的资源,不像能源,不像石油,你用了我就用不了。数据当然有用的早晚的问题,可能更早的挖掘会研究出更有价值的的东西。但是在很多情况下是,可能你只看一个数据看不出来,要把几类数据融合到一起,然后会发现比较有意思的新东西。这就需要大家把各类数据或是相关的数据有机结合在一起,需要各个部门的合作。合作在一起就会有新的价值创造出来。如果大家把这些东西都藏在自己的腰包里的话,有可能谁都做不出任何东西出来。所以如果能从国家的角度统筹调度,会有更好的效果。

财新记者:你提到了去除数据的敏感性。在医疗大数据领域,对于数据的脱敏你有什么建议?

刘军:这也是一个很敏感而古老的问题,因为美国和西方发达国家也很早就利用这些医疗数据,关于隐私和敏感性问题很早就提到了日程。经过这么多年的发展,已经形成现成的软件和手段去除敏感性。

我觉得应该从系统的角度来做这件事情。如果是每个部门,每一个单位自己去祛除敏感性,可能会做得不够专业,反倒把有用的信息给除掉了。确实有一些公司为了不让别的人知道一些信息要除敏感性,除了之后,一些希望拿来组研究的信息可能就失去了,他可能把它集成变成了一个数据,但是其个性特点就没有了。大数据脱敏本身就是一个有挑战性的课题,可以借鉴美国以及其他发达国家已经有的经验,从系统性的角度来发展。

财新记者:对医疗大数据的研究会对普通人的生活带来怎样的改变?

刘军:一个是对流行病的预防或者预测,比如流行病的严重程度或者扩展程度等等。这方面的预测是对初级平台比较容易,比较让大家能够直接感受到的一些事情。

另外就是对不同的病和症状去做个性化医疗,这点也是会有很大的帮助。比如,一个病人来就诊,大数据研究的一些结果可以提供帮助,例如根据其他与他病症差不多的人是如何治疗的,治疗的结果怎么样,吃哪些药,有一些什么样的作用,一些什么样的副作用,价位如何。得到这些信息后,可以帮助病人就医,同时也是帮助医生做诊断,做药物推荐等等都会有帮助。

财新记者:你在中国和美国都有学习工作的背景和经历,清华医疗大数据中心也是和美国AG公司的强强联合。你怎么看中美在未来在大数据合作的前景?

刘军:我觉得中美在大数据领域合作有非常非常好的前景。数据科学这方面中国人才也很多,不仅是在国内,在美国也有很多华人人才。

我一直认为统计是数据分析的灵魂,也是数据挖掘非常重要的思想方法和手段。统计界里的华人力量非常大,有很多一流的人才,比如美国各大一流的统计系都有很多华人,像我们哈佛统计系终身教授有三位是华人,而斯坦福统计系终身教授有两位是华人,宾夕法尼亚大学、哥伦比亚大学、耶鲁大学每个大学都有两到三个甚至是更多的华人教授。这些华人教授不是给人家作为装饰的,而是真正是在系里,各个方面起到重要的领导作用和地位。美国最主要的统计杂志的主编也是华人。华人在统计界的影响非常大,更多的人是从大数据的研究和应用角度出发。所以从这点来讲,美国的华人阶层对数据研究具备非常强的实力,这对中国大数据发展是很大的优势。我们已经开始尝试开展合作,参与中国大数据发展,未来会有更多人参与其中。

地方动态

“第三届滨海中关村协同创新发展交流会”在北京成功举办

中国信息协会会长王金平参加第七届数字中国建设峰会

提供伴随式服务,践行智库型组织——中国信息协会产业互联网分会正式成立

全国大学生创新发明大赛暨“英创工程”启动

  • 协会要闻
  • 通知公告