大数据技术有助于破解难题 “验血查癌”商业化前景可期

星期三, 二月 08, 2017


定期验血就能发现得致命癌症的前兆并在癌症变得太难对付之前就进行治疗?这就五六年前还完全是科幻情节,但如今却真的变成了可以预见的前景。这样突然的加速进步从何而来?

和经常出现的情况一样,预示着变革的大动作发生在美国加利福尼亚旧金山湾区。1月初,一家过去几乎无人知晓的生物公司在聚光灯下大放光彩,宣布打算融资10亿美元。美国格雷尔公司身后是一个强大的集团:DNA测序全球领航企业美国伊卢米纳公司。格雷尔公司的投资者还包括比尔·盖茨和杰夫·贝索斯。

法国《回声报》6日报道,吸引这些巨头的正是格雷尔公司正在开发的这项癌症领域技术的巨大潜力。

该技术的研发基于一个事实,即除细胞核以外,在我们的血液中也有游离的DNA片段。几年前,技术进步让我们能够通过对怀孕初期(11周)的孕妇验血来读取胎儿的DNA,从而筛查唐氏综合征。法国医生洛朗·亚历山大分析说:“羊膜穿刺术正被液体活检技术淘汰,因为进行这种穿刺术的怀孕阶段要晚得多,对胎儿也有不可忽视的风险。”

对格雷尔公司而言,液体活检的应用不再仅限于唐氏筛查,而是扩展至更为广泛的癌症领域。这门技术将通过血液取样检测出能反映某个器官(肺、胰腺、肝等)存在新生肿瘤的肿瘤DNA片段,格雷尔公司的抱负正是将这样的技术商业化。格雷尔公司如果赌赢了就能打开一个数以千亿美元计的庞大市场。亚历山大说:“格雷尔公司或将成为癌症领域的脸书或谷歌。”

但该公司仍面临很大障碍。因为虽然这项未来检测技术的原理很容易描述,操作起来却困难得多。

亚历山大指出:“根据当前的知识,我们如果做格雷尔测试就会发现人人都有肿瘤携带者。”在医学上,检出是疾病携带者但实际上并没有得这种病的情况被称为“假阳性”。

有两个问题会对解读血液中的游离DNA造成干扰。如果这两个问题解决不了,格雷尔测试的预测价值就会一直很低。首先,肿瘤DNA就算被检测到也未必来自活性肿瘤,因为它很可能是已被人体免疫系统的淋巴和其他细胞消灭的肿瘤死体的残余物。其次,伊卢米纳公司制作的这类DNA测序仪并非绝对准确。平均每读取100个碱基会出一次错,最佳状态下是每200个碱基会出一次错。在实际操作中,由于测序仪不会只读一次而是读很多次(最高达300次),这些错误就可以被改正。这也就是专业人士所说的“覆盖率”,覆盖率越高就越可靠。

但在液体活检中会损失很大一部分修正功能。因为即使在证实存在肿瘤的情况下,血液中游离的非肿瘤DNA数量也远远超过肿瘤DNA(前者可能高达后者的10万倍)。因此尽管覆盖率高,潜在的肿瘤DNA片段也会因数量远低于正常DNA而不会成为测序仪重新读取的对象,所以仍然会出错。

和现代医院通常采取的做法一样,这两个问题的解决之道来自“大数据” (伊卢米纳公司任命谷歌地图创始人、大数据专家杰夫·胡贝尔为格雷尔公司首席执行官绝非偶然)。谷歌经营一种平台业务。使用谷歌搜索引擎的越多,搜索结果就越准确,进而吸引更多人来使用。未来的格雷尔检测技术也一样。做检测的病人越多,补充到肿瘤特有突变数据库的资料越充分,这个数据库就越完整,检测结果就越可靠,进而吸引更多的人来检测。

因此,成功关键在于采集和分析数据的规模。为此,格雷尔公司需要资金来赢得这场赌博。10亿美元中的一部分将用于临床试验所必需的庞大群体(1万到10万病人)和让这些数据说话的合适算法,而合适算法的开发主要依靠“深度学习”取得进展。要成为癌症领域的谷歌,格雷尔公司还有很长的路要走。
_____________

请加入我们的FacebookTwitterG+,或者新浪微博获取最快资讯,我们的微信订阅号是:sgnypost