【原创】新药研发进入算力时代,赛灵思FPGA大显身手(上)

作者:张国斌

回顾人类的发展史,就是一部与疾病对抗的斗争史。

公元前430年,一场瘟疫席卷古希腊,夺走了1/4希腊城邦人的生命;公元165-180年,欧洲爆发安东尼瘟疫,死亡超过500万人,这场持续15年的瘟疫也终结了罗马帝国持续约两个世纪的顶峰时期;公元700~1050年间是日本史上的“瘟疫时代”;公元846年,在入侵法国的诺曼人中间爆发天花,诺曼人杀死了所有的病人和看护病人的人;公元1347~1351年,中世纪的西欧蔓延黑死病,许多地方1/3到1/2的人口都没有了;14世纪欧洲殖民主义者把传染病带到美洲,扫掉了美洲土著90%的人口,由此引起了大规模黑奴的贩卖;公元1555年,墨西哥天花大流行,200万人不治而亡。

“新药研发进入算力时代,赛灵思FPGA大显身手"

在对抗疾病的战斗中,药物发挥了巨大的作用。

因此,每找到一方对症的新药人类就赢得了一次对疾病的斗争!

“新药研发进入算力时代,赛灵思FPGA大显身手"

但是,新药的找寻和研究从来都是极其艰难和凶险的,中国古有神农氏尝百草寻药,但最后却被断肠草毒杀。

到了近代,随着对药物的研究深入到分子层级,加上计算机的辅助,新药研制加速,但是平均下来仍然需要15年左右的时间以及20亿美元的投入。但即便这样的投入也只有10%的新药研发成功。

另外,随着疾病日益复杂,新药的研发更加困难,就拿2020年的新冠疫情来说,全球各国医疗机构投入巨资研究至今仍然没有研发出特效药,导致新冠病毒不断变异,肆虐全球。

新药研发进入算力时代

“新药研发进入算力时代,赛灵思FPGA大显身手"

不过,我们也看到,随着人工智能技术的普及以及数据处理能力的提升,加上分子动力学,蛋白质组学等新理论的普及,新药的研发进入算力时代,只要算力不断提升,从理论上说我们是可以完全战胜各种疾病的。

目前,在治疗重症疾病如癌症等,靶向治疗成为一个突破方向,发现治疗或预防疾病的最佳靶点是治愈的关键,靶点往往是患者体内与疾病有关的蛋白质或致病微生物中的蛋白质。

靶向治疗是一种新型的治疗方法,是在细胞分子的水平上,针对已经确定的致癌位点进行治疗的方式。这个致癌位点既可以是肿瘤细胞的蛋白分子,也可以是某个基因片段,也称为靶向药物靶点。靶向治疗通过设计相应的药物,药物进入人体后会特异地选择致癌位点来产生作用,使肿瘤细胞死亡,但是肿瘤细胞周围的正常细胞组织不会受到伤害。

“新药研发进入算力时代,赛灵思FPGA大显身手"

“跟以前的放疗化疗相比,靶向治疗就类似于作战中的精准打击,以前是地毯式轰炸把好的细胞也给消灭了,现在的靶向治疗可以对病灶点进行精准治疗。“雪湖科技生命科学计算首席科学家盛楠指出,”我们在电影《我不是药神》中提到都治疗慢性白血病的格列宁,其实名字叫格列卫,其在慢性粒细胞性白血病治疗有效率超过 94%,急变期有效率也能达到31%,患者存活率从2001年的30%上升到了2018年的85%,长期跟踪结果显示,如果用药2年后检测不到癌细胞的话,患者往后8年的生存率为95.2%,死亡的4.8%多数与癌症无关,可以说已经完全治愈了这个病。”

“新药研发进入算力时代,赛灵思FPGA大显身手"

他指出目前人类与疾病的斗争已经进入到算力的时代,需要更强算力与这些病毒进行抗争,从药物研发流程看,从整个药物发现和新药研发流程中,计算占的比重还是比较大的。特别是在中间:靶点发现,化合物发现,以及先导化合物优化方面。

“新药研发进入算力时代,赛灵思FPGA大显身手"

“但是新药研发却并不是如此简单,走完整个流程就可以了。一款新药走到临床前,临床,最终到FDA,批准上市,研发的成功率其实是很低的,不到10%。那么怎么样去高效的提高药物发现成功率,就是我们前面药物发现阶段的关键。”他指出,“为什么药物发现的成功率如此之低?我们可以看到大部分是在临床的时候就失败了。另一篇文章统计了新药在临床失败的主要原因:主要是药效和安全问题。这边是临床二期的失败原因,我们可以看到,将近一半,48%的是药效问题。而排名第二,占25%的就是药效安全问题。这边是临床三期,新药研发临床失败的统计比例。超过一半,55%的是药效问题。排名第二的,仍然是药物的安全问题。”

“新药研发进入算力时代,赛灵思FPGA大显身手"

他表示在发现一个有药效的化合物后,需要对化合物进行优化。例如下图上这个X,虽然药效不错,但溶解度、安全性、人体吸收、化学稳定性不合要求,就需要对化合物进行优化,达到药效 、安全、溶解度、化学稳定性都能兼顾的先导化合物。

“新药研发进入算力时代,赛灵思FPGA大显身手"

“这些都要通过高性能计算,然而,分子动力学计算消耗算力巨大,例如对新冠病毒表面一个刺突蛋白的动态结构变化,需要对100万个原子之间的相互作用计算10亿次。要完成这一模拟,一台传统CPU服务器需耗时8年。因此往往需要大型超级计算机才能承担。”他指出。

“新药研发进入算力时代,赛灵思FPGA大显身手"

如果没有对药物的药效跟安全问题做如此严苛的筛选?可能会导致严重的后果,一个真实的案例是在上世纪60年代发生过叫反应停事件--这是德国研制的一款药物,其实药物分子就是跟上图中中间显示的一样--中间显示的这个化学式,从化学式角度上来看,这两个分子几乎是完全一样的。但实际上却如同我们的左手跟右手一样,这两个分子被称为手性分子,当时的条件在在生产药物的过程中,无法将这两种分子区分开来。虽然两个手形状一样,元素一样,整个分子结构也一样,但是它毕竟是一个在空间立体结构中不一样的分子。左边的分子其实是药物原本想要产生药效的一个分子构型--能够缓解孕妇的妊娠反应,可以说是孕妇的一个福音。但右边的这个分子却具有一个强烈的致畸作用,导致产生了大量的畸形婴儿,有上万的婴儿受到了药物影响。所以,药效以及安全性必须严格筛选。

分子动力学显山露水

盛楠表示在新药研中,经常用的是分子动力学模拟,奥司他韦就是计算出来的靶向药,通过基于分子结构的药物设计,从研发到上市,仅用了7年时间!

“新药研发进入算力时代,赛灵思FPGA大显身手"

分子动力学是一套分子模拟方法,该方法主要是依靠牛顿力学来模拟分子体系的运动,以在由分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量和其他宏观性质。
按照盛楠的说法,分子动力学让“死靶”变成了“活靶”,将将原理静止的结构动态化了,大幅度提高了研发成功率。

“新药研发进入算力时代,赛灵思FPGA大显身手"

这是一个基于基于蛋白质运动行为差异研发的抗癌新药,从下图可以看出,如果看静态的分子结构,左边1号和右边2号是基本一样的,但是从动态来看,左边蛋白质分子运动频率要高于右边的,可以从它们的差异化之处找到和药物 结合的最佳方法。

“新药研发进入算力时代,赛灵思FPGA大显身手"

这就是通过分子动力学模拟发现其中的结构变化细节的案例,与实验技术相比,模拟技术在预测生物体系行为现象以及深入研究现象背后所蕴含的机理方面更具优势。

“新药研发进入算力时代,赛灵思FPGA大显身手"

不过分子动力学计算需要算力巨大,也只有超级计算机才能承担,美国DEShaw研制了分子动力学专用超算ANTON2,搭载了分子动力学专用计算架构的ASIC,也只能对百万原子体系每天能够计算9.5微秒的运动轨迹。这台机器服务于Relay医药,为Relay医药提供算力支持,基于蛋白动态行为研发抗癌新药。在新冠疫情爆发之后,这台机器快速反应,公开了大量新冠病毒的分子动力学计算数据。

“新药研发进入算力时代,赛灵思FPGA大显身手"

盛楠表示由于FPGA在并行计算上有天然的优势,因此,雪湖科技基于赛灵思Alveo数据加速卡,设计开发了分子动力学专用计算架构。在一颗FPGA芯片上实现了完整分子动力学计算过程。

“我们的专用计算架构采用了可变精度和自适应等技术,并且我们是基于公式直接进行架构设计,针对FPGA专门优化算法。这个基于赛灵思Alveo数据加速卡的分子动力学解决方案,兼容目前常见的分子动力学软件,经过我们内部测试,我们通过FPGA计算出来的蛋白结构统计数据与软件计算出来的数据虽然不是一摸一样,但统计上几乎没有差别。”他强调。“雪湖科技基于赛灵思 Alveo 加速卡的分子动力学专用计算的性能优异,对于百万原子体系100纳秒的模拟,只需要8小时就可以完成。我们设计的分子动力学专用计算架构还可以部署在基于赛灵思Alveo加速卡的云计算服务器上,提供基于FPGA云的分子动力学专用计算服务。”

2021年年初,雪湖科技基于赛灵思 Alveo 加速卡的分子动力学专用计算解决方案获赛灵思自适应计算挑战赛Adaptive Computing Challenge 2020 全球第二名 。

“新药研发进入算力时代,赛灵思FPGA大显身手"

他表示通过多张卡多节点组成集群,还可以进行超大规模分子动力学模拟,根据推算,一个赛灵思Alveo加速卡的机柜能够实现2天完成1亿原子计算100纳秒轨迹的性能。

未完待续......

第二部分我们将介绍的是赛灵思FPGA在医学领域如何大显身手?

注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利!

最新文章