【2018慢性病与信息大会】中国信通院赵阳光:人工智能在健康行业中的应用(2)
关于在电子病历当中的应用,以知识引擎,类似爬虫的方式对海量的临床数据和医学文献进行爬取,按照这些基本信息和指标构建医疗知识图谱,根据医疗知识图谱支撑上层的应用,临床辅助决策支撑帮助医生完成鉴别和诊断、用药的禁忌。在这里有几个步骤,关于医学文献当中的中文词语的分词和医学词语的识别等等这样一些因素,传统是基于统计学的方法,参照权威的词典来做这件事情,一是效率比较低下,二是对于近似词的处理以及未出现在词库中的词语理解能力比较下,像二级糖尿病的词语,传统方法来讲存在一些问题,现在来讲人工智能很多神经网络的模型,CRF这样一些新模型能够自主的学习,针对这个问题是比较大的。 关于在医药领域的研发应用,传统的制药来讲存在比较大的痛点,平均成功研制一款药需要十年的时间超过10亿美元长的成本,并且它的成功率比较低,现在借助于人工智能的计算机模拟的技术,就能够比较高效的筛选出稳定的化合物。 最后,跟大家探讨一下医疗人工智能的机遇和发展,首先是关于数据,数据的质量对人工智能来讲是比较关键的,现在在产业界当中大家都在做肺结节的检出,国外公开的数据集可以进行学习,但是那部分数据集存在的问题,基本上是参照国外的人体模型,在移植到国内用的时候还需要重新训练的过程。现在来讲,医疗健康的AI产品还存在一个问题,我们现在基本做的都是二分类的模型,帮助医生来看有没有肺癌,一般可以看到,但是有没有肺炎和肺结核等其他疾病还需要医生看一张片子,这一块需要未来提到的地方。 第二个,数据维度的问题,AI的产品不只要就图论图,图像的分析还更多结合临床的信息、患者的基本信息、病史、性别都是影响因素,基因、病理、随访都纳入进来作为权重因子。 第三个,关于标准,数据采集的质控,硬件采集数据的时候它的厂商、它的机型也是很关键的因素,像CT在主流的市场上有6到7种,机型达到上百种,每套模型参照一套模型来做的,希望更广泛的积累移植到更广泛的应用。 关于操作的规范性,我们头先进还是脚先进等等都是一些影响因素,这些需要保持它的一致性。 关于数据的格式,影像还比较好,但是病理芯片等等这样一些领域硬件厂商是比较私有化的格式,在产业这方面的发展需要各界互相的配合和协同,比这种私有格式进行开放,把训练的方式向通用格式进行转化。 我们看一下关于模式的问题,因为医疗健康领域去应用人工智能,未来一定要建立比较成熟的商业模式,我们现在想如果直接去将这种产品去销售给医疗机构,这种模式现在不论从资质还是从合作方的意愿来看,都会比较难以直接的实现。未来比较好的模式是帮助医院一些医疗机构完成一些科研的工作,包括去帮助一些政府服务于基层医疗机构的项目,这样的角度来切入。 关于制度的问题,未来医疗发展一定要明确医疗主体,以及医疗的范围,国家非常重视这方面的事情,尤其关于新的医疗器械分类目录当中明确提出,属于三类的,应用AI给出诊断意见的医疗软件,一定要经过临床的测试,也是表达了国家对这方面的重视,这就是我们对这方面的分析和探讨。 今天我的演讲包括这样一些内容,希望大家更多的批评和指正。谢谢! 【中国IDC圈原创,未经授权禁止转载】 (编辑:ASP站长网) |