人工智能技术如何助力病案智能化编码与DRG支付方式变革
日期:2024-06-25 05:06:40   来源:荣誉资质

  随着病案首页在医疗付费、流程管控中的重要性增加,其编码数据的准确性引起了慢慢的变多的关注。从各类医院的真实数据抽验研究表明,病案首页编码数据的准确程度远未达到监管部门的要求。

  为了使各项统计工作、审批基线有据可依,院方应严把病案首页质量关,狠抓全体医护人员病案书写质量,并加强医师的职业素养和专业水平,同时使用技术方法辅助、审查并按数据的准确度与完整性,大力促进病案首页书写标准化、规范化,确保统计工作的高质量,实现医学、统计、信息、计算机应用四位一体。

  同时,也应加强病案、技术部门相互间的沟通与协作,使得人工智能等先进的技术得以辅助日常的医生工作流程,提升工作效率和工作质量。

  个人履历:复旦大学公共管理后流动站、国家卫计委统计信息中心博士后工作站博士后。大健康领域资深战略专家。近10年的互联网医疗和大健康领域战略咨询经验,曾在国内某上市IT解决方案与服务供应商担任战略咨询和科研业务发展总监职务,主导策划了面向大健康领域很多具有前瞻性的创新商业模式,曾前瞻性的预测了中国医疗支付尤其是DRG支付方式改革将成为中国十三五深化医改的关键举措。曾以整体项目牵头负责人的角色,参与国内某地市级DRG医保支付方式改革的试点项目。帮助该市医保局构建了全市DRG支付体系改革的顶层方案设计,并落地信息化系统的工具支撑。

  计算机辅助编码工具已经存在了多年,但是国内目前对智能编码概念的理解程度不一,对智能实现的方式还停留在比较浅的层面上,现存疾病智能编码研究大多基于大夫给出的诊断,在诊断关键字基础上做可能的提示,引导编码人员一步步操作得出最终编码(具体见图1)。

  另外一种是在病案管理系统中设置逻辑规则提示编码(具体见图2)。以上均不能从根本上解决疾病和编码的统一,没有体现编码过程中所需阅读病历的过程,因此是一种伪智能。

  随着计算能力的提升,基于深度学习的人工智能技术出现了井喷。人工智能技术在很多的领域里可以模仿人脑进行某些特定的程度的逻辑及非逻辑判断,最终能轻松实现类似于人类的决策判断。

  利用先进的人工智能技术探索在病案首页质量控制问题,尤其是编码纠正、辅助上的应用具有了一定的可行性。具体能轻松实现的功能包括:智能化ICD自动编码对应;多诊断情况下自动判别主要诊断;智能化编码合并及合理费用优化。

  病案首页数据质控能够正常的使用片面与全面方式分别实现。片面实现方式仅只利用病案首页内的有关数据,利用相关分析办法来进行处理分析,最终能轻松实现病案数据的修正、优化及稽查。

  全面实现方式在能够得到包括病人电子病历数据、处方数据、检查数据等相关别的信息时能做出的复杂数据质量评估。

  人工智能技术应用于智能编码其算法的基础都是自然语言处理(NLP)技术,该技术是通过计算机科学、信息工程和人工智能等手段让计算机实现对非结构化文本的理解、分析和处理工作。

  电子病历中患者的主诉、既往史、症状、诊疗过程及临床诊断等信息大多以非结构化的自然语言形式储存,如何能让计算机利用这些无章但极有价值的信息来辅助病案首页编码是提升医院管理效率和管理质量的一个重要部分。具体而言,文本处理所包含的步骤包括:

  分词是将文本序列切分成一个个单独的词,例如将“糖尿病周围血管病变”分解为“糖尿病”“周围血管”“病变”,这需要庞大的医学知识库在背后支撑,否则将会影响分词效果及以后的文本处理步骤。

  简单来说,词嵌入是一种词的类型表示,具有相似意义的词具有相似的表示,是将词汇映射到实数向量的方法总称。通过这一种方式产生的词向量不仅维度低,而且包含了语义信息。例如“癌”和“恶性肿瘤”这两个词所对应的向量在空间中距离很近,但“癌”和“汽车”这两个不搭边的词所对应的向量就距离很远。这样,通过运算可以使计算机像人一样“理解”词汇的意思。

  在经过分词和词嵌入之后,计算机就能开始识别文本中具有特定意义的实体了,在医疗中这些实体包括病人基础信息相关实体(姓名、年龄等)、药品名、疾病名和手术名等。一些常见的实体可能包含在知识库当中,识别起来就很简单。但是对那些不常见的实体的识别,则需要一些算法来实现。

  通过以上三个步骤,计算机已能较好的理解文本的语义,以辅助编码为例,计算机能够最终靠“基于规则”和“人工智能”这两个手段来达成。

  “基于规则”依靠的是大量医学知识的沉淀,通过编码逻辑和编码规则,将处理好的文本与编码的标准描述对齐匹配,达到编码的目的。逻辑和规则的搭建需要依靠电子病历中不同部分的内容信息,这中间还包括:病人基础信息(性别、年龄)、临床诊断、手术操作、影像信息和病理信息等。“基于规则”智能编码系统的搭建需要花费大量的时间和专家资源,且维护的成本高。但是一旦搭建完成,其编码的效果好、编码路径的可解释性强。

  “人工智能”途径则可以在最短时间之内搭建出一个较为可靠的编码模型。它的主要核心是将编码问题转化为经典的文本分类问题来解决,只是在智能编码这个背景下,输入的是电子病历文本,输出的是该病例编码。计算机通过大量准确历史数据的训练,学习从文本中找特征,并将这些特征和编码标签联系在一起,从而完成学习的流程。

  在数据多且质量好的情况下,AI算法能够达到很好的效果,但是数据少、数据错误多都会让计算机“学错”,导致效果不佳。另外,相较于“基于规则”的智能编码,人工智能模型的可解释性不强,这也是AI在医疗很多应用上受限的一大原因。

  因此,最理想的病案首页辅助编码是以医学知识为基石、通过人工智能的算法赋能来搭建的。这样的系统既能保留很强的医学解释性,又能具有AI算法的高效和可扩展性。

  应用先进的自然语言处理技术、机器学习技术等基于AI算法开发的各类模型,将其应用在以诊断(编码)为主的病案首页数据之上。具体技术架构如图3所示,其包含以下特征。

  原始出院诊断信息为病案首页中的重要信息源自,而且大多数情况下以自然语言形态出现(即医生手动输入的文字型诊断内容)。同时,国家规范的ICD编码(包含ICD-10以及ICD-9-CM版本),其中的标准诊断书写方式也是基于自然语言。

  一般情况下医生一定要通过自己输入的关键词或完整诊断内容从系统自动化匹配的ICD编码中选择正真适合的对应编码。然而很多时候医生的书写方式与ICD中的形态完全不同,因而一些情况下通过关键字的搜索没办法找到对应的ICD编码。

  然而这一问题能通过知识库积累与自然语言处理算法进行优化。自然语言处理算法可以将医生书写的出院诊断文字进行语义学分析。将其中的核心词,及对应程度、病因、病理、部位、临床表现等的修饰词进行拆分与结构化。因而,不同部分的信息点可以以不同的方式进行分析。

  例如,标为“开放性右肱骨骨折”的主要诊断,自然语言分析可将其拆分为“开放性” “右” “肱骨””骨折”,分别指代诊断的类别、方位、位置及内容。因而可以对不同部分进行详尽的分析,从ICD编码中找出对应的大类。

  进而,医学知识库可以将各类表述同一诊断的不同表述方式进行整理归一,同时也可以将各类医学名词之间的关联性进行细化。例如上例中,能够最终靠知识库分析得知“右肱骨”属于“肱骨”、“肱骨”位于上臂,因此将会从ICD编码中排除所有不符合的编码,对候选结果来优化。

  由于编码过程除了涉及医学相关知识外,还要求编码人员有一定的逻辑判断能力。例如可以从多个出院诊断中选择合适的诊断作为主要诊断,或面对多个诊断信息时可以恰当地将其中可以合并的诊断进行编码合并。在此前提下,机器学习、深度学习算法可以对该环节进行一定程度的辅助。

  计算语言相似度的方法有很多,依据前期探索的经验,单一方法在自动编码辅助上的效果都偏差。因而需要探索多种方法整合后生成的模型是否可以具备更高的可用性。同时,应用神经网络将各类单一算法中有限的变量整合后进行关联,将可以在原有算法基础上形成新的、可支持一定逻辑的深度学习模型。一些候选的研究算法罗列在表1中。

  为实现主诊断的选择与合并编码,模型应具备极强的自学习能力与抗噪声能力。现有院内编码数据(甚至包括监管部门得到的历年上传的数据)的一个特点就是其中依旧有不少难以发现的错误与偏差。

  因而,在训练相关的模型时,在无法得到完整的并且无误的训练数据的时候如何保证模型具备一定的误差容忍度就成了极具挑战性的命题。

  伴随着DRGs支付方式改革的逐步推进,病案首页质量将越来越重要,编码的准确性问题需要引起高度重视。市场上的很多信息化厂商也纷纷开始关注病案首页质控以及智能化辅助编码的技术实现问题。

  随着人工智能技术的逐步推进,基于人工智能技术从电子病历数据来进行智能辅助编码将具有更广阔的前景。

  根据笔者的调研目前市场上也已经有一些厂商已经在一定程度上进行了很好的探索和市场化应用推广,为提升病案首页的数据质量以及编码的准确性做出了一定的贡献。

  但是,如果要从国家层面助力医保深入开展DRGs支付方式改革的全国推广,还需要进行一定程度的顶层设计,具体建议如下:

  尽管国家已经发布了统一版本的病案首页填写要求,但是从各地的实际来看还有很多城市存在病案首页填写版本不一致的现象,建议应该首先由卫健委或医保局统一牵头推进病案首页上报的标准版本,并确保该版本所需的数据能够满足DRGs分组所需要的全部数据需求。

  (2)推行统一的DRGs分组器,并发布与之相适应的编码体系,形成定期维护更新机制

  目前,国内主流的分组器版本有CN-DRGs、C-DRG、上海版DRGs等,为适应不同的DRGs分组器,各不同学派又研发了自己的编码体系,由于不同版本的编码体系有较大的差异,在信息化建设、数据共享和交换等方面不能满足信息化建设和医改提出的要求,加强疾病分类编码的统一管理、推行统一标准,是当前的大势所趋。

  因此,建议国家能够从顶层设计的思路考虑,充分吸纳借鉴各个学派的优势,融会贯通,确定国家统一的法定DRGs分组器版本、以及与之相适应的编码标准、编码规则,并形成定期维护更新机制。确保分组科学,疾病之间的可比性以及为DRGs支付提供技术支撑。

  (3)构建全国统一的病案首页/电子病历临床数据库,并成立专门的部门进行自上而下统一的数据质量监管

  根据国际经验,各国DRGs支付成功的必要条件是准确的临床和成本数据。因此,各国在实施DRGs支付体系构建时都会成立专门的部门负责对数据的搜集、处理、以及监管和审核等工作。

  以德国为例,德国专门责成InEK(Institut für das Entgeltsystem im Krankenhaus,DRGs研究院)进行DRGs的改革与开发工作。InEK的主要职责之一就是对医疗机构的数据进行收集与分析工作,并下设数据中心对医疗机构等提交的数据进行整理与汇总。

  临床数据主要用于诊断分类系统和程序分类系统,由InEK的数据中心收集汇总后提交给DIMDI(Deutsches Institut für medizinische Dokumentation und Information,联邦医疗数据文献及信息研究院)进行诊断和程序编码(基于InEK数据中心对临床数据的处理与汇总审核是确保DIMDI 的正确编码与分组的重要保障)。

  在编码层面,德国DRGs相关的编码工作,多数医院是由医师或专业编码人员来做。每一家医院皆设有医疗控制中心负责编码的正确性与优化,医疗控制中心同时也负责在专业审查过程与MDK连络。

  德国DRGs支付制度改革的一个很重要的经验就是数据基础建设。DRGs的开发依靠信息、能力、政策工具等多项基础条件,而可得、及时、准确的成本、临床、病案等数据基础是改革是否成功的决定因素之一。

  好的数据基础需要花时间来构建。一些国家希望在一个月之内就建成DRGs体系,但实际上构建DRGs系统是非常复杂的一项工程。在美国,建立DRGs系统花了15年的时间,先是在部分州作为试点,逐步扩大并完善。准确的数据是合理定价的基础,以马里兰州为例,在数据逐步完善的情况下,至少花了4-5年之后才确定费率。

  另外,DRGs系统本身的持续进化和更新本身还需要大量数据的积累,以更好的实现对于病种分类的不断改进,对于严重程度的评价与监督,以及对于存在变异性很大的数据的规律性的总结与验证等。

  DRGs支付体系涉及卫生、人社、发改、医院和商保等多部门的协同联动,数据标准化和跨部门的数据共享是推进该支付体系改革顺利实施和高效运行的重要保障,需要从国家层面加强对数据标准化的要求,并加强推进跨部门数据共享机制的建设,保障数据互联互通,更好的推进DRGs支付改革的顺利实施。

  另外,还应积极通过促进跨部门的数据融合,比如身份信息能够最终靠公安或运营商的数据进行补全及真实身份认证,来提升对医保支付基金的合力支付和使用的有效监管,避免医保欺诈行为的发生。

  如人工智能、物联网、5G等丰富数据源和数据实时采集功能,不断通过数据交叉验证等方式提升对编码和DRGs分组准确性的判断。

  随着人工智能技术的快速发展,可以考虑借助人工智能的技术通过“智能编码”的应用,从电子病历中通过语义分析的技术直接提取出关键主题信息,再利用深度学习的技术将主题信息进行分析对应到出院诊断,医生对诊断分析结果进行复核,并对应到编码,从而提升编码员编码的准确性,并反向监管编码与病案首页数据质量。

  但是,医保局在进行DRGs支付时,主要应用的分组数据来源于病案首页,尽管有部分厂商现在尝试利用人工智能技术,将数据采集从病案首页扩展到电子病历,无论是病案首页,还是电子病历,都是在病人出院后的结果数据,无法对病人在住院过程中的实时数据进行实时采集和过程管控。

  建议可以充分利用物联网手段采集与病案内容相关的护理数据、医疗器械数据、环境数据、患者数据,采用大数据技术对病案内容进行交叉验证,从而大大提高病案数据的完整性、真实性、及时性和可信度,同时也便于医院和医生对病人住院的治疗过程进行更精准的临床过程管理,和使用药品、耗材等的成本管控。

  对于医保部门来说,还有利于运用这些过程数据与编码数据进行交叉验证,有利于结合过程数据对编码的准确性进行进一步的辅助确认。

  编码决定了DRGs 的分组及费用支付的标准。因此国家医保局应该成立专门的组织来专职负责构建完善的DRGs费用、编码及数据质量审查及监管机制。

  未来实行DRGs支付制度改革,病案首页的数据质量将直接关系到医院的经营收益,从国外经验来看,实行DRGs支付后,一些医疗可能会存在高编码倾向,也要求监管部门通过规范临床数据,加强对病案首页的审核监管来避免高编码行为。这些都要求对病案首页的数据质量给予格外的重视。

  根据国际经验,实行DRG付费后高编码的现象会根据不同的制度设计呈现不同的特点,根据对国外的文献梳理发现,高编码风险的可能性和影响因素,因不同市场、控制和病例组合系统而存在不同的特点。具体如下图所示:

  因此,建议医保局结合DRGs支付方式改革的目标、系统的特点,在制度层面考虑设计有明确的目的性的高编码风险监管的奖惩措施,尽可能降低高编码的风险。

  DRG涉及到编码、病案、分组、权重与费率测算、质量监管等系列专业性极强的关键技术环节,从目前我国的人才现在的状况来看,还需要持续加强对不相同的领域专业人才的强化培训与持续培养机制的建设,为DRG支付体系改革的持续发展提供专业的人才保障。

  特别是基层医院、二级医院、民营医院等,由于医院信息化水平低下,缺乏专业的病案与编码人才,临床医生对临床数据尤其是编码的准确性重视不够等,长期以来数据质量低下,亟需提升与改善。需要通过专业化的培训以及借助智能编码等信息化手段,快速提升编码准确性,确保 DRGs分组的准确性以及支付方式改革的顺利开展。

  当前,病案首页数据质量上的问题是一个都会存在的问题,智能编码厂商的信息化软件系统的应用也是处于研发和试点阶段,建议国家医保局可以充分整合各厂商的产品的优点,寻找基础条件好的省市及重点医院开展试点,先行先试,在总结试点经验的基础上进行逐步推广。

  DRG支付体系改革是改变医疗卫生生态体系利益分配格局的一次卫生经济改革,涉及产业链条里的各方利益博弈,从国外经验来看,为越来越好的保障各方利益,很多顶层设计的规则、制度、标准需要以法律的形式进行明确,以更好的体现DRG 支付改革的权威性,确保改革能够顺利推进执行。

  因此,中国需要结合DRG顶层设计方案确定的系列规则、制度、标准及利益主体的谈判机制、组织形式及组织保障、数据如DRGs分组及编码的标准、质量监管等通过立法的方式予以明确。

  1.朱明宇. 基于医学人工智能技术的病案首页智能编码研究 [J].中国数字医学,2018(4)。

  2.高轶.公众号:风中小亭——文章:[围炉品茗话医保]第十二节:从技术角度看病案首页辅助编码系统。

  3.陆慧,陈家应. 美、澳、荷三国病例组合系统高编码风险比较研究[J].国外医学(卫生经济分册),2008,25(3): 120-126。

  本文中的大部分观点属于刘芷辰博士个人博士后课题研究成果,所引用的文章及观点属于作者在公开渠道获得的文献作者的观点,未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

  声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。文中出现的采访数据均由受访者提供并确认。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

  2019进一步改善医疗服务行动计划特别竞技赛案例征集火热进行中!戳此了解更多大赛详情。