分享热点新闻
打造优质自媒体!

云之声-中科院自动化研究所联合实验室获CCKS2020医学命名实体鉴定评估冠军

近日,第14届全国知识图谱与语义计算会议(CCKS-2020)在南昌召开,会上公布了CCKS-2020的技术评估结果,云之声-中科院自动化研究所语言与知识计算联合实验室在“中文”,电子病历医学命名实体识别评估任务”中获得冠军,并获得该任务唯一的技术创新奖。

云之声-中科院自动化研究所联合实验室获CCKS2020医学命名实体鉴定评估冠军 科学快报 第1张

由中文, 中国,信息社会语言与知识计算委员会主办的中国知识共享会议是知识地图、语义技术和关联数据领域的核心会议。其中,CCKS技术评估致力于推动国内知识图谱领域的技术发展,以及学术成果与产业需求的融合对接,而“技术创新奖”的设立致力于鼓励创新技术的使用。

“中文”电子病历医学命名实体识别是CCKS对中文电子病历语义的一系列评价的延续。它扩展和扩展了CCKS在2017、2018和2019年的评价任务,旨在从电子病历的纯文本文档中识别和提取医学和临床相关实体参考,并将它们分类为六个预定义的实体类别:疾病诊断、影像检查、实验室检查、手术、药物和解剖部分。

与一般领域的命名实体识别相比,医学命名实体识别面临两个核心挑战:

实体标注不一致。医学领域的标注通常需要有医学专业背景的人,但是不同的部门对标注标准的理解不同,所以容易出现不同标准的标注结果。用规则很难避免这种现象,也不可能直接纠正训练集中不一致的实体,因为不知道哪个标准是正确的。

缺乏培训数据。由于医学数据的敏感性,研究人员往往很难获得足够的标记数据。缺乏标注数据通常会导致长尾现象和模型缺乏泛化能力。当训练数据稀缺时,模型的预测结果可能会因模型参数的不同设置而发生显著变化。在医疗领域,需要的是一个更加稳定可靠的模型。

为了解决上述困难,云之声-中科院自动化研究所联合实验室团队基于贝叶斯不确定性策略构建了一个基于噪声标签学习的中文医学命名实体识别系统。该系统由基于对抗训练的半监督深度学习融合模块和基于实体多标签、缺失标签和错误标签规则的后处理模块组成。在本次测评中,系统在官方最终测试集中取得了严格指标0.9156和松弛指标0.9660的最高分。

云之声-中科院自动化研究所联合实验室获CCKS2020医学命名实体鉴定评估冠军 科学快报 第2张

目前,联合实验室团队的创新研究成果已应用于云知声旗,“智能病案质量控制”、“智能语音电子病案”等产品,并已用于医学知识图谱的构建。相关产品已登陆全国100多家医院,对于提高医生工作效率、加强医院信息管理、构建智慧医疗体系具有重要意义。