news 2026/4/2 22:02:45

[NAACL 2018]Explainable Prediction of Medical Codes from Clinical Text

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[NAACL 2018]Explainable Prediction of Medical Codes from Clinical Text

论文网址:[1802.05695] Explainable Prediction of Medical Codes from Clinical Text

论文代码:GitHub - jamesmullenbach/caml-mimic: multilabel classification of EHR notes

目录

1. 心得

2. 论文逐段精读

2.1. Abstract

2.2. Introduction

2.3. Method

2.3.1. Convolutional architecture

2.3.2. Attention

2.3.3. Classification

2.3.4. Training

2.3.5. Embedding label descriptions

2.4. Evaluation of code prediction

2.4.1. Datasets

2.4.2. Systems

2.4.3. Evaluation Metrics

2.4.4. Results

2.5. Evaluation of Interpretability

2.5.1. Extracting informative text snippets

2.5.2. Results

2.6. Related Work

2.7. Conclusions and Future Work

1. 心得

(1)是数据划分得很好吗?

2. 论文逐段精读

2.1. Abstract

①文本和标签之间没有直接的对间联系,使得分类很难很杂乱

2.2. Introduction

①ICD分类难点:标签空间大、写作风格不统一

②作者提出Convolutional Attention for Multi-Label classification (CAML)

taxonomy n.分类法;分类学;分类系统

2.3. Method

①ICD编码设为

②对每个标签需要去分类这个样本,其中

2.3.1. Convolutional architecture

①临床文本嵌入:,其中是文本长度

②对每个单词嵌入使用卷积

其中是选择卷积的token/words数,是输入的文本嵌入隐藏层维度,是输出的文本嵌入隐藏层维度,*是卷积操作,逐元素非线性变换,是偏置。作者padding了一下所以输出是

2.3.2. Attention

实际上是一个-gram的文本特征

②计算文本特征和标签特征的矩阵乘积:

其中是标签的特征

③归一化:

④每个标签的表示:

⑤文档级特征嵌入:

2.3.3. Classification

①对于文档级特征嵌入使用线性层分类:

其中是权重向量,是偏置标量

②模型设计:

2.3.4. Training

①交叉熵损失:

对权重使用L2正则以及使用Adam优化器

2.3.5. Embedding label descriptions

①I表示相关,HI表示高相关,CAML总是能抓住比较相关的文本:

②另一个约束项variant Description Regularized CAML(DR-CAML),让可学习向量的特征和描述文本特征(从WHO中得到)相近:

2.4. Evaluation of code prediction

2.4.1. Datasets

①MIMIC III:有8921个标签,其中6918是疾病,2003是操作

②按被试ID划分,同一个被试的多次住院不会被同时分进训练集/验证集/测试集

③数据集:MIMIC III full,MIMIC III 50,MIMIC II:

④数据预处理:移除不包含字母的文本(如500被移除但是500mg保留),将所有字母小写,⭐把整个数据集出现小于三个文档的token标记为UNK

⑤预训练文本嵌入模型word2vec CBOW,维度为

⑥所有诊断记录被截断为2500个token

addendum n.补遗;(尤指书籍的)补篇

2.4.2. Systems

①超参数设置:

调参是通过Spearmint Bayesian optimization pack age做到的

2.4.3. Evaluation Metrics

①列举一些评估指标

2.4.4. Results

①MIMIC III full上的对比实验:

②MIMIC III 50上的对比实验:

③MIMIC II full上的对比实验:

2.5. Evaluation of Interpretability

2.5.1. Extracting informative text snippets

①描述了对于不同模型怎么提取标签对应的n-gram

2.5.2. Results

①请专家评估100次预测中标签和n-gram的对应程度:

2.6. Related Work

①列举CNN、LSTM、RNN等方法

2.7. Conclusions and Future Work

~

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/24 8:59:11

3步搞定Druid连接池容器化部署:从零到生产级配置

3步搞定Druid连接池容器化部署:从零到生产级配置 【免费下载链接】druid 阿里云计算平台DataWorks(https://help.aliyun.com/document_detail/137663.html) 团队出品,为监控而生的数据库连接池 项目地址: https://gitcode.com/gh_mirrors/druid/druid …

作者头像 李华
网站建设 2026/3/24 15:00:48

互联网大厂Java求职面试全场景模拟:核心技术与业务实战解析

第一轮:基础与核心技术 面试官:你好,谢飞机,我们先从Java SE和构建工具开始。请你简述一下Java 8和Java 11的主要区别,以及你平时用Maven还是Gradle? 谢飞机:Java 8引入了Lambda表达式和StreamAPI,Java 11增加了HttpClient等新特性。我平时用Maven,项目管理方便。 面试官:很好…

作者头像 李华
网站建设 2026/3/29 15:30:53

RuoYi-Cloud-Plus SSE推送:5分钟实现微服务实时通信的终极指南

RuoYi-Cloud-Plus SSE推送:5分钟实现微服务实时通信的终极指南 【免费下载链接】RuoYi-Cloud-Plus 微服务管理系统 重写RuoYi-Cloud所有功能 整合 SpringCloudAlibaba、Dubbo3.0、Sa-Token、Mybatis-Plus、MQ、Warm-Flow工作流、ES、Docker 全方位升级 定期同步 项…

作者头像 李华
网站建设 2026/3/27 11:40:28

Notally开源笔记应用:7大核心功能完整使用指南

Notally开源笔记应用:7大核心功能完整使用指南 【免费下载链接】Notally A beautiful notes app 项目地址: https://gitcode.com/gh_mirrors/no/Notally Notally是一款专为Android平台设计的开源笔记应用,以其简洁美观的界面和强大的本地优先功能…

作者头像 李华
网站建设 2026/3/30 19:26:21

EmotiVoice坚持技术向善原则

EmotiVoice:在声音的温度与技术的边界之间 你有没有想过,有一天AI不仅能“说话”,还能“共情”?当语音助手用带着一丝关切的语调问你“今天过得累吗”,当虚拟角色在游戏里因剧情转折而哽咽落泪,当视障用户听…

作者头像 李华
网站建设 2026/3/25 12:57:17

企业级物品租赁系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】

摘要 随着共享经济的快速发展,企业级物品租赁系统成为提升资源利用率、降低运营成本的重要工具。传统租赁模式存在管理效率低、数据不透明、用户体验差等问题,亟需通过数字化手段优化业务流程。该系统旨在为企业提供高效、安全的租赁管理平台&#xff0c…

作者头像 李华