Introduction

对诊断短语进行标准化编码对于医疗规范管理及后续医疗相关政策制定等是非常重要的。该软件是一款有监督的基于机器学习进行自动标准化编码软件。该软件可提供该诊断短语对应的最有可能的N个编码及其标准化表述。该软件不仅支持中文语料,也支持其他国家语言的语料。

本软件由三个子模块构成:参数配置模块、模型训练模块、模型预测模块。参数配置模块用于确定模型参数和输入输出的文件目录。模型训练模块构造模型,在训练文本上进行模型训练,并储存训练好的模型。模型预测模块利用训练好的模型对诊断短语预测其标准化表述,获取相应的编码。

本软件有如下几个主要特性:本软件通过进行字词和诊断短语的表示学习来预测诊断短语的标准化表述,获取相应的编码。此向量化表示可用于医疗编码的预测,也可用于解决其他医疗文本自然语言处理任务。由于学习机制的特殊性使得学习到的字词嵌入式表示具有语义相似性。该软件不仅可以进行中文诊断短语标准化,也可以对其他国家语言的诊断短语进行标准化表述。

本软件可以运行在安装有Python3的Windows和Linux操作系统上。OSx系统上未经过测试。该软件需要Python的如下自定义包:torch, numpy。这些软件可以通过Anaconda的conda或者pip进行安装。

Publications

No Publication Information

Credits

  1. Sheng Yu syu@tsinghua.edu.cn
    Investigator

    Center for Statistical Science, Tsinghua University, China

Community Ratings

UsabilityEfficiencyReliabilityRated By
0 user
Sign in to rate
Summary
AccessionBT007117
Tool TypeApplication
Category
Platforms
TechnologiesPython3
User Interface
Latest Release1.0 (May 27, 2021)
Download Count1469
Country/RegionChina
Submitted BySheng Yu
Fundings

2018YFC0910400