公司简介

company profile

当前位置:首页 > 新闻中心

电话:0523-8651 1020 联系人:

华体会建立百万级医学代码字典库,康鼎科技如何实现海量医疗数据标准化?

编辑日期:2024-09-01 21:17:23作者:

详细介绍

成立百万级医学代码字典库,康鼎科技怎样实现海量医疗数据尺度化?

海内医疗年夜数据行业,正于从“观点盈余期”慢慢过渡至“价值兑现期”?

作者: 王鑫雪 来历: 动脉网 2022-08-03 14:07:22

海内医疗年夜数据行业,正于从“观点盈余期”慢慢过渡至“价值兑现期”?

从外部政策情况来看,自2015年《国务院关在印发促成年夜数据成长步履纲要的通知》初次明确指出成长医疗康健办事年夜数据、设置装备摆设医疗康健治理以及办事年夜数据运用系统后至今,国度已经接踵出台多份文件鞭策医疗年夜数据行业成长,并慢慢从“确定设置装备摆设”过细到“怎样设置装备摆设”“怎样羁系”等细分层面。

政策的鼎力大举鞭策催生出多量企业、投资机构入局,也带来了一级市场投融资的火热。

据动脉橙2022年Q1全世界康健医疗年夜数据价值趋向陈诉显示,2018年海内康健医疗年夜数据企业迎来融资井喷期,随后,跟着海内医疗人工智能成长步入深水区,医疗康健年夜数据行业融资也徐徐趋在沉着,但于2020年、2021年慢慢回升,达到颠峰。

而颠末多年沉淀,一批耕作于细分范畴的企业也走到了D轮及之后轮次,慢慢进入收成期。但从2016年-2021年融资数据来看,仍有55%的被投企业处在A轮及之前轮次,象征着于医疗年夜数据这一范畴仍存年夜量草创公司,也象征着离行业总体迈入收成期还存于必然间隔。

与此同时,医疗年夜数据行业仍旧面对数据孤岛、数据尺度化、隐衷保险等问题,问题暗地里的解决方案成了企业成长的要害密钥——谁能率先冲破,谁便能凸起重围。

你追我赶之间,有的企业选择投身在病院信息化基建设置装备摆设,有的企业选择为病院搭建数据集成平台,也有的企业选择为病院、安全公司、药企等搭建数据桥梁,挖掘医疗数据的运用价值。

康鼎科技属在末了一类企业。不成否定的是,它的竞争敌手许多,但历经7年的行业摸爬滚打以后,这家企业也找到了本身立足立命的地点。

一次与五十余家中中医院医疗数据的偶尔“相遇”

假如要为中国医疗行业写一本纪年史,2015年必然“浓墨重彩”。

或许直到此刻,另有药企以及CRO公司记患上2015年7月22日此日。于此日,CFDA投下重磅“炸弹”——《关在开展药物临床实验数据自考核查事情的通知布告(2015年第117号)》,夸大用最严谨的尺度、最严酷的羁系、最严肃的惩罚和最严厉的问责对于已经审批以及等候审批的注册申请开展临床实验数据自考核查事情。

就当从业者都以为这是一份“情势”严酷的新规时,倔强的履行力度很快让这一设法云消雾散,撤回种类也从第一个月的20%酿成了一年内的89.4%。

行业阵痛的暗地里,反应出了国度解决临床工程数据造假、不规范、不完备的刻意,为医药行业后续有序成长营建了精良的政策情况,也于整个行业数据规范意识醒觉的同时孕育出了一个伟大的蓝海市场。

恰是于如许的配景之下,康鼎科技的首创人选择了入局,并在2016年介入到了“国度十三五新药重点研发规划”的工程之中,介入了天下50余家中、西三甲病院的医疗全部据深度挖掘。

据康鼎科技总司理薛韶波回忆,首次接触云云大要量的医疗数据,团队都十分高兴。高兴以后,重大的事情量也让每个人都感触感染到了这份事情的艰辛:于近三个月的时间里,团队成员险些天天都吃睡于公司。

坚苦重重,最使人头疼的倒是看似最“不起眼”却最要害的尺度化事情,缘故原由于在这项事情于其时只能经由人工举行操作。

“咱们其时只要187小我私家,面临这么大要量的数据,只强人工于表格中逐个尺度化,就是干到退休也干不完啊。”薛韶波感触到。

也恰是这段履历,让康鼎科技萌发出了将数据尺度化事情主动化、智能化的设法。

一个统筹中中医范畴的百万级医学代码字典库

医疗康健数据对于科研、药物评价、患者治理等方面意思庞大。这是行业不争的事实。

但不管是于何种范畴的运用,都没法间接经由过程狼藉无章的医疗数据举行转化。换言之,所有关在医疗康健数据的运用,都必需成立于尺度化这一根蒂根基之上。

而尺度化的第一步,即是同一名称与指标。以白细胞为例,其于临床查验工程中可被称为白细胞、WBC等。是以,数据尺度化的第一步即是将各工程名称尺度化,然后再举行指标的尺度化(数据指标的单元差别、一般值规模差别,需要用科学的算法举行同一),终极造成的数据才具有数字资产的挖掘与运用价值。

可是,遗憾的是,行业今朝并没有现成“尺度”可循。是以,颠末多年起劲,康鼎科技“借鉴”了一套统筹中中医范畴、包罗ICD-10以及WHO的医学代码字典库。

据薛韶波吐露,这一字典库的造成并不是是康鼎科技拍着脑门幻想出来的,而是履历了100余场的专家论证集会的成果沉淀,具有社会公认性以及市场运用性。

“从某种水平上来看,字典库等同在数据婚配的尺度,只要拥有了尺度,才气强势占领市场。”薛韶波暗示。

但字典库只是一套参考系统,要想真正面向市场、占领市场,还需要一套与之相婚配的操作系统。

对于此,康鼎科技也于前述字典库的根蒂根基上造成了一个数据尺度化平台。详细操作流程为数据录入——数据洗濯——标化职员批量标化部门不规范辞汇——质控职员二次审核。

而且,康鼎科技数据尺度化平台可以或许实现数据的主动化婚配,即数据与字典表之间相似度的婚配,这也是该平台实现数据尺度化的根蒂根基。

详细而言,于尺度化历程中,如辞汇规范,与字典表的相似度为100%,则该辞汇可以或许实现主动婚配;如辞汇与字典包的相似度不敷,则由标化职员或者质控职员实行二次标化;如相似度为0且字典表中暂无婚配字段时审核职员可以举行重置。

而不管是数据的首次尺度化照旧标化职员与质控职员的二次尺度化,该平台都能撑持批量化操作。虽然从理论上而言,该体系一次性操作的数据量并没有上限(数据处置惩罚量重要与办事器机能相干),但康鼎科技提议将单次批量标化数据条数设置为50条。

也恰是于主动化、批量化的根蒂根基上,康鼎科技的数据尺度化平台与传统人工操作比拟,更高效,更具性价比。

“于字典库以及尺度化体系成立以前,数据尺度化事情是于excel表中开展,一个事情职员8小时标化数据的效率小在等在500条,每一条信息的尺度化成本为8元,成本高且效率低。”薛韶波吐露道,而于划一时间内,康鼎科技的数据尺度化体系的事情效率可以到达150000条以上,为人工操作的300倍,且经审核职员检验,数据精准度为90%以上。

可是,不管是字典库照旧数据尺度化平台,都还只逗留于技能层面,怎样真正落地,为医疗康健行业带来真实的价值,实现真实的价值转化,是企业该当思索的另外一个要害问题。康鼎科技又选择了如何的路径?

医学代码字典库 海内医疗年夜数据行业 医疗康健治理以及办事年夜数据运用系统

存眷年夜康健Pai 官方微信:djkpai咱们将按期推送医健科技财产最新资讯

最新快讯 医疗人工智能 | 聚焦“人工智能+医疗康健”,佛山发布行业数字康健立异运用十年夜典型案例

23小时前

/华体会
联系我们

电话:0523-8651 1020

邮箱:weiwei.lu@

地址:泰州市中国医药城口泰路西侧、陆家路东侧G60幢50号一、二层东侧

版权所有:江苏华体会医疗科技有限公司 备案号:苏ICP备18038691号-1 免责声明