科研宝知多点: 什么是结构化与非结构化数据?

 

今天我们来谈谈结构化对临床数据的重要性。...



我国医疗机构每年积累的临床数据量非常庞大,理应具有很高的研究价值。但在实际操作中,发现很多数据难以用来分析。因为医疗数据的类型复杂多样,并非所有的临床数据都是结构化的,同时还存在大量非结构化或半结构化的数据,再加上缺乏统一的数据标准,导致临床数据虽然看起来多,但利用率其实很低,只有结构化的数据才能使数据价值最大化。今天我们来谈谈结构化对临床数据的重要性~

何谓“结构化数据”与“非结构化数据”
临床上得到的患者数据能分为两大类:结构化数据和非结构化数据。

结构化的数据:按照统一的结构进行记录和表示,如保存在CIS或临床数据软件中的电子病历信息,它们通常是数字、符号的形式,不同的数据字段间都有一定规则和逻辑关系。这些数据通常可以很容易的被读取和分析。

非结构化的数据:无法用字段或统一的结构来记录,也没有统一的数据标准,如影像学资料、病理照片、文本式病例描述、音频等,通常只能以附件形式存放在系统中。也有一些介于结构化与非结构化之间的,称为半结构化数据。

临床数据处理需要用到具有结构化特征的数据库,有些数据库虽然每个独立数据看起来有结构,但数据与数据之间不存在联系,这样的数据从整体来看也是非结构化的。因此,真正的结构化数据库更要注重数据库中各数据字段的相互联系。
数据结构化对临床科研的意义
临床科研要尽量采集和录入结构化的数据,理由很简单:我们需要对大量患者信息进行统计分析,只有结构化数据才便于我们进行数据检索与数据挖掘!

如何才能确保采集到结构化的临床数据呢?

首先,要做好CRF的设计,严谨合理的CRF设计是后期进行结构化数据录入的基础;然后,还要重视数据标准的使用,在数据采集时应严格遵照行业相关规范,例如:ICD-10疾病编码,RECIST标准等。

临床数据的来源很多,临床医生如果采集方法不妥当,或没有对过往数据进行有效管理,就会产生大量非结构化的数据,例如:未编码的影响学资料;以txt或word保存的病例描述等,特别是大段大段文本时的病历,如果不加以结构化处理,这些宝贵的信息就毫无利用价值了。
crabyter科研宝帮助录入结构化数据
科研宝系统预设了多个常见瘤种和治疗方式的标准病例数据库模板,帮助临床医生进行结构化数据的采集。临床医生可以根据自身课题需求来设置eCRF,系统支持各种数据类型和样式,如果用户没有时间自己设置eCRF,只需将课题电子版文件发送科研宝工作人员,由他们来帮您设置eCRF,您只需在页面查看eCRF是否符合课题要求。

同时,科研宝系统还支持wordHTMLTXT以及图片等非结构的数据文件上传,并作为录入的数据源,将来可逐步转化成结构化数据,节省了数据采集时间,并且可以更高效地进行统计分析,提高临床科研的效率!

您在使用过程中,有任何的问题以及建议都可在公众号后台留言哦~

原创不易,转载请注明来源:crabyter科研宝


    关注 crabyter科研宝


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册