人工智能 (AI) 的快速发展为创建大量新的医疗保健工具开辟了道路,但为了确保这些工具不会加剧先前存在的健康不平等,来自牛津大学纳菲尔德骨科、风湿病学和肌肉骨骼科学系(NDORMS)、伦敦大学学院和民族健康研究中心的研究人员,在英国健康数据研究中心的支持下,首次研究了NHS中种族数据的全部细节。他们概述了在医疗保健服务中使用代表性数据的重要性,并将这些信息汇编成一个可供研究使用的数据库。
这项新研究发表在《科学数据》杂志上,是一个三阶段项目的第一部分,该项目旨在减少人工智能健康预测模型的偏见,这些模型是在真实世界的患者数据上训练的。并且该项目旨在解决大流行期间突出的种族差异,是英国政府由英国健康数据研究中心领导的 COVID-19 数据和连通性国家核心研究的一部分。
研究人员使用了来自全科医学和医院健康记录的种族和其他特征的去识别化数据,这些数据通过英国心脏基金会数据科学中心的CVD-COVID-UK/COVID-IMPACT联盟在NHS的英国安全数据环境(SDE)服务中安全访问。这是第一次对整个英格兰人口进行如此深度和广度的患者种族数据研究。研究人员能够结合记录来分析通过超过489个潜在代码记录的患者自我识别的种族。
在分析了英格兰超过6100万人如何在250多个不同的群体中识别他们的种族后,这些研究人员还研究了那些没有种族记录的人的特征,以及患者种族数据中的冲突是如何产生的。现在可供使用的数据显示,1/10的患者缺乏种族记录,大约12%的患者在患者记录中具有相互冲突的种族代码。
由于基于人工智能的医疗保健技术依赖于输入其中的数据,因此缺乏代表性数据会导致有偏见的模型,最终产生不正确的健康评估。来自现实世界的更好的数据,例如我们收集的数据,可以带来更好的技术,并最终改善所有人的健康。
这项研究评估了英国国家医疗服务体系(NHS)种族数据的可用细节,包括不同类型的种族代码。例如,NHS 医院通过 19 个种族代码记录患者数据,而全科医生使用全球公认的 SNOMED-CT 代码,其中有 489 个。然而,健康研究员失去了这些记录系统的更精细的细节,因为他们通常会将这些组压缩成五到六个,这可能会导致研究的准确性降低。
此外,研究员计划在项目的后续阶段展示这些发现的价值,该项目将首先侧重于在种族数据上使用这些详细结果,以更好地描述不同种族如何受到 COVID-19 大流行的影响,然后输入更公平的人工智能和机器学习工具适合不同的患者群体使用。
内容摘自Medical press
如有侵权,请联系删除。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有