最新进展|生成式人工智能在骨科中的应用

2024-04-18   文章来源:解放军总医院骨科医学部   作者:李海峰,柴伟 点击量:1578 我要说

最新进展|生成式人工智能在骨科中的应用

作者:李海峰,柴伟

来源:解放军总医院骨科医学部


生成式人工智能(Generative AI)是一种能够自主生成文本、图像、音频等内容的人工智能技术。生成式人工智能的发展历程是一个不断迭代和创新的过程。1972年,IBM沃森实验室建立人类第一个语言模型,并在1993年升级至第二代。2010年,Google公司的Jeff Dean等人实现了第一个真正实用的深度学习系统——Google大脑,并用它构建出第三代语言模型。2018年,OpenAI公司发布了GPT(Generative Pre-trained Transformer)系列模型,这些模型在自然语言理解和生成方面取得了巨大成功。2020年,GPT-3的发布进一步推动了生成式人工智能在自然语言处理领域的应用,它能够生成连贯、有逻辑的文本,并在多种语言任务上表现出色。随着机器算力的提升和算法的优化,生成式人工智能逐渐取得了突破性进展。2023年,ChatGPT-4一经发布,就立刻展示出其在理解、生成和处理图像、文本、音频等多种数据类型方面的潜力[1、2],并被迅速引入到艺术创作、设计、教育、医疗等多个领域[3]。过去一年多,生成式人工智能也开始应用到骨外科领域的各个方面,并逐渐成为研究热点。本文尝试对生成式人工智能,尤其是GPT-4,在骨科教育、临床决策支持、患者沟通指导、疾病诊疗等方面的应用现状做一总结,并探讨了其面临的挑战和未来可能的发展方向。

1、生成式AI在骨科教育方面的应用

生成式AI在骨科教育中的应用正逐渐改变医学生和骨科医生的学习方式,进一步提高了教育的质量和效率。生成式AI可以帮助制作教学材料,如创建虚拟病例、模拟真实的临床情景,协助医学生和住院医师提高临床思维和决策能力,医学生可以通过处理这些虚拟病例来练习临床决策、诊断和治疗计划的制定。医学生也可以在这些模拟环境中进行手术操作的练习,提高手术技能而无需真正的患者参与。生成式AI也可以帮助学生和医生提高写作和考试的效率,甚至在骨科住院医师的培训中可以作为一个互动的学习工具。

Lum研究ChatGPT在应对骨科实习医生考试(Orthopaedic In-TrainingExamination,OITE)问题时的表现。为了避免偏差,有193个(48%问题)被排除在外,其余基于文本的212个问题由ChatGPT与不同级别骨科住院医师作答,结果发现ChatGPT可以准确回答47%的问题,而且,随着问题复杂性的增加,ChatGPT也表现更好。作者认为,ChatGPT的表现与骨科住院医师相当,ChatGPT可以作为一个用于辅助骨科学习教育的额外工具[4]。

Kung等使用ChatGPT 3.5和GPT-4版本对2020、2021和2022年的OITE问题(不包含图像的问题)进行了测试,没有使用任何提示。研究结果显示,ChatGPT3.5正确回答了360个问题中的196个(54.3%),相当于住院医师第一年(PGY-1)的水平。ChatGPT 3.5在回答问题时引用了可验证的来源,这些来源包括期刊文章、书籍或网站,平均期刊影响因子为5.4。而GPT-4正确回答了265个问题(73.6%),相当于住院医师第五年(PGY-5)的平均水平,并且超过了美国骨科委员会第一部分考试的及格分数67%。GPT-4在回答问题时引用了可验证的来源,平均期刊影响因子为5.2。作者认为,ChatGPT在标准化考试中的表现超过了平均PGY-1水平,而GPT-4的表现超过了平均PGY-5水平,进步显著。由此,可以借助生成式AI设计标准化的测试和评估,确保其公正性和一致性。甚至,可以利用AI分析学生的学习进度和理解程度,生成个性化的学习计划和资源,AI可以根据学生的反馈和测试结果,调整教学内容和难度,确保每个学生都能在适合自己的节奏下学习。还可以分析学生的考试结果,提供个性化的反馈和改进建议[5]。

2、生成式AI在骨科临床决策支持方面的应用

骨科疾病包括广泛的病理类型,包括骨折、关节疾病、脊柱畸形和运动损伤等,其诊断治疗决策常常面临着复杂挑战。生成式AI有潜力作为一个临床决策支持工具,实时为医生提供决策支持,帮助医生在复杂的临床情况下做出更准确的判断。例如,生成式AI可以通过快速分析患者症状、病史和影像学检查结果等相关信息,识别骨折、畸形、骨病等病变,并在诊断、鉴别诊断以及治疗选择等方面帮助临床医生进行决策,也可以建议进行诊断性测试或适当的成像方式以进行进一步评估。生成式AI也可以利用机器学习算法,根据患者的特定情况(如年龄、性别、健康状况和生活方式)来制定个性化治疗方案。这可以提高治疗的有效性,并减少不必要的干预。

另外,诸多骨科疾病的治疗建议通常基于循证指南和临床经验。生成式AI可以通过协助临床医生进行文献搜索、总结研究文章和识别关键发现,并根据患者及其病情的具体特征提供更新的治疗建议来进行优化。这一过程有助于优化治疗方案,促进遵循循证实践,并减少临床决策的变异性。生成式AI还可以通过分析患者的电子健康记录(EHR)来提供临床决策支持。例如,通过总结患者的主诉病史、实验室化验结果和影像学检查报告,AI可以辅助医生快速获取关键信息,从而提高诊疗效率。很多骨科疾病的治疗涉及手术和非手术治疗的决策。生成式AI通过分析大量的临床数据和文献,能够为医生提供基于证据的手术或非手术治疗建议。例如,生成式AI能够根据患者的具体情况,评估不同治疗方案的效果和风险,辅助医生制定个性化的治疗计划。

Rajjoub等评估生成式AI对2011年北美脊柱协会(NASS)临床指南提出的关于退行性腰椎管狭窄(LSS)诊断治疗等临床问题的决策回应。作者使用ChatGPT来回答NASS临床指南中关于LSS的14个问题,并将其生成的决策结果与指南提供的建议进行比较。同时回顾关于腰椎脊柱狭窄诊断和治疗的40篇文献进行证实或反驳,覆盖2012年1月至2023年4月。结果发现,ChatGPT的回应与当前关于LSS的文献发现相,ChatGPT不仅可以准确地回答问题,还为LSS的诊断和治疗方案提供证据,这与目前现有的文献证据一致。作者认为,可以将ChatGPT应用到脊柱外科医生的临床决策工作中,ChatGPT作为支持LSS诊断和治疗决策过程的一种手段,具有很大潜力[6]。  

Jayakumar等评估人工智能辅助决策工具对患者决策质量、患者体验、功能结果等效果,纳入因膝关节骨关节炎考虑TKA手术的患者129例,配到接受决策辅助工具的干预组或仅接受教育材料的对照组。干预组使用的决策辅助工具包括三个模块:教育、偏好评估和个性化结果预测。结果显示,干预组在决策质量、协作决策制定、满意度和4至6个月后的功能结果方面表现更好。干预组和对照组在咨询时间、TKR率或治疗一致性方面没有显著差异。这项随机临床试验表明,使用人工智能辅助的决策辅助工具可以显著提高考虑TKR手术的膝关节骨关节炎患者的决策质量、满意度和身体限制,而不显著影响咨询时间、TKR手术率或治疗一致性[7]。

3、生成式AI在骨科患者沟通方面的应用

生成式人工智能(AI)在骨科患者沟通方面正取得进展,为提高患者教育、增强沟通效率和优化患者体验提供了新的可能性。生成式AI可以提供个性化的患者教育材料,解释复杂的医疗条件、治疗选项和手术过程。通过自然语言处理(NLP)技术,生成式AI能够理解患者的问题并提供清晰准确的回答。生成式AI也可以作为医生和患者之间的沟通桥梁,帮助解释医疗术语和概念,确保患者充分理解他们的病情和治疗方案。这对于那些英语不是母语或有认知障碍的患者尤其有益。生成式AI聊天机器人也可以提供情感支持,帮助患者应对诊断和治疗过程中的压力和焦虑。它们可以提供应对策略、心理健康资源或仅仅是一个倾听者。生成式AI也可以提供个性化的术后护理和康复指导,帮助患者了解恢复过程中的预期和潜在挑战。生成式AI还可以跟踪患者术后康复进度,并在必要时提醒他们进行复查或调整治疗计划。通过移动应用程序和在线平台,患者可以实时与AI交流,获得即时反馈和建议。这种即时性有助于患者更好地参与自己的健康管理,并在有疑问时获得快速解答。生成式AI可以支持多种语言和文化背景的患者,确保全球患者都能获得高质量的沟通体验。这对于骨科医生来说尤其重要,因为他们可能需要与来自不同地区和语言背景的患者沟通。

Mika等研究生成式AI是否能够准确回答关于全髋关节置换术的常见问题。研究者向ChatGPT提出了关于THA的十个常见问题,并对其进行了评估。将每个回答都通过基于证据的方法进行了准确性分析,并根据回答的质量进行了评级。研究结果发现,ChatGPT给出的回答中,只有1个被评为“不满意”,2个无需更正,大多数需要最小(4个中的10个)或适度(3个中的10个)进一步澄清。尽管几个回答需要细微澄清,但ChatGPT的回答总体上是公正和基于证据的,即使是对于有争议的话题,也是如此。作者认为,生成式AI能够准确回答患者在THA术前提出的问题,另外,这些回答不仅基于临床证据,而且能以大多数患者能够理解的方式呈现信息,更为“平易近人”。生成式AI未来可能成为患者教育和理解的宝贵临床工具[8]。

4、生成式AI在骨科临床疾病诊疗方面的应用

生成式人工智能(AI)在骨科临床疾病诊疗的多个层面上展现出其潜力和优势,包括a疾病辅助诊断,通过分析医学影像资料,如X光片、CT扫描和MRI图像,来辅助诊断骨折、骨关节炎、肿瘤等骨科疾病。生成式AI通过相应算法能够识别和量化病变特征,提供更精确的测量和分析,从而辅助医生做出更准确的诊断。b手术规划和模拟,AI技术可以帮助医生规划复杂的手术过程,通过模拟手术步骤来优化手术方案。这种规划技术可以提高手术的成功率,减少手术中的意外和并发症。

4.1 骨科图像识别与分析

AI在骨科影像学中的应用主要集中在图像识别和分析上。AI可以帮助识别骨折、骨肿瘤、关节疾病等病变,提高诊断的准确性和效率。(1)自动化图像识别分析:AI算法能够自动识别和分析X光、CT、MRI等医学影像,快速检测和标记异常区域,如骨折、骨关节炎、肿瘤等病变。(2)骨折检测与分类:AI技术在骨折检测方面表现出色,能够准确识别不同类型的骨折,如简单骨折、复杂骨折或开放性骨折,并辅助医生评估骨折的严重程度和治疗方案。(3)骨关节炎评估:AI可以量化骨关节炎的严重程度,通过分析关节间隙、骨质破坏和软骨厚度等参数,帮助医生评估疾病进展和治疗效果。(4)骨肿瘤识别:AI在骨肿瘤的识别和分类中也显示出潜力,能够区分良性和恶性肿瘤,甚至预测肿瘤的生物学行为,为临床治疗提供重要信息。(5)多模态图像融合:AI技术能够整合不同来源和类型的医学影像,如将CT和MRI图像融合,提供更全面的骨骼和软组织信息,增强诊断的准确性。

   Guermazi等评估AI辅助技术在放射影像上检测骨折的可行性。纳入480名患者的影像学检查结果,由不同医生在有AI技术辅助和没有AI技术辅助情况下,进行骨折诊断。结果发现,没有AI辅助时诊断敏感性为64.8%(3732 of 5760 )。使用AI辅助时,敏感性为95.6%(5504of 5760 )。AI辅助技术使得每次读片时间缩短了6.3秒。作者认为,AI辅助技术提高了放射科医生和非放射科医生检测骨折的敏感性,而且不会延长读片时间[9]。

4.2 手术规划与模拟

生成式AI可以用于手术前的规划和模拟,通过分析患者的影像数据来预测手术过程和结果。这有助于医生制定更精确的手术方案,并提前识别可能的并发症。(1)个性化手术方案:AI技术能够根据患者的具体解剖结构和病情数据,生成个性化的手术方案。通过分析CT扫描、MRI等影像资料,AI可以帮助医生设计手术方案,确定手术切口的位置、角度和大小,以及植入物的尺寸和放置位置。也可以协助术后评估,监测植入物的位置和固定情况,确保手术效果。(2)手术模拟:利用AI进行手术模拟可以提前预测手术过程中可能遇到的问题和挑战,让医生在实际手术前有机会练习和优化手术步骤。这种模拟对于复杂或罕见的手术尤为重要。(3)手术导航系统:AI技术正在被集成到手术导航系统中,提供实时的、基于图像的指导,帮助医生在手术过程中更精确地定位和操作。这种系统可以减少手术中的不确定性,提高手术的精确度和安全性。(4)机器人辅助手术:AI与机器人技术的结合正在改变骨科手术的面貌。机器人辅助手术系统可以在AI的指导下执行复杂的手术任务,提高手术的稳定性和重复性。(5)风险评估:AI可以通过分析患者的临床数据和影像资料来评估手术风险,包括可能的并发症、术后恢复时间和失败率。这有助于医生与患者进行更充分的沟通,并制定相应的风险管理策略。(6)术后恢复预测:AI模型可以预测患者的术后恢复进程和结果,包括疼痛管理、功能恢复和生活质量改善。这些信息对于制定个性化的康复计划和调整治疗策略至关重要。

Velasquez等评估人工智能在全关节置换术前规划中基于三维(3D)模板应用状态。作者纳入九项研究,包括基于CT或MRI的AI模板。结果提示,基于AI技术的3D模板系统减少了手术规划时间,并提高了假体大小/位置的准确性。作者认为,基于AI技术的3D模板系统有潜力改善关节置换术前规划。这项技术提供了更准确和个性化的术前规划,有可能改善患者的功能结果[10]。

总之,生成式AI在骨科领域的应用前景是多方面的,具有潜在的变革性影响。生成式AI可以通过分析大量的医学影像数据来辅助医生进行更精确的诊断。生成式AI也能够根据患者的具体情况和历史数据,提供个性化的治疗建议,从而优化治疗方案。在医疗教育和培训中,生成式AI可以创建模拟的临床情景,帮助医生和医学生在虚拟环境中进行实践,提高手术技巧和临床决策能力。生成式AI可以作为患者与医生之间的沟通桥梁,提供更加清晰和易于理解的医疗信息,增强患者教育和参与度。生成式AI技术可以帮助医生在手术前进行详细的规划和模拟,提高手术的成功率和安全性。生成式AI可以用于患者的术后监测和康复指导,通过分析患者的恢复数据,提供个性化的康复计划和预警潜在的并发症。生成式AI的应用可以促进骨科与其他医学领域的合作,通过整合多学科数据和知识,推动综合治疗方案的发展。

综上所述,生成式AI在骨科领域的应用前景是广阔的,有望极大地提升医疗服务的质量和效率。然而,随着技术的发展,也需要关注和解决伴随而来的一些挑战和限制,确保技术的负责任和安全使用。首先,生成式AI的准确性和可靠性需要进一步监管,其提供的建议必须经过临床验证,以确保其准确性和适用于临床实际情况。另外,也需要保证医患数据隐私和安全性,在使用临床数据进行生成式AI决策时,必须确保遵守数据保护法规和维护患者隐私。生成式AI在医疗决策中的使用也可能引发了关于责任、透明度和患者自主权的伦理和法律问题,需要进一步研究。AI不能完全取代人类医生的同理心和直觉,因此在实施AI沟通工具时,应将其视为增强而非替代传统患者沟通的方法。生成式AI也可能传播错误或有偏见的信息,这可能对疾病诊疗产生负面影响,也可能造成医学教育中学生过度依赖技术可能导致批判性思维和临床决策能力下降等风险[11]。

作者简介

柴伟,中国人民解放军总医院骨科医学部关节外科主任,主任医师、教授

学术任职:International Hip Society会员,中国医师协会骨科医师分会关节外科工作委员会委员及青年组组长,中华医学会骨科学分会青年委员会关节外科学组委员,中国老年保健协会骨关节分会副会长,北京医学会骨科学分会青年委员会副主任委员及关节外科学组组长。

李海峰,中国人民解放军总医院骨科医学部关节外科副主任医师

致力于成人肩肘膝踝关节重建手术的基础研究与临床治疗。擅长膝关节周围截骨、微创单髁置换、全膝置换、导航或机器人等数智化技术辅助保膝等系列阶梯化全流程治疗,膝关节先天畸形、创伤骨折后遗症的截骨矫形,膝关节骨肿瘤切除术后关节重建,机器人辅助膝关节部分及全膝置换等。

担任北京市医学会骨科学分会关节外科学组青年委员会委员、骨感染学组委员等。获军队科技进步二等奖1项,三等奖2项,国家专利16项,发表论文60余篇。

参考文献

1  Lee P, Bubeck S, Petro J. Benefits, limits,and risks of GPT-4 as an AI  Chatbot formedicine. New Engl. J. Med.2023,388, 1233–1239. doi: 10.1056/NEJMsr2214184

2  Sanderson, K. GPT-4 is here: what scientiststhink. Nature ,2023,615, 773. doi:10.1038/d41586-023-00816-5

3   Kaul V, Enslin S, Gross SA. History ofartificial intelligence in medicine. Gastrointest Endosc. (2020) 92:807–12. doi:10.1016/j.gie.2020.06.04

4  Lum ZC.Can artifcial intelligence pass theAmerican board of orthopaedic surgery examination? Orthopaedic residents versusChatGPT. Clin Orthop Relat Res,2023.481:1623–1630

5  Kung JE, Marshall C, Gauthier C,at al.Evaluating ChatGPT Performanceon the Orthopaedic In-Training Examination..JB JS Open Access. 2023 Sep8;8(3):e23.00056.

6  Rajjoub R, Arroyave JS, Zaidat B, at al.ChatGPT and its Role in the Decision-Making for the Diagnosis and Treatment of Lumbar Spinal Stenosis: A Comparative Analysis and Narrative Review..Global Spine J. 2024Apr;14(3):998-1017.

7  Prakash Jayakumar.Meredith G,Moore、Kenneth A,etal.Comparison of an Artificial Intelligence–EnabledPatient Decision Aid vs Educational Material on Decision Quality, SharedDecision-Making, Patient Experience, and Functional Outcomes in Adults WithKnee Osteoarthritis: A Randomized Clinical Trial.JAMA Network Open.2021;4(2):e2037107. doi:10.1001/jamanetworkopen.2020.37107  

8Aleksander P. Mika、J. Ryan Martin、Stephen M.et al.AssessingChatGPT Responses to Common Patient Questions Regarding Total Hip Arthroplasty.JBone Joint Surg Am.2023 Oct 4;105(19):1519-1526. doi:10.2106/JBJS.23.00209. Epub2023 Jul 17.

9  Ali Guermazi、Chadi Tannoury、AndrewJ. et al.Improving Radiographic Fracture Recognition Performance and EfficiencyUsing Artificial IntelligenceRadiology. 2022 Mar;302(3):627-636. doi:10.1148/radiol.210937. Epub 2021 Dec 21.

10  Ausberto Velasquez Garcia、Lainey G. Bukowiec、at el . Wyles.Artificial intelligence–basedthreedimensionaltemplating for total joint arthroplasty planning: a scoping review.IntOrthop. 2024 Apr;48(4):997-1010.doi: 10.1007/s00264-024-06088-6. Epub2024 Jan 15.

11  Madhan Jeyaraman, Shanmuga Priya K, Naveen Jeyaraman,et al.ChatGPT in MedicalEducation and Research: A Boon or a Bane?Cureus. 2023 Aug 29;15(8):e44316

分享到: