2026-05-27 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

每日劑量：用於放射腫瘤學臨牀總結和試驗識別的工作流集成大語言模型自動化

本文介紹了“每日劑量”（TDD）系統，這是一個由大語言模型驅動的自動化臨牀總結和臨牀試驗識別系統，集成到常規放射腫瘤學實踐中。通過混合方法評估，對55名臨牀醫生進行了調查，結果顯示系統具有良好的可用性、滿意度，並有望節省時間。

來源arXiv Computational Linguistics作者: Jason Holmes, Federico Mastroleo, Mariana Borras-Osorio, Srinivas Seetamsetty, Satomi Shiraishi, Mirek Fatyga, Judy C. Boughey, Cornelius A. Thiels, William G. Breen, Daniel J. Ma, Daniel K. Ebner, David M. Routman, Brady S. Laughlin, Carlos E. Vargas, Samir H. Patel, Sujay A. Vora, Nadia N. Laack, Andrew Y. K. Foong, Wei Liu, Mark R. Waddle

放射腫瘤學領域的一項新研究介紹了“每日劑量”（The Daily Dose, TDD）系統，這是一個由大語言模型（LLM）驅動的自動化臨牀總結和臨牀試驗識別系統，旨在無縫集成到常規放射腫瘤學工作流程中。該系統的核心是RadOnc-GPT，一種專門為放射腫瘤學定製的語言模型，能夠每天自動生成醫生特定的電子郵件摘要。這些摘要包括患者日程、從電子健康記錄（EHR）中提取的簡潔臨牀狀態總結，以及針對新患者或諮詢就診的潛在相關臨牀試驗的自動識別。

研究團隊採用混合方法評估了TDD系統，在部署一個月後對臨牀醫生進行了一次橫斷面匿名調查。主要結果指標包括自我報告的可用性、滿意度、感知有用性、對工作流程的影響、節省的時間以及繼續使用的意願。內部一致性信度通過Cronbach's α進行評估。

結果顯示，在55名受訪者中，52人（94.5%）工作在放射腫瘤學領域，38人（69.1%）是主治醫師。大多數參與者（83.6%）報告每天或每週多次使用TDD。在5點李克特量表上，可用性和滿意度的平均得分（標準差）為3.89（1.04），感知有用性為3.43（1.24），影響和未來使用為3.80（1.17）。總體滿意度與感知的時間節省呈正相關（p < .001）。參與者報告的時間節省各不相同，27%的人估計每天節省≥10分鐘。問卷顯示出極好的內部一致性（總體Cronbach's α = 0.97）。

這項研究表明，像TDD這樣的LLM驅動自動化系統有潛力通過提供及時、個性化的信息來改善放射腫瘤學臨牀工作流程，同時可能減輕醫生的認知負擔。儘管早期結果令人鼓舞，但作者指出需要進一步研究以評估長期影響並優化系統性能。此外，系統依賴於專門訓練的RadOnc-GPT模型，該模型基於放射腫瘤學領域的數據進行微調，以確保生成的摘要準確且符合臨牀語境。未來的工作可能包括擴大樣本量、進行多中心評估，以及將系統擴展到其他醫學專科。