構建可靠的自主AI系統
本文介紹了拜耳與Thoughtworks合作開發的臨床前資訊中心(PRINCE)平臺,該平臺利用自主檢索增強生成(RAG)和Text-to-SQL技術,整合數十年安全研究報告,從關鍵字搜尋演進為智慧研究助手,能夠回答複雜問題並起草監管檔案。文章透過上下文工程和駕馭工程的視角,探討了關鍵工程決策,重點突出信任、透明度和人機協作。
構建可靠的自主AI系統是一項複雜的工程挑戰,尤其是在製藥行業這樣資料密集且對準確性要求極高的領域。拜耳公司與Thoughtworks合作開發的臨床前資訊中心(PRINCE)平臺,為這一挑戰提供了引人注目的解決方案。該平臺最初是為了整合分散的臨床前研究資料而設計的,這些資料通常儲存在多個孤立的系統中,包括結構化的研究後設資料和數十年積累的非結構化PDF報告。
PRINCE的演進經歷了三個階段:搜尋、詢問和執行。在搜尋階段,平臺透過統一的門戶整合了數千份非臨床研究報告,主要利用結構化後設資料實現高階過濾功能。研究者可以透過關鍵字和後設資料篩選,快速定位相關報告,但面對複雜問題時仍顯不足。隨著生成式AI尤其是檢索增強生成(RAG)技術的出現,PRINCE進入了詢問階段,允許研究者以自然語言提問,直接從非結構化資料中獲取洞察。透過將向量化的報告儲存在OpenSearch中,系統能夠檢索最相關的資訊,並結合LLM生成上下文豐富的答案。當前執行階段,PRINCE透過整合多代理系統,成為一個主動的研究助手,能夠處理複雜查詢、編排工作流程,甚至支援起草監管檔案。
系統的核心架構基於LangGraph和FastAPI,利用上下文工程和駕馭工程來設計資訊流動和模型管理。上下文工程決定了每個模型接收什麼資訊、排除什麼資訊,以及資訊如何在研究、反思和寫作等專門步驟之間傳遞。例如,研究者代理負責從資料庫和向量儲存中檢索資料,反思代理驗證資料的完整性和準確性,寫作者代理則綜合所有資訊生成最終答案。駕馭工程則構建了圍繞模型的框架,包括編排、工具邊界、狀態持久化、重試、回退、驗證、反思迴圈、可觀測性和人工稽核。每個步驟的狀態透過LangGraph檢查點持久化到PostgreSQL,確保故障恢復時能夠從斷點繼續。
為了確保可靠性,系統設計了多層彈性機制。如果特定LLM失敗,系統會自動重試請求,並在多次嘗試後回退到備用模型或平臺。重試在單個LLM呼叫和邏輯節點級別都實現了,以便快速從臨時故障中恢復。此外,代理會收到錯誤上下文,以便調整計劃或採取替代方案。例如,如果檢索步驟失敗,代理可以嘗試不同的查詢策略或資料來源。
信任是系統設計的核心原則。PRINCE透過透明度、可解釋性和人機迴圈整合來建立信任。系統會向使用者展示資訊來源和推理過程,包括檢索了哪些文件、模型的思考鏈以及答案如何生成。在關鍵決策點,如起草監管檔案前,系統會引入人工稽核,確保輸出符合規範。評估和監控方面,系統採用RAGAS評估框架進行日常交通評估,並利用Langfuse進行詳細跟蹤和除錯。評估指標包括答案的相關性、準確性和完整性,每天自動執行,以便及時發現和糾正問題。
PRINCE平臺展示了AI在製藥行業的變革潛力,顯著提升了資料可訪問性和研究效率,同時確保治理和合規性。透過從搜尋到詢問再到執行的演進,PRINCE為臨床前研究提供了強大的工具,加速了資料驅動決策,減少了不必要的實驗,最終有望加速更安全、更有效療法的開發。拜耳的經驗表明,透過精心的工程設計和迭代改進,自主AI系統可以在高風險領域實現可靠和可信的部署。