2026-06-21 12:28 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-22 07:31 UTC+8

構建可靠的自主AI系統

本文介紹了拜耳與Thoughtworks合作開發的臨床前資訊中心（PRINCE）平臺，該平臺利用自主檢索增強生成（RAG）和Text-to-SQL技術，整合數十年安全研究報告，從關鍵字搜尋演進為智慧研究助手，能夠回答複雜問題並起草監管檔案。文章透過上下文工程和駕馭工程的視角，探討了關鍵工程決策，重點突出信任、透明度和人機協作。

來源Hacker News AI作者: sarangk90

構建可靠的自主AI系統是一項複雜的工程挑戰，尤其是在製藥行業這樣資料密集且對準確性要求極高的領域。拜耳公司與Thoughtworks合作開發的臨床前資訊中心（PRINCE）平臺，為這一挑戰提供了引人注目的解決方案。該平臺最初是為了整合分散的臨床前研究資料而設計的，這些資料通常儲存在多個孤立的系統中，包括結構化的研究後設資料和數十年積累的非結構化PDF報告。

PRINCE的演進經歷了三個階段：搜尋、詢問和執行。在搜尋階段，平臺透過統一的門戶整合了數千份非臨床研究報告，主要利用結構化後設資料實現高階過濾功能。研究者可以透過關鍵字和後設資料篩選，快速定位相關報告，但面對複雜問題時仍顯不足。隨著生成式AI尤其是檢索增強生成（RAG）技術的出現，PRINCE進入了詢問階段，允許研究者以自然語言提問，直接從非結構化資料中獲取洞察。透過將向量化的報告儲存在OpenSearch中，系統能夠檢索最相關的資訊，並結合LLM生成上下文豐富的答案。當前執行階段，PRINCE透過整合多代理系統，成為一個主動的研究助手，能夠處理複雜查詢、編排工作流程，甚至支援起草監管檔案。

系統的核心架構基於LangGraph和FastAPI，利用上下文工程和駕馭工程來設計資訊流動和模型管理。上下文工程決定了每個模型接收什麼資訊、排除什麼資訊，以及資訊如何在研究、反思和寫作等專門步驟之間傳遞。例如，研究者代理負責從資料庫和向量儲存中檢索資料，反思代理驗證資料的完整性和準確性，寫作者代理則綜合所有資訊生成最終答案。駕馭工程則構建了圍繞模型的框架，包括編排、工具邊界、狀態持久化、重試、回退、驗證、反思迴圈、可觀測性和人工稽核。每個步驟的狀態透過LangGraph檢查點持久化到PostgreSQL，確保故障恢復時能夠從斷點繼續。

為了確保可靠性，系統設計了多層彈性機制。如果特定LLM失敗，系統會自動重試請求，並在多次嘗試後回退到備用模型或平臺。重試在單個LLM呼叫和邏輯節點級別都實現了，以便快速從臨時故障中恢復。此外，代理會收到錯誤上下文，以便調整計劃或採取替代方案。例如，如果檢索步驟失敗，代理可以嘗試不同的查詢策略或資料來源。

信任是系統設計的核心原則。PRINCE透過透明度、可解釋性和人機迴圈整合來建立信任。系統會向使用者展示資訊來源和推理過程，包括檢索了哪些文件、模型的思考鏈以及答案如何生成。在關鍵決策點，如起草監管檔案前，系統會引入人工稽核，確保輸出符合規範。評估和監控方面，系統採用RAGAS評估框架進行日常交通評估，並利用Langfuse進行詳細跟蹤和除錯。評估指標包括答案的相關性、準確性和完整性，每天自動執行，以便及時發現和糾正問題。

PRINCE平臺展示了AI在製藥行業的變革潛力，顯著提升了資料可訪問性和研究效率，同時確保治理和合規性。透過從搜尋到詢問再到執行的演進，PRINCE為臨床前研究提供了強大的工具，加速了資料驅動決策，減少了不必要的實驗，最終有望加速更安全、更有效療法的開發。拜耳的經驗表明，透過精心的工程設計和迭代改進，自主AI系統可以在高風險領域實現可靠和可信的部署。