透過代理系統和智慧自動化加速生命科學領域的價值實現速度
生命科學企業面臨研發與製造加速而基礎設施滯後的困境。資料量激增,數字化專案失敗率高(約70%)。本文探討透過工作負載驅動的基礎設施部署、物件儲存作為AI資料層以及適應性架構來加速價值實現。引用阿斯利康全球雲與基礎設施負責人Robert Wenier的觀點。
生命科學企業正面臨一個日益擴大的鴻溝:研發、製造和資料驅動決策的速度不斷加快,但支撐它們的基礎設施卻未能跟上。結果導致在組織試圖加速的關鍵時刻,反而出現延誤、成本超支和運營摩擦。僅資料量本身就足以說明問題的規模。2024年發表在《自然·方法》上的一項研究顯示,現代光片顯微鏡每臺相機每小時捕獲的影像接近4TB,單個實驗產生的資料集從數百GB到PB不等。
運營瓶頸進一步加劇了問題。美國能源部生物與環境研究諮詢委員會發現,當前的資料基礎設施無法支援整合的多模態研究,資料整合仍然主要依賴手動操作。據美國化學學會統計,約70%的製藥數字化專案以失敗告終。國際製藥工程學會的研究表明,製藥行業採用新技術的平均時間比其他行業晚48年,且即使採用,也首先發生在研發領域,生產車間總是最後跟上。忽視這種分裂的AI策略並非意外失敗。
這些後果直接影響AI效能。生成式和代理系統依賴於能夠大規模處理非結構化資料的靈活分散式基礎設施。當這一基礎缺失時,模型部署減慢,雲成本上升,AI本應加速的成果——如更快的靶點識別、更可靠的製造流程和即時邊緣決策——仍遙不可及。
阿斯利康全球雲與基礎設施負責人Robert Wenier 在這一挑戰的核心領域擁有豐富經驗。在最近與Emerj的Matthew DeMello的對話中,他闡述了為什麼生命科學組織不能再將基礎設施視為後臺問題,以及構建能夠跟上AI步伐的系統需要什麼。
本文探討了生命科學企業如何透過跨雲和邊緣環境協調AI、代理系統和基礎設施策略來加速價值實現:
首先,工作負載驅動的基礎設施佈置。Robert 將工作負載佈置問題從泛泛的雲與邊緣之爭中拉回實際。他指出,同步任務需要放在邊緣,非同步任務可以上雲。在生命科學領域,佈置應遵循執行需求而非組織習慣。例如,如果團隊訓練了缺陷檢測模型,那麼沒有必要在雲端執行推理,如果它能在製造現場執行的話。訓練和推理是不同的任務,不需要相同環境。推理不需要與訓練同等的GPU深度,管理者應避免為不需要的工作負載過度構建生產基礎設施。速度價值來源於將每個工作負載放在最佳位置,而不會增加不必要的成本或延遲。
其次,物件儲存作為AI就緒資料層。Robert 關於物件儲存的觀點與其說是技術選擇,不如說是為現代AI在生命科學企業內真正運作掃清道路。組織仍沿用數十年前的結構化系統——關聯式資料庫、嚴格模式、精心建模的資料倉儲——這些系統根本不適用於生成式和代理系統所依賴的非結構化高容量資料。物件儲存改變了局面,它讓團隊能夠儲存日常發現和製造過程中產生的雜亂異構資料——影像、文件、儀器輸出、半結構化日誌——而無需強行將其限制在可能影響AI使用的結構中。正如Robert所說:“物件儲存是生成式AI的基礎元素,它們想要原始的髒資料、變數,然後進行情境化和組織。過去我們不得不用非SQL資料庫構建本體模型,現在只需把資料傾倒進去,讓模型自己組織。”對管理者而言,如果資料被鎖定在遺留格式中,AI策略將永遠受制於過去。物件儲存提供了一種無需拆除所有遺留系統就能實現現代化的方式——一個發現和製造都能輸入、AI系統能無摩擦學習的中間層。這不僅是儲存升級,更是決定生成式和代理系統能否跨越整個生命科學價值鏈的架構基礎。
最後,適應性架構以應對AI的持續進化。Robert 的最後一個主題是對大型企業的警告:AI進步的速度現已快於企業變革的速度。落後不是因為選擇了錯誤的雲或錯誤的模型,而是因為基礎設施和治理模式無法在無需多年重建的情況下吸收下一次重大能力轉變。阿斯利康自身的經歷就是證明:團隊剛剛擴充套件了基於雲的模型開發,SageMaker就使AI工作流大眾化;他們還未能完全穩定這一波採納,生成式AI又出現了,再次重置預期。每一次飛躍都帶來科學家新的需求、基礎設施的新壓力和治理新挑戰。Robert 直言:“大型企業就像海洋中的巨型油輪,不能輕易轉向。它們落後數年,因為它們最佳化的是風險、成本和效能,而小型玩家可以作為早期採用者或快速追隨者跳上下一波浪潮。”對企業領導者而言,關鍵不是追逐每一個新能力,而是構建能夠經受它們變化的架構。這意味著無需重新平臺化就能在雲和邊緣之間靈活切換的基礎設施、能夠隨新工具擴充套件而非限制的治理模式,以及預見快速迭代而非抵制它的運營模型。那些設計為適應變化而非僅追求穩定的企業,才能在每個新自動化浪潮中獲利而非被打斷。