AI News HubLIVE
站内改写2 分鐘閱讀

人工智慧能否進行情報分析?顯然不能

作者嘗試構建一個由多個AI代理組成的情報分析團隊,以自動化應用結構化分析技術(SAT),但最終發現無法實現。測試表明,AI代理在處理中國對臺網路行動等實際問題時,存在提問冗餘、收集計劃偏差、分析迴圈無效等問題。結論是,當前AI無法取代人類進行嚴謹的情報分析。

來源Hacker News AI作者: beatrobot

結構化分析技術(SAT)是情報分析中用於減少認知捷徑和偏見的一套方法。在進行歸因分析、地緣政治網路威脅情報或預測時,應用這些技術對於準確分析至關重要。然而,眾所周知,應用這些技術需要接受過SAT訓練的人員以團隊形式進行。這意味著以這種方式進行分析需要很長時間且成本高昂。在私營部門,很少有時間投入這種結構化分析。

為了解決這個問題,作者思考:能否構建一個由AI代理組成的分析團隊?如果可行,就可以自動化應用這些耗時且成本高昂的結構化技術,快速產生分析。本文記錄了作者所走的路徑、所做的嘗試以及為何最終失敗的原因。

作者設計了一個包含六個專門代理的流水線,每個代理在情報週期中扮演不同角色,從輸入到最終報告。第一個是利益相關者訪談者,負責與客戶對話,以非結構化的對話形式捕獲情報需求,並提煉出主要情報問題和子問題。第二個是收集計劃者,訪問經過整理的可信資訊來源資料庫,為子問題匹配最佳來源,並避免過度依賴單一來源。第三個是情報收集者,執行收集計劃,檢索相關資訊,但不解釋或總結,只提供原始材料。第四是分析協調者,根據情報問題和收集到的材料決定採用哪些分析技術。第五是分析代理層,執行實際的結構化分析,包括情景生成、反駁、證據加權、假設檢查等步驟。第六是報告生成者,將分析輸出轉化為利益相關者可以採取行動的報告,遵循“結論先行”原則。

分析層設計了一個結構化推理迴圈:先生成廣泛的情景列表,然後進行首輪反駁,剔除現有證據直接矛盾的情景;識別收集差距,向收集計劃者傳送新的情報要求;第二輪反駁後,進行競爭假設分析(ACH),評估每個情景的證據支援程度;接著進行證據加權,使用收集時分配的信任度評分;然後檢查關鍵假設,識別可能使情景崩潰的假設;最後選擇2-3個非重疊的替代情景,並透過魔鬼代言人進行壓力測試,最終做出評估。

作者以“如果中國對臺灣採取行動,我們應該預期哪些網路行動?針對誰?目標是什麼?”為測試問題。訪談階段表現良好,但日誌顯示子問題冗餘且重疊,更重要的是,所有問題都是預期性的(例如“中國可能做什麼”),而收集環節只能獲取事實性資訊,無法回答預期性問題。收集計劃雖然引用了RAND、新華社、RUSI、CISA等可靠來源,但指令過於寬泛,例如“收集中國在網路行動方面的戰略分析”,沒有指導收集具體事實。分析層試圖執行結構化推理迴圈,但由於前期收集計劃未提供適當資料,迴圈未能有效執行。

最終,系統無法產出比盲目猜測更可靠的分析。作者總結道,AI在情報收集和即時摘要方面有潛力,但當前的大語言模型無法替代結構化分析所需的嚴謹推理和多回合對話。真正的分析需要人類判斷、團隊協作、填補證據空白,並對替代假設進行系統測試——這些能力AI尚未具備。