AI News HubLIVE
站內改寫3 分鐘閱讀

大語言模型在金融市場的應用

本文探討了大語言模型(LLM)在金融市場中的應用潛力與挑戰。儘管LLM在自然語言處理中表現優異,但在金融時間序列預測中面臨資料稀缺、噪聲多、對抗性環境等問題。文章分析了多模態學習、殘差化、長上下文視窗等技術的可能用途,並指出合成資料生成和基礎分析輔助是更可行的方向。總體保持謹慎樂觀。

來源The Gradient作者: Richard Dewey

大語言模型(LLM)在2023年推動了人工智慧革命,吸引了鉅額投資並引發了公眾的廣泛關注。像ChatGPT這樣的變革性消費產品,其背後正是LLM,它們擅長對錶示單詞或單詞部分的令牌序列進行建模。令人驚訝的是,透過預測下一個令牌,模型能湧現出對結構的理解,從而完成翻譯、問答和生成類似人類文本等任務。

量化交易者自然會產生疑問:能否將這些模型應用於價格或交易預測?也就是說,不再建模單詞序列,而是建模價格或交易序列。這一探索方向揭示了生成式AI和金融時間序列建模的許多本質。

LLM作為自迴歸學習器,利用序列中的先前令牌預測下一個元素。在量化交易中,例如統計套利策略,大部分研究關注識別自迴歸結構,即尋找能最好預測未來價格的新聞、訂單或基本面變化序列。然而,問題在於可用資料的數量和資訊含量。在2023年NeurIPS會議上,高頻交易公司Hudson River Trading比較了訓練GPT-3所需的輸入令牌數量與股市每年可用的可訓練令牌數量。他們估計,以3000只可交易股票、每隻每天10個資料點、每年252個交易日、每個交易日23400秒計算,每年有1770億個股市令牌可供使用。而GPT-3是在5000億個令牌上訓練的,兩者差距並非遙不可及。

但在交易情境中,令牌是價格、收益率或交易量,而非音節或單詞,前者預測難度大得多。語言具有潛在的語法結構,人類很容易預測句子中的下一個詞,但預測下一個收益率卻極其困難,因此沒有誕生億萬富翁日內交易者。原因在於市場上存在大量聰明人競爭抵消任何訊號,使市場接近有效(經濟學家Lasse Pedersen稱之為“有效的無效”),因而難以預測。沒有人會主動讓句子變得難預測,相反,作者通常力求文章易於理解。

從另一個角度看,金融資料中的噪聲遠多於訊號。個人和機構的交易動機可能不理性,或者與基本面無關,2021年的GameStop事件就是例子。金融時間序列還不斷受新資訊、監管變化和宏觀經濟衝擊(如貨幣貶值)的影響,而語言演化速度慢得多,時間跨度更長。

另一方面,AI理念在金融市場也有應用前景。多模態學習是一個新興方向,旨在整合不同資料型別(如影像和文本)構建統一模型。在金融領域,多模態方法可結合傳統技術時間序列資料(價格、交易量等)與替代資料(如推特情緒、新聞文章、公司報告或衛星影像)。透過多模態AI,可以融合所有這些非價格資訊進行預測。

“殘差化”策略在金融和AI中都很重要,但角色不同。在金融中,結構化因子模型將資產收益分解為共同成分(市場收益或共同因子)和每個資產特有的異質成分。市場因子難以預測,因此去除共同元素有助於個體資產層面的預測。在殘差網路(如Transformer)中,類似的想法是學習輸入X的函式h(X),但更容易學習h(X)與恆等對映的殘差。兩種方法都旨在利用結構最佳化預測。

LLM成功的關鍵是能夠識別長上下文視窗內令牌之間的關聯。在金融市場中,長程注意力可分析多尺度現象:基本面資訊(如盈利)可能在數月內被定價,技術現象(如動量)在數天內實現,而微觀結構現象(如訂單簿失衡)的時間尺度是秒到分鐘。捕獲所有這些現象需要跨越多個時間視窗。然而,金融中的多期預測同樣重要,交易系統需同時利用不同時間尺度上的異常,預測不僅下一期收益,還要預測整個期望收益的期限結構,而當前Transformer模型僅預測未來一期。

LLM在金融中的另一應用是合成資料生成。模擬股票價格軌跡可以模仿市場特徵,鑑於金融資料稀缺,合成資料極具價值。人工資料可為元學習開啟大門,類似機器人領域的做法:先在低成本但不夠精確的模擬器中訓練控制器,再用真實實驗校準。在金融中,模擬器可粗略訓練交易策略,學習風險規避、分散化等高階概念,以及減少交易衝擊的戰術,然後用真實市場資料微調預測。

金融市場從業者通常關注極端事件,生成模型可以取樣極端場景,但極端事件本身罕見,確定正確引數並取樣十分困難。

儘管LLM直接用於量化交易前景存疑,但它們可能助力基本面分析。隨著AI進步,可以想象它們幫助分析師完善投資論點、發現管理層評論中的不一致,或找出跨行業間的潛在關係。本質上,這些模型可以為每位投資者提供一個類似“查理·芒格”的智慧助手。

當前生成式AI革命的驚人之處在於,它幾乎讓所有人——學術研究者、前沿科技公司和長期觀察者——感到意外。構建越來越大的模型會導致湧現能力,這一現象完全出乎意料且尚未完全理解。AI模型的成功加速了人力資本和金融資本湧入該領域,從而催生更強大的模型。因此,儘管GPT-4這類模型接管量化交易的可能性目前不大,但保持開放心態十分必要。在AI領域,期待意外已成為一個有利可圖的主題。