AI News HubLIVE
站内改写1 分鐘閱讀

基於智慧體的形態交替模式演化模型

該論文透過多智慧體模擬解釋了形態交替(如英語“go”的過去式“went”)的出現和永續性。交替形式源於音系變化或詞彙變體,並透過群體傳播動態擴散。為評估生成形態的真實性,作者引入了AI歷史語言學家——一個由大語言模型驅動的辯論系統,比較真實與模擬形態。結果表明,無標度社交網路和隨機伯努利採納有助於產生更合理的形態。三個案例研究驗證了替代歷史情景。

來源arXiv Computational Linguistics作者: Aravinth Kulanthaivelu, Richard Sproat

為什麼英語中“go”的過去式是不相關的“went”?這種形態交替現象在語言中十分常見。儘管它們既不便於溝通也難以學習,卻能在語言中持續存在數百年甚至千年。近期,一項來自arXiv的研究透過多智慧體模擬,揭示了這些交替模式產生和維持的機制。

該研究提出了一個多智慧體模擬框架,用於模擬形態詞幹和屈折變化交替的出現。交替形式可能源於音系變化,或者像“go/went”這樣,來自部分人群使用的詞彙變體。當智慧體“聽到”另一個智慧體使用某個詞的新形式時,它會以一定機率採納該形式,並可能將其擴充套件到共享原形式的其他語法槽位。透過這種方式,交替形式在群體中傳播並逐漸固化為詞幹或屈折標記的交替項。

與先前的計算研究不同,該系統允許使用自然主義的詞彙形式、現實的音系規則、包含數百或數千詞條的詞彙表,以及數十或數百個智慧體的群體。它支援多種網路拓撲結構、擴散模式和智慧體採納策略,從而更真實地模擬語言變化。

這類模擬的一個關鍵挑戰是評估生成形態的真實性。為此,作者引入了AI歷史語言學家,這是一個基於大型語言模型的新系統。該系統模擬兩位歷史語言學家就一組語言形態進行辯論,比較真實語言、偽裝形態和實驗演化出的形態。結果發現,有利於產生更合理形態的因素包括無標度社交網路和隨機伯努利採納。這意味著,社會網路的結構和個體隨機採納新形式的行為在語言演化中起關鍵作用。

研究還提供了三個案例研究,模擬了有史可查的歷史變化,例如檢驗如果特定歷史事件未發生,可能產生怎樣的語言形態。這為理解語言變化的偶然性和必然性提供了新視角。

所有程式碼和資料均已公開,便於其他研究者復現和擴充套件工作。該研究不僅加深了我們對語言演化的理解,也為計算語言學中模擬現實語言變化的方法論提供了重要參考。