AI News HubLIVE
サイト内リライト3 分で読了

ConlangCrafter:人工言語を想像するAI

研究者たちはConlangCrafterを開発しました。これは、多様で一貫性のある人工言語(コンラング)を生成するAIモデルで、汎用大規模言語モデルを上回る性能を持ちます。ランダムな変動と編集ループを用いて指定されたルールに従う言語を作成し、無料でオンラインで入手可能で、自然言語処理の研究や仮説検証に利用できます。

ソースIEEE Spectrum AI著者: Michelle Hampson

7,000以上の自然言語が存在する今日でも、人々は時折まったく新しい言語を作り出します。これらの人工言語(コンラング)には、ドスラク語、クリンゴン語、さまざまなエルフ語が含まれます。今、ConlangCrafterと呼ばれるAIモデルも新しい言語を生成できるようになりました。特にその能力に優れています。

6月27日に計算言語学会の議事録に掲載された論文で、研究者たちはConlangCrafterの言語生成能力を分析し、多様な新しい言語を一貫したルールに従って開発できると報告しています。

ConlangCrafterが新しい言語を生み出す方法

以前の研究で、カリフォルニア大学バークレー校の言語学准教授ガスパー・ベグシュは、大規模言語モデル(LLM)が人間と同程度に言語を分析できることを示しました。彼の最新の取り組みでは、AIモデルの言語の限界をさらに押し広げようとしました。

「言語全体を作り上げることは決して簡単な作業ではありません」とベグシュ氏は述べ、映画、書籍、ビデオゲームのための人工言語の作成にキャリアを捧げてきた人もいることを指摘します。

しかし、ベグシュ氏はAIモデルに人間の想像を超えた真に新しい言語を創造させることの付加価値を見出しています。「モデルは私たちが思いつかないようなことを想像したり考え出したりすることができ、そこから多くを学べます」と彼は言います。

例えば、ConlangCrafterは、音の代わりに色やジェスチャーを使う頭足類のための言語など、従来とは異なるコミュニケーションシステムを持つ新しい言語を作成できます。もちろん、ConlangCrafterが生成する「色の言語」は、タコが実際にコミュニケーションに使うものではありませんが、ベグシュ氏はこれらの想像上の言語を、非人間中心の言語をより詳細に研究する手段として構想しています。

チームにはカーネギーメロン大学の博士研究員モリス・アルパー氏とテルアビブ大学の博士課程学生モラン・ヤンクア氏が含まれており、ConlangCrafterは言語内の音の組織化(音韻論)、単語と文構造の関係(形態統語論)、語彙に関する幅広い言語ルールを適用できるように設計されました。

乱数生成器が定期的にバリエーションを導入し、すべての言語が異なるものになります。組み込みの編集ループが結果をチェックし、矛盾を修正します。ユーザーは任意のルールの組み合わせを選択するか、ConlangCrafterに独自のルールを作成させることができます。

「モデルは私たちが思いつかないようなことを想像したり考え出したりすることができ、そこから多くを学べます」——ガスパー・ベグシュ氏、カリフォルニア大学バークレー校

「自分が望むどんな言語の風味でも選べます」とベグシュ氏は言います。「例えば、日本語とエスペラントの混合言語を作ることもできます。」

「目標は言語が創造的であることであり、互いに異なるべきです」と、マルチモーダル機械学習と計算言語学を専門とするアルパー氏は言います。「また、一貫性も必要です。なぜなら言語はルールのシステムであり、それらのルールが互いに矛盾してはならないからです。」

多様性を評価するために、チームは生成された言語が文で使用される基本語順などの主要な言語特徴でどれだけ異なるかを測定しました。一貫性を評価するために、発明された各言語への翻訳がその言語自身のルールに正しく従っているかを確認しました。

彼らはConlangCrafterが生成した言語を、Gemini-2.5-Proのような汎用LLMが作成した言語と比較しました。「我々の完全なシステムは、単にLLMに新しい言語を発明するように促すよりも、多様性で約2倍、一貫性で約70%高いのです」とアルパー氏は言います。

自然言語処理におけるConlangCrafter

この研究に関与していないカーネギーメロン大学言語技術研究所の助教授デヴィッド・モーテンセン氏は、ConlangCrafterは自然言語処理研究者が言語の構造がモデルの性能にどのように影響するかをよりよく評価するのに役立つ可能性があると述べています。

「トレーニング時とテスト時の両方で、言語構造がモデルの性能に影響を与えることを示唆する研究が多数あります」と彼は言います。「しかし、この分野の仮説を評価するのは非常に困難でした。」彼はConlangCrafterのようなツールが、言語類型論や語彙などの要因の影響についての実験を科学的に信頼できる方法で促進するのに役立つと付け加えています。

ConlangCrafterは無料でオンラインで利用可能です。開発者らは、システムは現在、意味論、文脈的および会話的な言語使用、書き言葉の視覚的側面など、より複雑な言語次元に制限があると指摘しています。

ベグシュ氏は、話し方が思考や世界の認識に影響を与えるというサピア=ウォーフ仮説を研究するためにこの研究を拡大することを構想しています。例えば、それぞれが独自の言語を持つ異なる世界のシミュレーションを実行し、その社会への影響を探ることが考えられます。「それは素晴らしい次のステップになるでしょう」と彼は言います。