インカ・キープの構造パターンマイニング:教師なしクラスタリング、出所分類、サンタバレーの一致の計算検証
本研究は機械学習パイプラインを用いて619個のインカ・キープ(結縄装置)を分析し、教師なしクラスタリングで3つの構造グループを発見、教師あり分類で86%のF1スコアを達成、SHAPにより紐の撚り方向が帝国様式の主要な識別子であることを特定した。さらに、植民地時代の博物館コレクションによる構造的バイアスを明らかにし、サンタバレーのキープの半族構造を独立に検証した。
インカ帝国(紀元1400-1532年頃)は、キープ(khipu)と呼ばれる結縄装置を主要な記録媒体として使用していましたが、そのシステムは未だ解読されていません。新たな研究では、再現可能な機械学習パイプラインを用いて、公開データベースであるOpen Khipu Repository(OKR)に収録された619のキープ(54,403本の紐と110,677個の結び目を含む)を大規模に分析し、構造パターンを明らかにしました。
研究チームは、キープごとに27の構造的特徴を設計し、まずUMAPとHDBSCANによる教師なしクラスタリングを適用して、構造的に異なる3つのグループを特定しました(シルエット係数0.769)。そのうちの1つのクラスターは地理的地域ではなく、19世紀のヨーロッパ博物館コレクションによって支配されており、植民地時代の収集・記録方法が構造的にコーパスにエンコードされていることを示しています。
次に、勾配ブースティングによる教師あり学習で出所分類を行い、インカ後期帝国様式のキープに対してF1スコア0.86を達成しました。SHAPによる解釈可能性分析により、紐の撚り方向が帝国様式のキープを識別する主要な構造的特徴であることが明らかになりました。この発見は、帝国行政システムが標準化された紐製造技術を通じて記録実践を統一していた可能性を示唆しています。
さらに、この研究では、MedranoとUrton(2018年)が報告したサンタバレーの6つのキープのrecto/verso(半族)構造を、公開されたOKRデータベースのみを使用して独立に計算検証しました。物理的なアクセスなしに、全体の付着比率の再現と、唯一の混合標本の特定に成功し、先行研究の人類学的観察を計算論的に確認しました。
また、結び目タイプの配列順序をn-gramとしてエンコードしても、集約的特徴以上の出所信号は追加されないという否定的結果も報告されています。これは、キープのマクロ構造的特徴(紐の数、色、撚り方向など)が、ミクロな配列パターンよりも出所情報を反映する可能性があることを示唆しています。
すべてのコードとデータは公開されており、今後の研究の基盤を提供します。この研究は、機械学習の考古学への応用可能性を示すとともに、インカ帝国の記録システムの理解に新たな道を開くものです。研究者はこの成果を基に、キープの意味内容をさらに探求し、いつかはこの古代の符号体系を解読できるかもしれません。