人物圖譜:繪製著名思維的地圖
Persona Atlas 透過 AI 代理從公開網路收集資訊,為公眾人物構建可度量的行為畫像。它將十道開放問題的答案轉化為嵌入向量,允許使用者直觀比較不同人物的思維風格——如幽默、懷疑或抽象——而無需依賴客觀成績。該專案使用小型模型,強調風格而非能力,是“構建小型”駭客馬拉松的產物。
人物圖譜:繪製著名思維的地圖
你是否曾想象過,讓蘇格拉底、丘吉爾和一位矽谷創始人坐在同一房間裡,詢問他們同一個無法回答的問題,然後觀察他們各自如何尋求答案?大多數基準測試衡量的是模型知道什麼,而 Persona Atlas 則關注更微妙的事物——一個特定的思維如何運作——並試圖讓這一點視覺化,而不僅僅是斷言。
工作原理
執行分為三步。首先,研究:一個工具呼叫代理執行即時網路搜尋,提取資料,構建個人簡介、一份基於實際訪問來源的事實列表,以及一個“風格假設”——它對該人物如何應對從未見過的問題的最佳猜測。
其次,該人物回答基準測試中的十道刻意開放的提示,內容涉及身份、倫理、真理、自由意志、意義和機器意識。這些問題沒有正確答案,目的是讓個性滲透出來,而非模型的原始能力。
第三,每個答案都轉化為一個嵌入向量。一旦人物變成幾何形態,你就可以做文字永遠無法實現的事情:將兩個人物並排放置,測量它們之間的距離。
比較思維
選擇任意已儲存的人物,比較檢視會做兩件事。它測量答案在嵌入空間中的距離——一個數字表示整個群體的分歧程度——並根據十個特質錨點(嚴謹性、清晰度、創造力、懷疑精神、自信、善良、幽默、好奇心、務實性、抽象性)對每個人物進行評分,呈現為一個特質傾向熱力圖。
網格是雙中心化的,這比聽起來更重要。一個暖色單元格絕不意味著“在這個特質上高”的絕對意義——它意味著這個人物的傾向比你放在桌上的其他人物更接近該特質。將一群非常不同的人並排放置,行會分開:一個在幽默和自信上溫暖,另一個在抽象和懷疑上溫暖,往往在你用語言描述之前就能感覺到差距。感覺到差異與命名它之間的鴻溝,正是此地圖的用途。
為什麼我們放棄了分數
早期版本有數學問題和瑣事,存在正確答案和排行榜。所有這些都被刪除了。一個正確的積分,無論人物是愛因斯坦還是其他人,看起來都一樣——客觀任務衡量的是模型,而非人物。剩下的只有立場、語氣和推理風格實際存在分歧的材料。輸出是一面風格映象,而非心理測量:它顯示一個人物的答案相對於其他答案像什麼——而非對真實人類靈魂的解讀。
技術細節
一切都在透過 Hugging Face Inference Providers 託管的緊湊型小型模型上執行——一個緊湊的生成器驅動代理,一個輕量級嵌入模型進行幾何計算——加上即時網路和影像搜尋用於驗證。前端是 Gradio,包含三個標籤頁:研究一個執行、比較已儲存的人物,以及檢查完整的代理痕跡,以便你自己驗證它是否基於真實來源而非憑空捏造。一組預構建的人物隨附,因此頁面載入後即可進行比較,無需令牌。
誠實的侷限性
一幅肖像僅與開放網路所能揭示的內容一樣好,名稱衝突是真實的噪聲。地圖捕捉的是一個人物在一天內、一個模型下的回答風格——而非一個真實的人,更不是一個定論。應將其視為一幅諷刺畫:它透過誇張來揭示,作為對比和對話的鏡片最為有用。
嘗試一下
開啟“比較已儲存的人物”標籤頁開始,或者研究一個新人物並加入圖集: huggingface.co/spaces/build-small-hackathon/persona-atlas