人物图谱:绘制著名思维的地图
Persona Atlas 通过 AI 代理从公开网络收集信息,为公众人物构建可度量的行为画像。它将十道开放问题的答案转化为嵌入向量,允许用户直观比较不同人物的思维风格——如幽默、怀疑或抽象——而无需依赖客观成绩。该项目使用小型模型,强调风格而非能力,是“构建小型”黑客马拉松的产物。
人物图谱:绘制著名思维的地图
你是否曾想象过,让苏格拉底、丘吉尔和一位硅谷创始人坐在同一房间里,询问他们同一个无法回答的问题,然后观察他们各自如何寻求答案?大多数基准测试衡量的是模型知道什么,而 Persona Atlas 则关注更微妙的事物——一个特定的思维如何运作——并试图让这一点可视化,而不仅仅是断言。
工作原理
运行分为三步。首先,研究:一个工具调用代理执行实时网络搜索,提取资料,构建个人简介、一份基于实际访问来源的事实列表,以及一个“风格假设”——它对该人物如何应对从未见过的问题的最佳猜测。
其次,该人物回答基准测试中的十道刻意开放的提示,内容涉及身份、伦理、真理、自由意志、意义和机器意识。这些问题没有正确答案,目的是让个性渗透出来,而非模型的原始能力。
第三,每个答案都转化为一个嵌入向量。一旦人物变成几何形态,你就可以做文字永远无法实现的事情:将两个人物并排放置,测量它们之间的距离。
比较思维
选择任意已保存的人物,比较视图会做两件事。它测量答案在嵌入空间中的距离——一个数字表示整个群体的分歧程度——并根据十个特质锚点(严谨性、清晰度、创造力、怀疑精神、自信、善良、幽默、好奇心、务实性、抽象性)对每个人物进行评分,呈现为一个特质倾向热力图。
网格是双中心化的,这比听起来更重要。一个暖色单元格绝不意味着“在这个特质上高”的绝对意义——它意味着这个人物的倾向比你放在桌上的其他人物更接近该特质。将一群非常不同的人并排放置,行会分开:一个在幽默和自信上温暖,另一个在抽象和怀疑上温暖,往往在你用语言描述之前就能感觉到差距。感觉到差异与命名它之间的鸿沟,正是此地图的用途。
为什么我们放弃了分数
早期版本有数学问题和琐事,存在正确答案和排行榜。所有这些都被删除了。一个正确的积分,无论人物是爱因斯坦还是其他人,看起来都一样——客观任务衡量的是模型,而非人物。剩下的只有立场、语气和推理风格实际存在分歧的材料。输出是一面风格镜像,而非心理测量:它显示一个人物的答案相对于其他答案像什么——而非对真实人类灵魂的解读。
技术细节
一切都在通过 Hugging Face Inference Providers 托管的紧凑型小型模型上运行——一个紧凑的生成器驱动代理,一个轻量级嵌入模型进行几何计算——加上实时网络和图像搜索用于验证。前端是 Gradio,包含三个标签页:研究一个运行、比较已保存的人物,以及检查完整的代理痕迹,以便你自己验证它是否基于真实来源而非凭空捏造。一组预构建的人物随附,因此页面加载后即可进行比较,无需令牌。
诚实的局限性
一幅肖像仅与开放网络所能揭示的内容一样好,名称冲突是真实的噪声。地图捕捉的是一个人物在一天内、一个模型下的回答风格——而非一个真实的人,更不是一个定论。应将其视为一幅讽刺画:它通过夸张来揭示,作为对比和对话的镜片最为有用。
尝试一下
打开“比较已保存的人物”标签页开始,或者研究一个新人物并加入图集: huggingface.co/spaces/build-small-hackathon/persona-atlas