2026-06-04 12:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

科学概念的计算概念史：从早期数字方法到大语言模型

本文回顾了在科学史、科学哲学和科学社会学中，从早期数字方法到大型语言模型（LLM）的计算概念分析方法。文章分为两部分：第一部分探讨了LLM之前的计算概念史，包括早期数字方法、分布语义方法和词汇语义变化检测；第二部分则聚焦LLM时代，介绍LLM在词汇语义变化检测中的应用及相关案例研究，并重新审视了语料库构建、模型选择、操作化权衡等方法论问题。

来源arXiv Computational Linguistics作者: Michael Zichert, Arno Simons

近日，arXiv上发布了一篇题为《科学概念的计算概念史：从早期数字方法到大语言模型》的论文，该论文对大型语言模型（LLM）在科学史、科学哲学和科学社会学（HPSS）领域中的应用进行了全面审视。文章将LLM置于计算概念分析的更长远历史中，探讨了它们为现有方法带来的新意、继承的长期问题，并回顾了相关案例研究。论文的作者是Michael Zichert和另一位合作者，全文共19页，作为一章收录于《Understanding Science with Large Language Models?》一书（第383-412页），由转录出版社出版，编辑包括Arno Simons、Adrian Wüthrich、Michael Zichert和Gerd Graßhoff，ISBN为978-3-8376-7994-6。

论文的第一部分重构了LLM出现之前的计算概念史，融合了三个研究方向：HPSS中的早期数字方法、数字史及相关研究中的分布语义方法，以及词汇语义变化检测。早期数字方法包括词频统计、主题建模等技术，用于分析科学概念的历史演变。分布语义方法则利用词嵌入（如Word2Vec）捕捉语义关系，而词汇语义变化检测专注于识别词语含义随时间的变化。作者详细介绍了这些方法面临的主要挑战和机遇，重点包括语料库构建（如选择代表性文献处理历史文本的稀疏性和偏差）、操作化和建模选择（如如何量化概念变化、选择适当的向量空间模型），以及评估与解释（如何验证检测出的变化是否真实反映历史演变）。

第二部分转向LLM时代，首先简要介绍了LLM的基本原理和能力，随后回顾了基于LLM的词汇语义变化检测研究，包括使用上下文嵌入（如BERT）或生成式模型（如GPT）来捕捉更细腻的语义变化。作者还介绍了在HPSS中的相关案例研究，例如追踪“科学”、“实验”等关键概念在几个世纪中的含义转变。在此基础上，论文重新审视了之前提出的方法论问题，展示了语料库构建、模型选择和训练数据、操作化权衡、评估与解释等问题如何在基于LLM的工作流中具体体现。例如，LLM的训练数据可能引入现代偏见，而模型的选择（如特定层或微调方法）会显著影响结果。论文强调，尽管LLM提供了强大的工具，但研究者仍需谨慎处理这些长期存在的挑战。最后，作者指出，该工作为HPSS领域研究者使用LLM提供了实用的指南，并呼吁未来在跨学科合作下进一步发展计算方法。论文的完整PDF可通过arXiv获取（arXiv:2606.04118）。