科学概念的计算概念史:从早期数字方法到大语言模型
本文回顾了在科学史、科学哲学和科学社会学中,从早期数字方法到大型语言模型(LLM)的计算概念分析方法。文章分为两部分:第一部分探讨了LLM之前的计算概念史,包括早期数字方法、分布语义方法和词汇语义变化检测;第二部分则聚焦LLM时代,介绍LLM在词汇语义变化检测中的应用及相关案例研究,并重新审视了语料库构建、模型选择、操作化权衡等方法论问题。
近日,arXiv上发布了一篇题为《科学概念的计算概念史:从早期数字方法到大语言模型》的论文,该论文对大型语言模型(LLM)在科学史、科学哲学和科学社会学(HPSS)领域中的应用进行了全面审视。文章将LLM置于计算概念分析的更长远历史中,探讨了它们为现有方法带来的新意、继承的长期问题,并回顾了相关案例研究。论文的作者是Michael Zichert和另一位合作者,全文共19页,作为一章收录于《Understanding Science with Large Language Models?》一书(第383-412页),由转录出版社出版,编辑包括Arno Simons、Adrian Wüthrich、Michael Zichert和Gerd Graßhoff,ISBN为978-3-8376-7994-6。
论文的第一部分重构了LLM出现之前的计算概念史,融合了三个研究方向:HPSS中的早期数字方法、数字史及相关研究中的分布语义方法,以及词汇语义变化检测。早期数字方法包括词频统计、主题建模等技术,用于分析科学概念的历史演变。分布语义方法则利用词嵌入(如Word2Vec)捕捉语义关系,而词汇语义变化检测专注于识别词语含义随时间的变化。作者详细介绍了这些方法面临的主要挑战和机遇,重点包括语料库构建(如选择代表性文献处理历史文本的稀疏性和偏差)、操作化和建模选择(如如何量化概念变化、选择适当的向量空间模型),以及评估与解释(如何验证检测出的变化是否真实反映历史演变)。
第二部分转向LLM时代,首先简要介绍了LLM的基本原理和能力,随后回顾了基于LLM的词汇语义变化检测研究,包括使用上下文嵌入(如BERT)或生成式模型(如GPT)来捕捉更细腻的语义变化。作者还介绍了在HPSS中的相关案例研究,例如追踪“科学”、“实验”等关键概念在几个世纪中的含义转变。在此基础上,论文重新审视了之前提出的方法论问题,展示了语料库构建、模型选择和训练数据、操作化权衡、评估与解释等问题如何在基于LLM的工作流中具体体现。例如,LLM的训练数据可能引入现代偏见,而模型的选择(如特定层或微调方法)会显著影响结果。论文强调,尽管LLM提供了强大的工具,但研究者仍需谨慎处理这些长期存在的挑战。最后,作者指出,该工作为HPSS领域研究者使用LLM提供了实用的指南,并呼吁未来在跨学科合作下进一步发展计算方法。论文的完整PDF可通过arXiv获取(arXiv:2606.04118)。