2026-06-15站内改写1 分钟阅读更新: 2026-06-15

Promptim：一个用于提示优化的实验性库

Promptim 是一个实验性的提示优化库，通过自动化迭代改进提示词，帮助开发者节省时间、提升 AI 系统性能。它利用数据集和评估器进行优化循环，并支持人工反馈集成。

Promptim 是 LangSmith 推出的一个实验性提示优化库，旨在系统性地改进 AI 系统的提示词。传统的提示工程依赖人工手动调整，费时费力且缺乏一致性。Promptim 通过自动化优化循环，让开发者只需提供初始提示、数据集和自定义评估器，即可生成更高效的提示词。

为什么需要提示优化？首先，它可以大幅节省工程时间，将重复的人工调试转为自动化流程。其次，它引入了评估驱动的开发方法，使提示工程从“艺术”变为“科学”。此外，当需要切换不同模型时，提示优化能快速适配不同模型的提示需求，因为评估器通常与模型无关，而提示本身则高度依赖模型。

Promptim 的工作原理如下：用户指定 LangSmith 数据集、一个 LangSmith 中的提示以及本地定义的评估器。系统首先在开发集上运行初始提示获得基线分数，然后遍历训练集样本，生成结果并评分，再将结果反馈给元提示以提出修改建议。修改后的提示会在开发集上重新评估，如果分数提升则保留，否则保持原提示。这一过程可重复多次，并可选择性地加入人工反馈环节（通过 LangSmith 的标注队列）。

尽管提示优化前景广阔，但 Promptim 并非万能。它仍需保持人类参与，至少用于最终结果的合理性检查。因此，Promptim 将优化后的提示存储在 LangSmith 的 Prompt Hub 中，方便人工审查。

与主流工具 DSPy 相比，Promptim 目前专注于单个提示的优化，而 DSPy 则优化整个复合 AI 系统。Promptim 更强调人机协作，例如通过标注队列引入人工反馈，而 DSPy 则更自动化。两者定位不同，适用于不同场景。

未来，Promptim 计划扩展到动态少样本提示、集成到 LangSmith 用户界面、增加更多优化方法，并考虑与 DSPy 集成以优化整个 LangGraph 图。开发者现在即可通过 pip install promptim 试用，并可在 GitHub 或 Twitter 上反馈意见。