2026-06-05 21:35 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

实现演进式数据库开发：使用Lakebase进行数据库分支（续）

本文回顾了演进式数据库设计方法论，并介绍了Databricks Lakebase的写时复制分支技术如何消除传统限制，使每个开发者、每个PR都能拥有独立的数据库实例，从而提升团队协作与开发效率。文章详述了七项原始实践、其局限性、新兴实践以及CI/CD工作流程。

来源Databricks Blog

本文是系列文章的第二部分，探讨二十年后演进式数据库设计方法论的新发展。传统的数据库变更面临共享资源的瓶颈，而Databricks Lakebase的写时复制分支技术彻底改变了这一局面——创建一个TB级生产数据库的分支仅需一秒，且初始存储成本为零。这一突破使得原先仅停留在理想状态的实践（如“每个人都拥有自己的数据库实例”）成为现实。

文章首先回顾了2003年提出的七项原始实践：DBA与开发者紧密协作、所有数据库工件与代码一同版本控制、所有数据库变更为迁移、每个人拥有独立数据库实例、开发者持续集成数据库变更、所有变更为数据库重构、开发者可按需更新数据库。其中五项实践因技术限制而未能完全落地：DBA审查为同步瓶颈、独立实例成本高昂、CI/CD中共享目标数据库缺乏隔离、重构需要测试环境但缺乏细粒度支持、开发者实验可能影响他人。

Lakebase的架构将计算与存储分离，数据持久化在对象存储（如S3）上，PostgreSQL引擎作为独立计算层。分支操作仅需创建指向共享存储的新指针，写入时只保存差异页，因此速度与数据量无关。这一特性消除了实践4的成本障碍，使每个开发者、每个PR、每个实验都能拥有独立数据库实例。模拟层、内存数据库替代方案（如H2、SQLite）以及本地数据库容器化均可简化或移除，DBA的工单队列也大幅缩短。

基于这些能力，文章提出了2026年的新兴实践：DBA通过PR上的模式差异进行异步审查（实践1增强）；所有数据库工件包括模式差异和迁移测试结果加入版本控制（实践2增强）；迁移脚本需幂等性；独立实例可细粒度到每个PR；持续集成在PR级别自动运行；重构可在不同规模环境预演；按需更新数据库仅需一秒且不影响他人。此外，破坏性测试成为默认选项（爆炸半径为零），A/B变体可在并行分支上原型，统一目录确保了分支的治理一致性，甚至智能体也能以分支方式进行操作。

CI/CD流程中，GitHub Actions工作流自动创建每个PR的分支，执行迁移并运行测试套件。模式差异以PR评论形式发布，供DBA和团队审查。合并后分支自动清理。整个流程无需开发者手动管理数据库，实现了真正的自动化。

第一部分介绍了开发者Jen一天的场景，本部分则聚焦于她工作的新规则。DBA的角色从门卫转变为协作伙伴，审查重点从“会不会破坏数据库”转向“设计是否最优”。第二部分还详细阐述了DBA的新责任，包括策略管理和团队级治理，这些将在第三部分进一步讨论。总之，Lakebase的分支技术不仅解除了旧有限制，更催生了全新的开发实践和团队协作模式。