Apache Cloudberry (Incubating) 2.0.0 发布 - 用于分析和人工智能的 MPP 数据库
发布时间:2025-09-02 作者:Apache Cloudberry
相关开源项目
Apache Cloudberry (Incubating) 社区很高兴地宣布 Apache Cloudberry 2.0.0 的发布,这是该项目在 Apache 软件基金会下的第一个正式版本。
我们要感谢所有为此次发布做出贡献的贡献者,以及为我们提供宝贵支持的导师和 Apache Incubator 社区。这一重要里程碑反映了我们在满足 ASF 发布要求、将 Cloudberry 打造成一个开放的、社区驱动的项目方面所做的共同努力。
2.0.0 版本的主要亮点
- PostgreSQL 14 基础:基于 PostgreSQL 14.x 构建,为分布式分析环境带来了稳定的 PostgreSQL 功能和改进
- 性能改进:
- 优化的查询执行:分布式查询规划和执行方面得到显著改进
- 增强的资源管理:提高了集群节点之间内存和 CPU 的利用率
- 改进的并行处理:更高效的数据分发和并行查询处理
- 备份与恢复:改进了分布式环境的备份策略
- 动态表:一项新功能,支持自动、计划性地刷新查询结果,专为需要最新数据的场景而设计,例如实时分析、湖仓一体架构和自动化 ETL 管道
- PAX 存储格式:引入了 PAX(Partition Attributes Across)存储格式,这是一种混合方法,结合了行式存储和列式存储的优点。PAX 为数据写入和分析查询都提供了高性能,使其非常适合 OLAP 工作负载和大规模数据分析
- ASF 合规性:更新了许可证头部、LICENSE/NOTICE/DISCLAIMER 文件,优化了依赖项归属等
下载
Apache Cloudberry 2.0.0 可在以下地址下载:https://cloudberry.apache.org/releases。
有用链接
关于 Apache Cloudberry
Apache Cloudberry (Incubating) 是一个开源的大规模并行处理 (MPP) 数据库,用于大规模数据分析,它源自 PostgreSQL 和 Greenplum 数据库的最后一个开源版本。它旨在支持本地部署和云部署,为数据仓库和高级分析提供可扩展的基础。