发布时间:2025-11-04 06:43:42 来源:技术快报 作者:域名

Hydra Columnar 是开源一个 PostgreSQL 列式存储插件,专为分析型(OLAP)工作负载设计,式存旨在提升大规模分析查询和批量更新的储引效率。

Hydra Columnar 以扩展插件的开源方式提供,主要特点包括:
采用列式存储,式存利用列内数据相似性,储引支持多种压缩算法,开源大幅降低存储成本。式存并行查询优化,储引结合 PostgreSQL 的开源并行执行框架,源码库充分利用多核资源处理复杂分析。式存向量化执行,储引批量处理列数据,开源减少函数调用开销,式存提升 CPU 缓存利用率,储引加速查询。PostgreSQL 兼容性,同时支持 OLTP 以及 OLAP 负载场景。目前,Hydra Columnar 还不支持 PostgreSQL 逻辑复制和外键,索引只支持 BTREE 或者 HASH。
以下是一个 Hydra Columnar 与 PostgreSQL、源码下载Citus 以及 TimescaleDB 使用 ClickBench 工具进行的分析性能测试比较:
从可以看出,Hydra Columnar 在绝大多数查询中获得了极大的性能提升,具体数据可以参考下面的网站:
https://tinyurl.com/clickbench
以下则是 TPC-H 数据仓库测试场景下的性能比较:
Hydra Columnar 提供了多种安装方式,使用 Docker 安装运行的命令如下:
连接数据库之后,启用插件并创建数据表:
复制CREATE EXTENSION IF NOT EXISTS columnar; CREATE TABLE sensor_data ( timestamp TIMESTAMP, device_id INT, temperature FLOAT );1.2.3.4.5.6.7.我们也可以明确指定存储引擎,默认使用 Hydra Columnar:
复制CREATE TABLE heap_table (...) USING heap; CREATE TABLE columnar_table (...) USING columnar; -- 默认值1.2.然后可以正常导入数据并执行查询分析。
复制-- 批量插入数据(列式存储适合批量写入) INSERT INTO sensor_data SELECT ...; -- 分析查询(仅扫描 temperature 列) SELECT AVG(temperature) FROM sensor_data WHERE timestamp > 2023-01-01;1.2.3.4.5.详细信息可以参考文档:
https://columnar.docs.hydra.so/
云服务器提供商