Skip to content

MatrixOne v25.2.1.0 Release Note

我们非常高兴地宣布 MatrixOne 内核 v25.2.1.0 版本于 2025 年 04 月 06 日正式发布!

MatrixOne 是什么?

MatrixOne 是一款 AI 驱动的云原生超融合数据库,采用存算分离架构并充分利用云上的基础设施,兼容 MySQL,并且支持混合负载场景,结合向量数据类型和全文检索,能够高效处理生成式 AI 应用的多模态数据查询与管理场景。

功能概览

MatrixOne 新版本全面支持全文检索与 BM25 相关性检索,显著提升了文本数据查询的精准度与效率;通过优化的 LOAD DATA 命令,实现了从 HDFS 文件系统高效加载大规模数据的能力,进一步增强了数据处理性能;新增的集群间 CDC(Change Data Capture)功能,有效保障了多集群之间的数据实时同步与一致性;同时,以实验特性引入了基于 HNSW 算法的向量索引技术,为高维数据处理和向量相似性搜索提供了全新解决方案;此外,新增支持全文检索与向量检索的 Python SDK,进一步降低了开发门槛,助力智能化应用的快速构建。

适用场景

MatrixOne 产品适用于以下应用场景。我们非常欢迎有以下业务痛点及需求的用户与我们联系进行试用测试。

  • 生成式人工智能场景:MatrixOne 超融合数据库为生成式人工智能(Generative AI)提供了强大的多模态数据支持、实时检索和智能数据处理能力,构成了生成式 AI 应用的核心基础设施。在文本生成、图像生成等多模态场景中,MatrixOne 通过高效的数据管理、向量和混合检索、Python UDF 支持的数据清洗与预处理,以及 GPU 加速的实时推理能力,确保大规模数据集上的快速响应和高质量生成效果。无论是大数据量的访问与存储,还是在线推理和动态反馈,MatrixOne 都能够为生成式 AI 应用提供稳定、低延迟的支撑,帮助企业在 AI 驱动的创新中迅速落地、迭代和优化生成式 AI 应用。
  • 时序数据应用场景:在现代 IoT 应用中,数以亿计的设备和传感器持续采集和传输数据,包括工业生产线、智能电网、智慧城市基础设施和自动驾驶车辆等,每天产生的实时数据量达 TB 级别。MatrixOne 超融合数据库针对 IoT 场景提供了高效的实时数据处理能力,支持毫秒级的高并发写入和快速检索,并具备优越的扩展性,应对峰值负载。其实时分析功能帮助企业从海量 IoT 数据中快速生成关键洞察,同时与机器学习模型无缝集成,将实时数据流直接引入模型进行预测和异常检测,适用于工业预测性维护、能效优化和智能监控等应用场景,从而全面满足 IoT 应用对高吞吐量、低延迟和智能数据管理的需求。
  • 混合负载类型应用支持:在企业常用的 OA、ERP、CRM 等业务系统中,随着数据量和业务复杂性的增长,传统单机数据库往往难以满足高峰期的性能需求,尤其在月末、季末等关键时间节点上,通常需要高频分析和实时统计报表来支持决策。许多企业因此配置了独立的分析数据库,或采用分库分表的方式以减轻主库的查询负载。而 MatrixOne 的混合负载支持使企业无需额外系统,即可在单一数据库内同时满足业务和分析需求,通过实时数据分析确保高并发下的快速响应。MatrixOne 的扩展性则允许业务规模的无缝扩容,使得实时查询和统计在大规模数据增长的条件下依旧高效,确保企业在数据决策中的实时性、连续性和高效性,全面提升数据管理的灵活性。
  • 企业级 SaaS 场景:随着企业级 SaaS 应用的迅猛发展,SaaS 开发必须兼顾多租户模型的需求。传统方案通常在多租户共享数据库实例和单租户独享数据库实例之间选择,但这会在管理成本与租户隔离性上产生矛盾。MatrixOne 天然支持多租户架构,提供租户间负载隔离和独立扩展能力,同时具备统一管理功能。这种架构能够有效降低管理成本,确保数据隔离性,提升运维效率,全面满足 SaaS 应用对成本控制、管理简易度和隔离性的多重需求,使其成为 SaaS 应用的理想数据库选择。

新特性

重点新功能

  • 全文检索与 BM25 相关性检索
    全文检索功能现已全面支持,借助 BM25 算法实现精准的相关性检索,大幅提升文本数据的查询效率和准确性。
  • HDFS 数据加载
    通过优化的 load data 命令,用户可以直接从 HDFS 文件系统中加载大规模数据,满足大数据场景下的高效数据导入需求。
  • 集群间 CDC 支持
    新增的集群间 CDC 功能,实现了 MatrixOne 集群之间的数据实时同步,确保数据的一致性和高可用性,助力企业级应用的实时数据管理。
  • 基于 HNSW 的向量索引(beta)
    引入了基于 HNSW 的向量索引技术,为处理高维数据和向量相似性搜索提供了新的解决方案,拓展了数据库在人工智能和机器学习领域的应用场景。
  • 提供 Python SDK 进行混合检索
    MatrixOne Python SDK 为开发者提供便捷接口,通过高效的向量索引和全文检索,实现了向量、全文及混合检索,大幅降低了开发复杂度,助力 RAG 应用的快速构建。

其他新功能

  • 支持 select xx from xx{as of timestamp 'YYYY-MM-DD HH:MM:SS'}
  • 优化了 pitr 相关语法
  • 优化了 snapshot 相关语法

Known Issues

  • CDC 任务目前只支持表级别的同步
  • 创建 CDC 任务前需创建包含同步范围的 PITR
  • 快照和 PITR 备份无法恢复已被删除的租户数据
  • 目前 HNSW 类型的向量索引暂时不支持实时更新索引

更详细的更新日志

v24.2.0.0-v25.2.1.0