导读2025年1月15日,云器科技举行了云器Lakehouse产品开放注册发布会。这标志着这家专注于数据基础设施的科技公司,正式向全球用户开放体验其创新的云湖仓产品。
全文目录:
1. 云器Lakehouse开放注册
2. 统一数据、统一引擎、统一体验
3. 发布数据智能产品功能
4. 云器提出“通用增量计算”的首个行业标准-SPOT
5. 通用增量计算的定义
6. 通用增量计算的SPOT技术标准
7. 体验开箱即用的云湖仓
01
云器Lakehouse开放注册
云器科技CEO喻思成宣布云器Lakehouse正式开放注册,同时宣布了产品已经完成了在全球七大主流云平台的适配,并且已经在大部分云平台开服。这意味着云器提供了统一的数据底座,让企业可以在异构云环境中获得一致的数据平台体验。
![](http://k.sinaimg.cn/n/sinakd20250117s/36/w1080h556/20250117/44ca-67c8b1457d45dfae70d4a324c04c340f.png/w700d1q75cms.jpg)
喻思成表示,十年前“云”让计算像水电一样触手可及,今天云器的开放注册:旨在让数据和AI更普惠,像煤气炉一样触手可及——不需要专业团队,不需要开源自建。就是这次云器开放注册的意义,开放注册即所谓GA—— General Available,就是“你只管写SQL,其它的交给云器。”
![](http://k.sinaimg.cn/n/sinakd20250117s/82/w1080h602/20250117/c14f-0fc622970821b22a4881034d17901822.png/w700d1q75cms.jpg)
云器Lakehouse产品采用了Single-Engine和通用增量计算技术。据云器科技CTO关涛介绍,通过深度优化的全Native C++实现的向量化引擎,并得益于软件、硬件技术、网络技术的突破,Lakehouse产品表现出多面且优异的性能,以在批处理领域为例,云器Lakehouse在标准TPC-DS 10TB测试中展现出比开源Spark快10倍的性能优势。
关涛在发布会上分享了引擎性能突破背后的技术改进项,并逐条解析了性能提升的关键因素:自研的基于Cascades模型的CBO优化器带来2倍性能提升,Native引擎实现提供3倍性能提升,直连调度方案实现1.3倍提升,以及默认开启的自动缓存带来1.3倍性能提升。此外,云器Lakehouse还实现了MPP和BSP两种调度模式的融合架构,为不同场景提供最优性能。
![](http://k.sinaimg.cn/n/sinakd20250117s/73/w1080h593/20250117/6c50-99f51566eb773e820ac30ce6d20be38c.png/w700d1q75cms.jpg)
02
统一数据、统一引擎、统一体验
在产品能力方面,云器科技Lakehouse产品总监曲宁分享了“统一数据、统一引擎、统一体验”的设计理念,并详细分享数据平台的架构设计。曲宁详细介绍了平台的四大核心能力:
全面Serverless化的计算服务,支持秒级弹性伸缩
基于增量计算实现统一计算模式,可实现ETL链路的大幅简化
Data+AI融合分析能力,支持对企业所有数据资产的统一管理
一体化的开发治理平台Lakehouse Studio,提供数据团队开发运维数据的全家桶套件
03
发布数据智能产品功能
值得关注的是,云器科技在此次发布会上还重点展示了数据与AI的结合能力。云器科技AI产品总监孟硕表示,企业已普遍认识到构建AI就绪的知识库系统是当前AI投资的最佳切入点。为提升企业数据与AI融合能力,云器科技全面升级数据平台,新增RAG就绪层,整合向量检索、倒排索引及语义引擎等关键功能。基于升级后的平台架构,推出两款创新应用产品:智能对话式数据分析工具Lakehouse DataGPT,和智能开发助手Lakehouse Copilot,两款重要产品功能,致力于让企业数据资产更易于被AI利用和访问。
Lakehouse DataGPT基于云器统一的数据底座,在对话式BI分析场景中,可以准确理解复杂的业务语境,将用户的自然语言准确转化为数据查询,并提供清晰的推理过程展示,确保分析结果的可信度。这些创新有效降低了企业构建AI应用的技术门槛,加速了企业数据智能化转型。
04
云器提出“通用增量计算”的首个行业标准-SPOT
此次发布会,云器展现的一大亮点是增量计算技术——既通过只计算数据变化部分,提升计算效能,保持高性能的同时显著降低计算成本。关涛谈到增量计算技术的巨大潜力,并提出“增量计算将成为继批处理、流计算、交互分析之后的第四代主流计算模式。”特别的,关涛强调了云器在增量计算技术前沿的实践,提出“通用增量计算”概念,旨在让通用计算不再只是于狭窄场景下具备优化意义,而是在更普遍的场景实装,甚至包括对UDF的支持。
05
通用增量计算的定义
作为业界首个提出并落地通用增量计算(Generic Incremental Computing, GIC)技术的企业,云器科技CTO关涛在发布会上系统性地阐述了这一创新技术。通用增量计算是一种同时面向高性能和低延迟优化的新计算模式,当上游数据持续变更时,系统只计算数据变化的部分并与之前的查询结果合并,从而以最小的计算成本快速生成最新结果。不同于传统流计算中的增量计算,GIC采用统一的计算逻辑,可以同时支持批处理、流处理和交互式分析三种场景。
![](http://k.sinaimg.cn/n/sinakd20250117s/780/w1080h500/20250117/e343-3adce0b108356c32768b5e50462804f4.png/w700d1q75cms.jpg)
06
通用增量计算的SPOT技术标准
关涛在发布会上公布了行业首个通用增量计算的技术标准——SPOT技术标准,旨在促进交流推动行业技术创新。
![](http://k.sinaimg.cn/n/sinakd20250117s/73/w1080h593/20250117/08bb-4018bb08b628a2e2d2d2c8be047418d6.png/w700d1q75cms.jpg)
SPOT标准:
S - Standard SQL with Full Synatx/Semantics
P - Performance
O - Open Format
T - Trande-off seamlessly between T+0 and T+1
CTO关涛分享了过去几年云器实现通用增量计算技术的经验和实现路径,预告即将在未来向行业公开更多重磅的客户案例。并表示未来几个月内将发布《通用增量计算技术白皮书》,以推动这项技术的发展。
07
体验开箱即用的云湖仓
笔者在会后立刻尝试注册试用云器Lakehouse产品,在不到5分钟的时间就完成了从产品的注册到运行测试SQL的完整链路;除了能够快速分析数据,笔者也尝试了云器Lakehouse的数据导入、运维、管理功能,直观的感受是,它不仅提供一个数据处理分析的引擎,也让我获得了一整套大数据分析平台的组件能力。这是原来在互联网大厂和业内头部数据型企业才能配备的数据处理和管理能力,现在通过注册账号就能获得。
—— 数据技术普惠正在发生。
观看本次发布会的回放,可以访问云器科技官网https://www.yunqi.tech/open2025
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
财经自媒体联盟
![](http://n.sinaimg.cn/finance/pc/cj/kandian/img/article_pic05.png)
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有