news 2026/4/26 13:43:53

ODS,DWD,DWS的区别

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ODS,DWD,DWS的区别

ODS、DWD、DWS 是数据仓库最常见的三层,每一层都有明确的职责与数据形态,区别主要体现在“数据内容、加工深度、使用场景”三个维度:

表格

复制

层级全称数据内容加工深度典型使用场景存储周期
ODSOperational Data Store各业务系统原样抽取的数据,几乎不做转换,保持“原貌”只做最简单的格式对齐、字段裁剪,不做业务逻辑清洗①准实时查询 ②源系统故障时回溯 ③给DWD提供原始数据几天~几周,按需滚动清理
DWDData Warehouse Detail以业务过程为中心的“干净”明细数据,统一命名、统一码值、去重、去异常完成数据清洗、规范化、关联维表,保留最细粒度①复杂分析/挖掘 ②供DWS汇总 ③跨主题明细查询几月~几年,长期保留
DWSData Warehouse Summary面向分析主题的轻度汇总表(宽表),指标+维度预聚合按时间、地域、客户等维度做GROUP BY、窗口函数、轻度汇总①报表、Dashboard ②OLAP交互分析 ③数据服务接口几月~几年,随业务需求调整

一句话记忆:
ODS 是“生数据”,DWD 是“洗干净的明细”,DWS 是“直接拿来出报表的汇总”。

三者流转关系:
业务系统 → ODS(原样落地) → DWD(清洗整合) → DWS(汇总宽表) → 报表/接口/数据产品

————————————————————————————————————

在数据仓库/数据中台体系里,除了 ODS、DWD、DWS 这三层“标配”,还经常会遇到以下“兄弟姐妹”概念,一起记会更完整:

  1. DIM(Dimension)
    统一、共享的维表层,存放所有缓慢变化维度(客户、商品、组织、渠道、时间等)。DWD、DWS 都通过维表做关联,保证口径一致。

  2. DWT(Data Warehouse Topic)
    主题宽表层,也叫“中度汇总”或“宽表集市”。把多个业务过程的 DWD 明细按分析主题(用户、商品、订单)预关联、预聚合,形成“一行到底”的大宽表,供数据挖掘、机器学习、实时接口直接调用,介于 DWS 与 ADS 之间。

  3. ADS(Application Data Service / App)
    应用服务层,面向具体场景的高度汇总/二次加工结果,如“昨日 GMV”“618 实时大屏指标”。通常存储在 OLAP、KV、MySQL、ClickHouse 等引擎里,直接对接报表、大屏、API。

  4. STG(Staging)
    临时缓冲层,位于 ODS 之前,只做“原系统→数仓”的一次性落地,不对外开放,出错可快速重跑。部分企业把 STG 与 ODS 合并,也有单独拆分出来做“日增量拉链”。

  5. DWM(Data Warehouse Middle)
    部分公司把“DWT + DWS”统称 DWM,表示“中间汇总层”,命名无统一标准,理解成“介于明细与高度汇总之间的任何中间表”即可。

  6. DM(Data Mart)
    数据集市,面向特定业务部门(财务、供应链、人力)的“小仓库”,可由 DWS/ADS 再加工,也可独立建模。强调“部门私有”,而 DW 是企业级共享。

  7. TMP / MID / TEMP
    临时层,存放中间结果、拉链临时表、调度过程表,生命周期短,通常设定 TTL 自动清理。

  8. 缓慢变化维(SCD)
    维表随时间变化但不想覆盖历史时的处理策略,分 SCD1(覆盖)、SCD2(新增行)、SCD3(新增列)等,是 DIM 层建模核心技能。

  9. 事实表类型

    • 事务事实表(最常用,一行一业务)

    • 周期快照事实表(如账户日余额)

    • 累积快照事实表(如订单从下单到签收全流程)
      它们都属于 DWD 层。

  10. 维度建模 vs 范式建模
    维度建模(星型/雪花)强调“易用、查询快”,多用于 DWD/DWS;范式建模(3NF)强调“一致性、更新快”,常用于 ODS/EDW。现代 Lambda/Kappa 架构里两种常混合使用。

把以上概念与 ODS→DWD→DWS 放在一起,就构成了企业级数据仓库/数据中台的“全家福”。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/21 22:24:18

如何实现无代码自动化测试?零基础入门

为什么无代码自动化测试是测试从业者的必备技能?在当今快速迭代的软件开发环境中,自动化测试已成为提升效率、保证质量的关键。传统自动化测试通常需要编程技能,这给许多测试从业者设置了门槛。无代码自动化测试(No-Code Automati…

作者头像 李华
网站建设 2026/4/22 13:58:17

‌自动驾驶感知系统仿真测试:软件测试从业者的实践指南

感知系统在自动驾驶中的关键作用‌ 自动驾驶技术正飞速发展,而感知系统(包括摄像头、雷达、LiDAR等传感器)是车辆“眼睛”,负责环境识别与决策。真实道路测试成本高、风险大,仿真测试成为软件测试从业者的核心工具。它…

作者头像 李华
网站建设 2026/4/19 15:13:28

Java毕设选题推荐:基于spring boot的高校宿舍管理系统设计基于springboot的高校学生宿舍管理系统设计【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/20 16:52:59

数字人民币跨境支付试点启动,稳定币会被取代吗?

一、政策重磅:八部门联合发文,数字人民币出海迈出关键一步2025年12月24日,中国人民银行、国家发展改革委、财政部、交通运输部、商务部、金融监管总局、中国证监会、国家外汇局等八部门联合印发《关于金融支持加快西部陆海新通道建设的意见》…

作者头像 李华
网站建设 2026/4/23 21:39:33

MBA必看!9个降AI率工具推荐,高效避坑指南

MBA必看!9个降AI率工具推荐,高效避坑指南 AI降重工具:MBA论文的智能护航者 在当前学术写作中,随着AI技术的广泛应用,论文中的AIGC率问题逐渐成为MBA学生需要重点关注的难点。许多同学在使用AI生成内容时,往…

作者头像 李华
网站建设 2026/4/23 18:47:04

互联网医院系统|禾高互联网医院|互联网医院成品

随着医疗健康服务的数字化进程加速,互联网医院系统已演变为重构医疗资源配置、优化诊疗流程、重塑患者体验的战略性基础设施。其本质并非线下医疗的简单线上化,而是以患者为中心、以数据为驱动、以安全和合规为基石的新型医疗服务模式的综合载体。1、患者…

作者头像 李华