当前位置: 首页 > news >正文

【大数据_数仓架构-DolphinScheduler_一次性讲解清楚如何用DolphinScheduler编排数仓任务】

一、概念逐级对照

┌────────────────────────────┬──────────────────────────────────────────────────────────────────┬─────────────────────────────────────────────┐
│ DS 概念 │ Airflow 对应 │ 说明 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Project 项目 │ ❌ 无原生概念 → 用 dags/ 子目录 + tags + (可选) RBAC Role │ Airflow 所有 DAG 在同一命名空间,靠约定分组 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Workflow 工作流 │ DAG │ 一对一 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Task Node 节点 │ Task(Operator/@task) │ 一对一 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ SUB_PROCESS 子节点 │ TaskGroup(同 DAG 内复用)/ TriggerDagRunOperator(跨 DAG 触发) │ SubDagOperator 已废弃,别用 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ DEPENDENT 节点(跨流依赖) │ ExternalTaskSensor 或 Datasets(数据感知调度,推荐) │ 这是迁移重点 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 全局/项目参数 │ Variables + Jinja 模板({{ ds }} = 业务日期) │ DS 的 $[yyyyMMdd] ≈ {{ ds_nodash }} │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Task Group 并发组 │ Pool(限并发,保护源库) │ │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 租户 Tenant │ Queue + Connection + Worker │ │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 告警/重试 │ DAG/Task 的 retries、on_failure_callback │ 写在代码里 │
└────────────────────────────┴──────────────────────────────────────────────────────────────────┴─────────────────────────────────────────────┘

ODS 接入、DWD/DWS 建模、ADS 分析是不同团队,按层建项目刚好对齐权限;
若同一个团队全包,5 个项目反而增加跨项目 DEPENDENT 的管理成本——这点要结合组织结构

–项目ODS
–工作流 ODS_交易
–工作流 ODS_履约
–工作流 ODS_会员
–项目DIM
–工作流 dim_用户
–工作流 dim_店铺
–工作流 dim_城市
–项目DWD
–工作流 dwd_交易
–工作流 dwd_履约
–工作流 dwd_会员
–项目DWS 【跨域】
–工作流 dws_用户主题
–工作流 dws_店铺主题
–工作流 dws_商品主题
–工作流 dws_履约主题
–项目ADS 【跨主题】
–工作流 ads_经营看板
–工作流 ads_会员运营类
–工作流 ads_商家服务类
–工作流 ads_履约监控类

Airflow:
Airflow 没有 Project,所以"5 个项目"变成目录分层 + 统一 tag/owner:

dags/
├── ods/
│ ├── ods_trade.py # DAG(dag_id=“ods_trade”, tags=[“ods”])
│ ├── ods_fulfillment.py
│ └── ods_member.py
├── dim/
│ ├── dim_user.py
│ ├── dim_shop.py
│ └── dim_city.py
├── dwd/
│ ├── dwd_trade.py # 依赖 ods_trade → ExternalTaskSensor / Dataset
│ ├── dwd_fulfillment.py
│ └── dwd_member.py
├── dws/
│ ├── dws_user.py # 跨域: 等 dwd_trade + dwd_member
│ ├── dws_shop.py
│ ├── dws_item.py
│ └── dws_fulfillment.py
└── ads/
├── ads_ops_board.py # 跨主题: 等多个 dws
├── ads_member_ops.py
├── ads_merchant_svc.py
└── ads_fulfillment_mon.py

"项目"边界 = 目录 + tags=[“dws”] + owner + RBAC(按 tag/folder 配权限角色,对齐 ODS/DWD/ADS 不同团队)。

http://www.gsyq.cn/news/1576256.html

相关文章:

  • 实战指南:使用SMUDebugTool解锁AMD Ryzen处理器深度调试与性能优化
  • 解锁二手iPhone激活锁:applera1n免费工具完整使用指南
  • 如何用HS2-HF_Patch彻底改造你的Honey Select 2游戏体验?
  • Mermaid Live Editor:高效智能的实时图表编辑器一站式解决方案
  • 0.1B参数ProgVLA:轻量VLA模型如何颠覆具身智能范式
  • FanControl终极指南:5步让你的Windows风扇控制更智能高效
  • ATtiny85超低功耗设计实战:从睡眠模式到系统优化,实现年续航
  • HEIF Utility:让Windows用户轻松处理iPhone照片的实用工具
  • USB安全弹出工具终极指南:告别“设备正在使用中“的烦恼
  • 武汉中央空调维修哪家好?鑫诚制冷、嘉一制冷2026本地口碑榜 - 我叫一
  • Seedance 2.0:AI视频工作流的工程化临界点
  • 2026年传统制造GEO优化行业服务商深度选型指南 - GEO优化
  • 2026年大湾区GEO优化公司实力榜单与选型指南 - GEO优化
  • 打卡第九天 - P4994 - 2026 - 6 - 22
  • 基于物理信息图神经网络的无人机群分散式连接恢复算法
  • 汽车无线充电基线功率方案:NXP MWCT100xA芯片架构与工程实践详解
  • 全芯片仿真(FCS)在嵌入式开发中的应用:以HC08外设调试为例
  • NXP MC3381x系列芯片在小型发动机ECU驱动电路中的选型与设计实战
  • 2026年 扬州中企动力社媒代运营服务榜单:内容策划/平台管理/粉丝增长等全流程代运营推荐! - 品牌发掘
  • 2026年 北京办公室地毯清洗保洁TOP5榜单:专业除菌与深度清洁的全方位推荐指南 - 品牌发掘
  • 2026年实践,合韵汤泉与周边洗浴中心实际体验差异是什么? - 资讯纵览
  • 医学图像分割后校准:TwinTrack双轨制处理标注不确定性与模型预测融合
  • 197、影像问题客诉处理体系:从用户反馈到复现、定位、修复的闭环流程
  • Ryzen AI NPU深度解析:XDNA2架构与Lemonade本地推理实战
  • 2026缙云木门定制,口碑厂家怎么选?
  • AntiMicroX 终极指南:5分钟让任何游戏手柄控制你的电脑
  • 番茄小说免费下载器:5分钟搭建个人数字图书馆的终极指南
  • DeepSeek-V3双引擎架构:MLA与MoE协同优化大模型推理效率
  • 2026年搪瓷水箱新趋势:揭秘顶尖生产厂家的创新密码 - 资讯纵览
  • Zoro框架:从氛围编码到规则驱动的软件工程实践