当前位置: 首页 > news >正文

联蔚盘云-ADF的数据采集方案-Azure Storage数据源

方案架构

身份认证管理

身份验证方式

适用场景

前置要求/规范

Microsoft Entra ID - Managed identity

同租户下的Blob数据采集

1.ADF与Storage位于同租户下

2.ADF已启用并分配Managed identity

3.Blob已授权对应Managed identity所需访问权限

4.完成Blob的Managed private endpoint部署

Microsoft Entra ID - ServicePrincipal

同一Azure云环境下

1.ServicePrincipal不支持跨云授权访问,例如Azure CN下不支持配置使用Azure Global的ServicePrincipal

2.Blob已授权对应标识访问权限

3.凭据托管至Azure Key vault

4.Azure Key vault的Link已经建立

5.完成Blob的Managed private endpoint部署 6.Blob未启用软删除

共享访问签名 (SAS)

1.临时授权访问

2.跨云Blob数据采集

1.Blob已授权对应Token的访问权限

2.SAS URI已托管至Azure Key vault

4.Azure Key vault的Link已经建立

Storage Account AccessKey

独享存储账户(权限范围过大,不推荐

1.AccessKey已托管至Azure Key vault

2.Azure Key vault的Link已经建立

Anonymous

无身份验证(不推荐

不推荐

最佳实践说明

#场景说明

同一Azure云环境或同租户下:优先使用Microsoft Entra ID认证进行统一的身份验证管理,次之选用共享访问签名 (SAS) ;

跨云Blob数据采集:不支持使用Microsoft Entra ID认证,此时优先选用共享访问签名 (SAS) ;

不推荐场景:Storage Account AccessKey和Anonymous访问不推荐,谨慎使用;

#规范要求

签发路径:必须使用HTTPS等受信任的签发途径;

周期性轮换:所有密钥必须妥善保管,并根据不同的方式定义密钥生命周期管理规范;

撤销:所有授权必须定义紧急撤销预案,如发生泄露需及时撤销;

网络:支持private endpoint的应优先使用private endpoint;

网络管理

IR类型

要求/规范

说明

Azure 托管运行时

启用托管虚拟网络

托管虚拟网络仅在与数据工厂区域相同的区域中受支持

自托管运行时

自托管运行时应配置使用Private Endpoint接入

Private Endpoint不支持自承载 IR 进行的交互式创作(如测试连接、浏览文件夹列表和表列表、获取架构和预览数据)通过专用链接进行

Azure-SSIS IR

Azure-SSIS IR应使用虚拟网络集成并进行网络权限管控

数据安全

分类

要求/规范

备注

网络安全边界

1.Azure-SSIS IR应使用虚拟网络集成并进行网络权限管控

2.Azure集成运行时应启用托管虚拟网络

3.优先使用托管Private Endpoint

4.自承载运行时应配置使用ADF Private Endpoint

虚拟网络集成能够优化网络链路的效率和网络边界

权限管理

1.优先使用Microsoft Entra ID认证

2.如使用本地身份验证的密钥需加密存储并周期性轮换

3.最小特权原则

1.web端管理:资源组层级”数据工厂参与者“

2.powershell&sdk管理:资源层级”参与者“

3.细化的权限分配:自定义角色(权限组合)Microsoft.DataFactory/factories 系列 Microsoft.Resources/deployments/ 权限

加密

1.启用传输加密:HTTPS、TLS 1.2及以上

2.启用存储加密:Azure托管密钥、自托管密钥

密钥管理

1.所有密钥需使用受信任的密钥管理

2.密钥需周期性轮转

例如 Azure Key vault

数据保护

1.启用Azure Policy进行数据采集出入站数据源管理

2.优先使用源代码管理保护源代码数据和资源管理器模板

3.实时模式管理下需要周期性导出资源管理器模板文件和参数

资源管理器模板不会包含任何机密信息

运维监视

分类

推荐监视项

说明

Monitor

##Jobs

1.PipelineFailedRuns(包含Pipeline实例分类):运行失败的Pipeline数量

2.ActivityFailedRuns(包含Activity实例分类):运行失败的Activity数量

3.TriggerFailedRuns(包含Trigger实例分类):运行失败的Trigger数量

##Managed Vnet Azure IR

1.MVNetIRPipelineCapacityUtilization(包含IR实例分类):托管网络Azure IR的Pipeline容量使用率

2.MVNetIRPipelineWaitingQueueLength(包含IR实例分类):托管网络Azure IR的Pipeline队列长度

3.MVNetIRExternalCapacityUtilization(包含IR实例分类):托管网络Azure IR的外部Pipeline容量使用率

4.MVNetIRExternalWaitingQueueLength(包含IR实例分类):托管网络Azure IR的外部Pipeline队列长度

1.监视对应任务的运行状况

2.监视IR资源使用情况

Log

Pipeline、Trigger、Sandbox:日志记录Pipeline、Trigger、Sandbox对应的日志输出

用于Audit运行事件并为周期性Review提供重要的数据支撑

说明

Azure CN不支持Airflow IR

自承载运行时可使用instance自身的监控数据



联蔚盘云——国内领先的多云管理服务提供商

联蔚盘云秉持“帮助客户创造更多价值” 理念,基于深厚的行业经验和客户洞察,以技术创新为本,持续耕耘于云管理服务,为众多中大型行业客户提供基于自主研发基础上的FinOps 云成本优化(订阅制)、AI 大模型,平台工程全生命周期管理、信息安全- 等保、云安全、AI 安全、合规咨询、MSP- 云迁移、云运维、云灾备一站式服务、数据等多云管理全生命周期领先产品及解决方案,帮助客户降本提效、通过云能力提升驱动业务,迎接瞬息万变的挑战,赋能企业数字化转型,拥有云、SRE、安全、项目管理等各领域的专业认证,连续多年获得Gartner 等市场权威机构认可,是微软、阿里云和AWS 等公有云头部合作伙伴。

联蔚盘云20 多年成功服务了100+ 世界及中国500 强客户,基于深厚的行业经验和客户洞察,在零售、消费品、汽车、制造、房地产、金融等行业帮助客户应对数字化时代瞬息万变的商业挑战,创造共创共赢的合作模式,让多云管理更简单。


http://www.gsyq.cn/news/182770.html

相关文章:

  • Pyenv与Miniconda共用方案:Python3.10灵活管理多个AI项目
  • 利用Miniconda-Python3.10镜像在云服务器上快速部署PyTorch训练任务
  • 清华镜像使用方法:快速拉取Miniconda-Python3.10 Docker镜像
  • HTML Meta标签设置:提高Miniconda-Python3.10相关内容搜索可见性
  • 非遗万象图:自动化采集与多源数据融合实战
  • 清华镜像源列表更新:Miniconda-Python3.10配置中科大、阿里云备选
  • Pyenv rehash重新索引命令:确保Miniconda-Python3.10工具可用
  • Linux用户权限设置:Miniconda-Python3.10多用户共享环境配置
  • 2025年如何选择优质的企业加密软件与数据防泄露系统服务商? - 睿易优选
  • AI 得流量者得天下?
  • PostgreSQL在psql中执行INSERT语句时不显示插入条数信息的方法
  • Mobile GUI Agent相关学习资料整理
  • 《代码大全2》前三分之二读后感
  • 人工智能之核心基础 机器学习 第二章 监督学习
  • GitHub Actions集成Miniconda-Python3.10实现CI/CD自动化测试
  • 绍兴企业如何选择靠谱的AI全网营销系统?超越功能清单的深度洞察
  • 【拯救HMI】HMI “卡成 PPT” 怎么办?—— 性能优化指南
  • 运势运程算命程序源码公开:PHP无依赖版开箱体验
  • 不同地区研发中心的角色如何进行定位
  • 1994-2024年上市公司气候变化减缓专利技术专利数量数据(附原始专利)
  • Token计费模型设计:Miniconda-Python3.10支撑高并发API服务
  • 靠谱的应急事故池清淤压滤干化施工哪个好
  • 大模型学习全流程:从入门到项目实战,附免费学习资源_大模型零基础教程(非常详细),大模型入门到精通
  • Linux系统AI开发入门:Miniconda-Python3.10带你迈出第一步
  • 人形机器人肢体通信与驱动的最佳技术方案
  • Markdown转技术博客自动化流程:基于Miniconda-Python3.10的大规模内容生成
  • Alexa AI在Interspeech会议组织技术专题研讨会
  • 【拯救HMI】工业 HMI 交互逻辑这么搞!工程师夸爆
  • 2025国内最新化妆品贴牌加工企业top6榜单公布!广东、广州等地区行业优质公司专业解析及选择指南,全链路赋能品牌高效成长 - 全局中转站
  • ARM 汇编指令:LDM