当前位置: 首页 > news >正文

CANN/hccl主机通信端口范围配置

HCCL_HOST_SOCKET_PORT_RANGE【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl功能描述当通信域的创建方式为“基于root节点信息创建”时开发者可通过此环境变量配置HCCL在Host侧使用的通信端口。该环境变量支持配置为具体的端口、端口范围或者字符串“auto”。若指定具体的端口号或端口范围规划的端口数量建议不小于单个NPU上的HCCL进程数端口号取值范围为[1,65535]且需要确保指定的端口未被其他进程占用。需要注意[1,1023]为系统保留端口应避免使用这些端口。具体的端口号与端口范围可以组合使用中间使用英文“,”分隔但逗号之间的端口号/端口范围不能存在范围重叠配置方式可参见配置示例。若指定为字符串“auto”代表HCCL使用的Host通信端口由操作系统动态分配。配置示例# 方式一配置为端口范围。 export HCCL_HOST_SOCKET_PORT_RANGE60000-60050 # 方式二具体的端口号与端口范围配合使用使用英文“,”分隔。 export HCCL_HOST_SOCKET_PORT_RANGE60000,60050-60100,60150-60160 # 方式三指定具体的端口号使用英文“,”分隔。 export HCCL_HOST_SOCKET_PORT_RANGE56000,56005,56007,56008,56100,56105,56107,56108 # 方式四操作系统动态分配端口号 export HCCL_HOST_SOCKET_PORT_RANGEauto使用约束若业务为单卡多进程场景即多个业务进程同时共用一个NPU建议配置此环境变量否则业务可能会因为端口冲突运行失败。但需要注意多进程会对资源开销、通信性能产生影响。此环境变量优先级高于HCCL_IF_BASE_PORT若配置了此环境变量HCCL在Host侧使用的通信端口以此环境变量为准。针对Atlas A2 训练系列产品/Atlas A2 推理系列产品若网络中存在MC²通算融合算子计算和通信融合的算子例如AllGatherMatmul、MatmulReduceScatter、AlltoAllAllGatherBatchMatMul等不支持配置此环境变量。支持的型号Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品针对Atlas A2 训练系列产品/Atlas A2 推理系列产品仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
http://www.gsyq.cn/news/1331341.html

相关文章:

  • 3分钟掌握Cursor Pro永久激活:免费解锁AI编程助手完整指南
  • CANN ops-blas高级特性:融合算子与激活函数后处理技术详解
  • ESP32 OLED中文显示不全?手把手教你用Platformio添加第三方u8g2_wqy字库(附完整代码)
  • 告别乱码!用DSP28035的SCI模块驱动NSI83085实现稳定485通信的完整配置流程
  • 收藏必备!小白程序员快速掌握RAG系统中重排序策略,提升大模型上下文质量
  • 从安装到创作:Redream完整入门教程,让AI绘图小白变高手
  • ops-collections多线程并发优化终极指南:如何充分利用昇腾硬件资源提升10倍性能 [特殊字符]
  • 猫抓浏览器扩展终极指南:一键捕获网页视频与M3U8流媒体的完整教程
  • HC32F4A0外设引脚自由配置全攻略:如何像STM32重映射一样灵活规划你的原理图?
  • 从飞思卡尔智能车竞赛视频拆解嵌入式系统设计:感知、控制与工程实践
  • CANN/asc-devkit: REGISTER_NONE_TILING API
  • 百度网盘Mac版SVIP破解优化方案:10分钟实现70倍下载速度提升
  • CANN/cannbot:常见陷阱
  • CANN/asc-devkit SetCurBufSize函数文档
  • Wolverine性能优化终极秘籍:从基础配置到高级调优
  • CANN/catlass LayoutTag(旧版Layout)
  • Internetarchive元数据管理实战:掌握metadata操作的最佳实践
  • 终极3DS硬件检测工具:3DSident完整使用指南
  • 用Midjourney做专业级产品摄影?这7个隐藏参数调优技巧99%的设计师还不知道
  • CPU 时间:解析文件、执行逻辑、序列化数据。
  • Rustyline最佳实践:避免常见陷阱与性能优化的终极指南
  • 基于SpringBoot的酒店客房管理系统(PMS)毕业设计
  • Wolverine Saga模式实战:实现复杂的业务流程编排
  • 从DTrace到SystemTap:一个开源内核追踪工具的“逆袭”与避坑指南
  • STM32F103C8T6驱动VEML7700环境光传感器:从I2C调试到OLED显示的完整避坑指南
  • babel-plugin-jsx 在企业级项目中的最佳实践:提升 Vue 3 开发效率的终极指南
  • 私人健身与教练预约|基于SprinBoot+vue的私人健身与教练预约管理系统(源码+数据库+文档)
  • Onyx Core API完全手册:RESTful接口详解与实战案例
  • CANN AsNumpy数组操作API
  • 初次购买Taotoken的Token Plan套餐在月度开发中的成本节省体会