当前位置: 首页 > news >正文

cann/asc-devkit:GetSubBlockIdx矩阵计算接口

GetSubBlockIdx【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品 / Atlas A3 推理系列产品√Atlas A2 训练系列产品 / Atlas A2 推理系列产品√Atlas 200I/500 A2 推理产品xAtlas 推理系列产品 AI CorexAtlas 推理系列产品 Vector CorexAtlas 训练系列产品xKirin X90xKirin 9030x功能说明获取当前AIV核的ID。分离架构下一个AI Core由Cube CoreAIC和Vector CoreAIV按照一定比例1N进行组合其中N个AIV的子核ID分别为0, 1, ..., N-1。Matmul::GetSubBlockIdx()与基础API接口AscendC::GetSubBlockIdx().md)的区别在于Matmul::GetSubBlockIdx()用于获取当前AIV核在当前AI Core分组中的ID而AscendC::GetSubBlockIdx()获取的是AIV核在所有AI Core分组中的逻辑ID。例如有10组AI CoreAIC与AIV的比例为1:2共20个AIV核。调用Matmul::GetSubBlockIdx()时20个AIV的获取结果依次为0, 1, 0, 1, 0, 1, ..., 0, 1。调用AscendC::GetSubBlockIdx()时20个AIV的获取结果依次为0, 1, 2, 3, 4, 5, ..., 18, 19。函数原型__aicore__ inline uint8_t GetSubBlockIdx()参数说明无返回值说明当前AIV核的ID。约束说明该接口仅支持在分离架构下使用否则返回随机值。在分离架构中AIV核的ID会在REGIST_MATMUL_OBJ()接口内部自动初始化和赋值。因此需要在调用REGIST_MATMUL_OBJ()接口之后再调用本接口以获取正确的ID。若在算子程序中调用SetSubBlockIdx()后 GetSubBlockIdx()接口将返回由SetSubBlockIdx接口设置的ID值。调用示例typedef AscendC::MatmulTypeAscendC::TPosition::GM, CubeFormat::ND, half aType; typedef AscendC::MatmulTypeAscendC::TPosition::GM, CubeFormat::ND, half bType; typedef AscendC::MatmulTypeAscendC::TPosition::GM, CubeFormat::ND, float cType; typedef AscendC::MatmulTypeAscendC::TPosition::GM, CubeFormat::ND, float biasType; AscendC::MatmulaType, bType, cType, biasType, CFG_NORM mm; REGIST_MATMUL_OBJ(pipe, GetSysWorkSpacePtr(), mm, tiling); mm.GetSubBlockIdx(); // 获取子核ID【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
http://www.gsyq.cn/news/1330962.html

相关文章:

  • BongoCat终极指南:5分钟打造你的跨平台互动桌宠
  • 2025年Unity逆向工程指南:使用Il2CppDumper轻松破解IL2CPP保护
  • 教育网资产批量识别工具:基于IP归属与关键字匹配的自动化筛选方案
  • 别再混淆了!一文搞懂华为云Stack里的FusionStorage、OceanStor Pacific与存储选型
  • 深度解析:在Windows Hyper-V上高效运行macOS的技术实现方案
  • 2026年内蒙古水质检测公司哪家好?一文读懂废气检测、环境检测、除甲醛和除四害服务怎么选 - 深度智识库
  • CANN/asc-devkit任务间同步API
  • 终极指南:如何高效使用ncmdump解密网易云音乐加密文件
  • 昇腾C矩阵量化向量接口
  • Ascend C矩阵乘法SetOrgShape接口
  • 杰和主板硬件级显示旋转技术:一体机竖屏适配原理与部署指南
  • AP微积分学习指南及相关书籍
  • 《超简单的微积分》、《简单微积分》阅读指北
  • 2026年四川自动售卖机运营市场品牌商业参考:技术与市场双维度评估 - 深度智识库
  • Perplexity习语查询功能突然失效?紧急修复手册:5分钟定位LLM微调偏差、缓存污染与地域策略冲突
  • 如何在Windows11中自定义快捷方式?提升操作效率的技巧
  • 什么是备忘录模式?一文详解
  • 哪个牌子的 pos 刷卡机靠谱?个人自用机正规机构扫码刷卡避坑指南 - 资讯速览
  • 告别Eclipse插件!在Maven项目中用antlr4-maven-plugin自动生成解析器代码(附完整pom.xml配置)
  • NetCoMi微生物网络分析:从数据到洞察的完整解决方案
  • 告别手动录入!用JavaScript+SQL实现泛微E9明细表数据自动填充(附完整代码)
  • 从AIGC到AIGS:Java团队的AI落地之路
  • PhantomJS+jsEncrypter插件:手把手教你打造BurpSuite专属密码加密爆破模块
  • FunASR与HuggingFace无缝对接:5分钟搞定跨平台语音识别部署
  • Linux more 命令详解:从基础分页到高级文本查看技巧
  • MATLAB文件选择对话框uigetfile()保姆级教程:从单文件到多选的完整配置流程
  • Sora 2时间轴与Blender NLA编辑器深度对齐指南(2024.06.12 Blender官方补丁前最后兼容方案)
  • FunASR工业级应用案例:金融客服语音分析系统
  • 医疗器械厂家可以定制中频治疗仪款式吗 - 舒雯文化
  • 三星固件下载终极指南:Bifrost跨平台工具免费获取官方系统