当前位置: 首页 > news >正文

CANN/asc-devkit Conv3DBackpropFilter Tiling使用说明

Conv3DBackpropFilter Tiling使用说明

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

Ascend C提供一组Conv3DBackpropFilter Tiling API,方便用户获取Conv3DBackpropFilter Kernel计算时所需的Tiling参数。用户只需要传入Input/GradOutput/GradWeight的Position位置、Format格式和DType数据类型及相关参数等信息,调用API接口,即可获取Init中TConv3DBpFilterTiling结构体中的相关参数。

Conv3DBackpropFilter Tiling API提供一个GetTiling接口获取Tiling参数,获取Tiling参数的流程如下:

  1. 创建一个单核Tiling对象。
  2. 设置Input、GradOutput、GradWeight的参数类型信息以及Shape信息,如果存在Padding、Stride参数,通过SetPadding、SetStride接口设置。
  3. 调用GetTiling接口,获取Tiling信息。

使用Conv3DBackpropFilter Tiling接口获取Tiling参数的样例如下:

#include "tiling/conv_backprop/conv3d_bp_filter_tiling.h" optiling::Conv3DBackpropFilterTilingData tilingData; auto ascendcPlatform = platform_ascendc::PlatformAscendCManager::GetInstance(); ConvBackpropApi::Conv3dBpFilterTiling conv3dBpDwTiling(*ascendcPlatform); conv3dBpDwTiling.SetWeightType( ConvCommonApi::TPosition::CO1, ConvCommonApi::ConvFormat::FRACTAL_Z_3D, ConvCommonApi::ConvDtype::FLOAT32); conv3dBpDwTiling.SetInputType( ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, ConvCommonApi::ConvDtype::FLOAT16); conv3dBpDwTiling.SetGradOutputType( ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, ConvCommonApi::ConvDtype::FLOAT16); conv3dBpDwTiling.SetGradOutputShape(n, c, d, h, w); conv3dBpDwTiling.SetInputShape(n, c, d, h, w); conv3dBpDwTiling.SetWeightShape(cout, cin, d, h, w); conv3dBpDwTiling.SetPadding(padFront, padBack, padUp, padDown, padLeft, padRight); conv3dBpDwTiling.SetStride(strideD, strideH, strideW); conv3dBpDwTiling.SetDilation(dilationD, dilationH, dilationW); int ret = conv3dBpDwTiling.GetTiling(tilingData); // 如果ret = -1,获取tiling结果失败

需要包含的头文件

#include "lib/conv_backprop/conv3d_bp_filter_tiling.h"

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1632195.html

相关文章:

  • 如何用VisProg解决四大视觉任务?GQA/NLVR/图像编辑/目标标记实战教程
  • Packtpub-crawler通知系统详解:邮件、IFTTT、Pushover多平台提醒设置指南
  • CANN/cannbot-skills:环境快照
  • Obsidian-zola社区指南:如何贡献代码和参与开发
  • CANN/asc-devkit SIMD数据加载API
  • SENet-Tensorflow实战教程:在CIFAR-10数据集上训练ResNeXt模型
  • Instatic与AI写作:内容生成与优化工具集成指南
  • 如何快速下载E-Hentai画廊:E-Hentai Downloader完整使用指南
  • nwpu-cram人工智能算法:遗传算法与应用完整指南
  • CANN/GE FlowMsg类API参考
  • CANN/HCCL文档总览
  • TVA:具身智能的动力引擎与能力底座(13)
  • 九大网盘直链解析工具:免费高速下载完全指南
  • OCR对抗攻击实战:基于水印的身份证识别攻击,成功率超90%(附PyTorch代码)
  • 如何参与MNIST对抗性攻击挑战:从零开始的完整教程
  • NixOps4状态管理深度解析:从JSON模式到持久化策略
  • nwpu-cram计算机组成原理实验:Cache设计完全指南
  • ZFS-inplace-rebalancing调试技巧:解决常见问题的完整清单
  • Offix深度解析:革命性GraphQL离线客户端与服务器解决方案
  • 参数优化文档介绍
  • 如何快速掌握SQL日期时间函数:SQL Ultimate Course时间数据处理完整指南
  • 终极音乐解析指南:4个PHP文件搞定四大平台音乐地址
  • SQL子查询完全指南:SQL Ultimate Course查询嵌套技巧
  • InVesalius多平台部署指南:在Linux、Windows和MacOS上高效运行医学影像软件
  • p5数据可视化实战:用创意编程呈现你的数据故事
  • 西工大软院大一计算机基础课程设计:nwpu-cram终极指南 [特殊字符]
  • 如何快速上手Cosmos-Transfer1-DiffusionRenderer:5分钟安装与配置教程
  • IpaDownloadTool最佳实践:企业应用分发的合规使用指南
  • 如何快速上手gh_mirrors/yo/yolo_research:3步完成你的第一个目标检测模型训练
  • 如何快速使用ZFS-inplace-rebalancing实现ZFS池数据均衡