当前位置: 首页 > news >正文

CANN/asc-devkit SetGradOutput卷积反向梯度设置

SetGradOutput

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

  • Ascend 950PR/Ascend 950DT:不支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
  • Atlas 200I/500 A2 推理产品:不支持
  • Atlas 推理系列产品AI Core:不支持
  • Atlas 推理系列产品Vector Core:不支持
  • Atlas 训练系列产品:不支持

功能说明

设置卷积反向计算的输入矩阵GradOutput。

函数原型

__aicore__ inline void SetGradOutput(const AscendC::GlobalTensor<SrcT>& gradOutput)

参数说明

表1接口参数说明

参数名输入/输出描述
gradOutput输入GradOutput矩阵在Global Memory上的首地址。类型为GlobalTensor。SrcT表示GradOutput矩阵的数据类型,当前支持的数据类型为:half、bfloat16_t。

返回值说明

约束说明

调用示例

ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_; // 设置GradOutput中GlobalTensor的地址 GlobalTensor<gradOutputType> gradOutputGm_; gradOutputGm_.SetGlobalBuffer((__gm__ gradOutputType*)gradOutput); gradInput_.SetGradOutput(gradOutputGm_);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1632012.html

相关文章:

  • Frozen扩展开发指南:如何为Frozen添加自定义数据格式支持
  • Heya配置完全指南:从基础设置到高级优化的10个技巧
  • 如何快速入门httpcache:5分钟实现Go HTTP客户端缓存
  • Python依赖注入终极指南:python-inject常见问题解答从入门到精通
  • ReScript genType 在 CI/CD 中的集成:自动化类型生成与验证流程
  • 如何用WeChatMsg构建个人数据主权:微信聊天记录永久保存与智能分析完整指南
  • 终极指南:如何用Video2X将模糊视频智能修复到4K高清画质
  • OpenTracing-Python异步编程支持:asyncio、gevent和Tornado集成指南
  • Mongood地理位置索引可视化:地图预览功能让空间数据一目了然
  • Colfer性能优化实践:让你的数据传输速度提升300%的秘诀
  • 如何使用gh-markdown-preview实现Markdown文件的实时预览与编辑:GitHub CLI用户的终极指南
  • python-inject未来展望:路线图与社区贡献指南
  • d3-annotation性能优化:提升SVG注释渲染效率的7个技巧
  • Gloom的下载管理器实现:Android文件下载与存储管理终极指南
  • Open-Source-Prompt-Library:新手必学的PRD创建模板完全教程
  • status-go安全架构解析:加密通信、密钥管理与安全审计指南
  • Qwen3.6-27B选型指南:破解30B甜点位的工程决策逻辑
  • 深入理解Vulkan-Zig的调度表与包装器:高级Vulkan API集成指南
  • Colfer多语言支持详解:C、Java、Go与ECMAScript实战教程
  • AI Agent平台架构设计:从任务编排到系统治理的工程实践
  • 如何用Video2X轻松实现4K视频超分辨率与智能插帧
  • LiveViewJS文件上传终极教程:支持拖拽和图片预览的完整实现
  • Video2X:AI视频增强神器,让老旧视频重获新生
  • 社区指南:如何参与Orgmode插件的讨论、报告问题和贡献代码
  • CANN架构下LeakyReLU算子的硬件加速与GAN优化实践
  • 终极指南:如何用BilibiliDown免费批量下载B站视频
  • 无需环境模型的强化学习:蒙特卡洛与时序差分算法详解及21点游戏实践
  • Mhook在游戏修改中的应用:内存读写与函数拦截完整指南
  • Project64终极指南:免费N64模拟器的完整使用教程
  • 从零开始扩展VisProg功能:手把手教你添加自定义视觉推理模块(附代码)