当前位置: 首页 > news >正文

CANN/asc-devkit CumSum临时空间接口

GetCumSumMaxMinTmpSize【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit功能说明kernel侧CumSum接口的计算需要开发者预留/申请临时空间本接口用于在host侧获取预留/申请的最大和最小临时空间大小开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。为保证功能正确预留/申请的临时空间大小不能小于最小临时空间大小。在最小临时空间-最大临时空间范围内随着临时空间增大kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能开发者可以根据实际的内存使用情况进行空间预留/申请。函数原型void GetCumSumMaxMinTmpSize(const ge::Shape srcShape, const uint32_t typeSize, const bool isLastAxis, const bool isReuseSource, uint32_t maxValue, uint32_t minValue)参数说明表 1参数说明参数名输入/输出描述srcShape输入输入的shape信息。typeSize输入输入的数据类型大小单位为字节。比如输入的数据类型为half此处应传入2。isReuseSource输入是否复用源操作数输入的空间。isLastAxis输入定义是first轴处理还是last轴处理。maxValue输出Cumsum接口能完成计算所需的最大临时空间大小超出该值的空间不会被该接口使用。请注意maxValue仅作为参考值有可能大于Unified Buffer剩余空间的大小该场景下开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。minValue输出Cumsum接口能完成计算所需最小临时空间大小。为保证功能正确接口计算时预留/申请的临时空间不能小于该数值。返回值说明无约束说明操作数地址对齐要求请参见通用地址对齐约束。输入input只支持二维结构。调用示例// 输入shape为32*32的矩阵算子输入的数据类型为halfisLastAxis传入默认值trueisReuseSource传入默认值false uint32_t firstDim 32; uint32_t lastDim 32; std::vectorint64_t srcShapeDims {firstDim, lastDim}; auto srcShape ge::Shape(srcShapeDims); uint32_t maxValue 0; uint32_t minValue 0; AscendC::GetCumSumMaxMinTmpSize(srcShape, 2, true, false, maxValue, minValue);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
http://www.gsyq.cn/news/1331127.html

相关文章:

  • 在Windows Hyper-V上运行macOS虚拟机的完整指南
  • 智能视频去重神器Vidupe:3步彻底清理重复视频,释放存储空间
  • SSH 本地端口转发 LocalForward 绑定 127.0.0.1 失败怎么回事?
  • 如何在Windows上打造流畅的B站观看体验:BiliBili-UWP完整指南
  • 2027中西医结合内科学网课红黑榜:在职医生深度测评 - 医考机构品牌测评专家
  • SEO优化?你的网站要是还没学会这些方法就亏大了
  • 为ClaudeCode配置Taotoken作为备用API源防止服务中断
  • 光合仪/光合作用测定仪/便携式光合仪供应商哪家好?精选优质品牌供您选择 - 品牌推荐大师
  • 猫抓插件完整指南:一站式解决网页资源下载难题
  • 一键解决Windows软件运行库问题:VisualCppRedist AIO完整指南
  • 告别卡顿与干扰:用Win11Debloat给你的Windows来一次彻底“数字大扫除“
  • 你的SPWM正弦波失真了?STM32逆变电路调试中常见的5个坑与解决思路
  • 如何3分钟为你的游戏安装BepInEx:解锁无限模组潜力的终极指南
  • CANN/asc-devkit LogicalAnds临时空间接口
  • PHP主流框架
  • 全域数学公理:基于32维超复数与易经卦爻的宇宙大一统理论(整理版)
  • 猫抓Cat-Catch:浏览器资源嗅探的完整实用解决方案
  • 如何在30分钟内用OpCore-Simplify完成OpenCore EFI自动化配置?终极黑苹果简化指南
  • Unity天空盒穿帮了?搞懂Cubemap和6 Sided材质那些相反的轴向设置
  • Buzz语音转文字工具中Faster Whisper模型下载失败的3步解决方案与深度解析
  • 猫抓Cat-Catch终极指南:三步成为网页资源嗅探专家
  • 5维体验:如何用Pixelle-Video让AI帮你完成短视频创作的全流程
  • hot100 11盛最多水的容器
  • 使用openclaw配置taotoken实现自动化agent工作流的实践指南
  • Cursor设备标识重置技术:3分钟解决试用限制的完整方案
  • 2026成都短期周转黄金变现,快速回收解燃眉之急 - 诚鑫名品
  • CANN/asc-devkit DropOut高阶API
  • 网络工程师避坑指南:eNSP中配置Eth-Trunk链路聚合的5个常见错误与排查方法
  • 从面积与性能权衡出发:深度解析Tessent MBIST中Bypass/Observation逻辑的配置艺术
  • CANN/asc-devkit SIMD-API同步控制