当前位置: 首页 > news >正文

CANN/asc-devkit LogicalAnds临时空间接口

GetLogicalAndsMaxMinTmpSize【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit功能说明Kernel侧LogicalAnds接口的计算需要开发者预留/申请临时空间本接口用于在Host侧获取预留/申请的最大和最小临时空间大小开发者基于此范围选择合适的空间大小作为Tiling参数传递到Kernel侧使用。为保证功能正确预留/申请的临时空间大小不能小于最小临时空间大小在最小临时空间-最大临时空间范围内随着临时空间增大Kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能开发者可以根据实际的内存使用情况进行空间预留/申请。函数原型void GetLogicalAndsMaxMinTmpSize(const platform_ascendc::PlatformAscendC ascendcPlatform, const ge::Shape srcShape, const uint32_t typeSize, const bool isReuseSource, uint32_t maxValue, uint32_t minValue)参数说明表 1接口参数列表参数名输入/输出功能ascendcPlatform输入输入的平台信息。PlatformAscendC的定义请参见构造及析构函数。srcShape输入输入的shape信息。typeSize输入输入的数据类型大小单位为字节。比如输入的数据类型为half此处应传入2。isReuseSource输入该参数预留传入默认值false即可。maxValue输出LogicalAnds接口能完成计算所需的最大临时空间大小超出该值的空间不会被该接口使用。在最小临时空间-最大临时空间范围内随着临时空间增大Kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能开发者可以根据实际的内存使用情况进行空间预留/申请。最大空间大小为0表示计算不需要临时空间。请注意maxValue仅作为参考值有可能大于Unified Buffer剩余空间的大小该场景下开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。minValue输出LogicalAnds接口能完成计算所需最小临时空间大小。为保证功能正确接口计算时预留/申请的临时空间不能小于该数值。最小空间大小为0表示计算不需要临时空间。返回值说明无约束说明无调用示例完整的调用样例请参考更多样例。// 输入shape信息为1024;算子输入的数据类型为half;不允许修改源操作数 std::vectorint64_t shape_vec {1024}; ge::Shape shape(shape_vec); uint32_t maxValue 0; uint32_t minValue 0; auto plat platform_ascendc::PlatformAscendC(context-GetPlatformInfo()); AscendC::GetLogicalAndsMaxMinTmpSize(plat, shape, 2, false, maxValue, minValue);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
http://www.gsyq.cn/news/1331075.html

相关文章:

  • PHP主流框架
  • 全域数学公理:基于32维超复数与易经卦爻的宇宙大一统理论(整理版)
  • 猫抓Cat-Catch:浏览器资源嗅探的完整实用解决方案
  • 如何在30分钟内用OpCore-Simplify完成OpenCore EFI自动化配置?终极黑苹果简化指南
  • Unity天空盒穿帮了?搞懂Cubemap和6 Sided材质那些相反的轴向设置
  • Buzz语音转文字工具中Faster Whisper模型下载失败的3步解决方案与深度解析
  • 猫抓Cat-Catch终极指南:三步成为网页资源嗅探专家
  • 5维体验:如何用Pixelle-Video让AI帮你完成短视频创作的全流程
  • hot100 11盛最多水的容器
  • 使用openclaw配置taotoken实现自动化agent工作流的实践指南
  • Cursor设备标识重置技术:3分钟解决试用限制的完整方案
  • 2026成都短期周转黄金变现,快速回收解燃眉之急 - 诚鑫名品
  • CANN/asc-devkit DropOut高阶API
  • 网络工程师避坑指南:eNSP中配置Eth-Trunk链路聚合的5个常见错误与排查方法
  • 从面积与性能权衡出发:深度解析Tessent MBIST中Bypass/Observation逻辑的配置艺术
  • CANN/asc-devkit SIMD-API同步控制
  • cann/asc-devkit Select接口临时空间大小获取
  • 黑苹果配置太复杂?OpCore Simplify让你15分钟搞定专业级EFI
  • 7个实用技巧:猫抓浏览器资源嗅探扩展完全指南
  • DiffLoss扩散损失函数详解:MAR训练的核心引擎
  • CANN/asc-devkit SoftMax接口
  • 猫抓浏览器插件:三步解锁网页视频音频下载的神奇能力
  • BiliTools哔哩哔哩工具箱:高效管理B站资源的完整实战指南
  • B站直播弹幕姬:三分钟打造智能互动直播间
  • 32维超球体投影、碳基-硅基全息共振与宇宙观测者大一统理论
  • SpringBoot接口规范实践:统一响应体、全局异常处理与状态码设计
  • 2026年对标英特格(Entergris)的国产过滤器品牌推荐 - 品牌排行榜
  • drf-nested-routers入门指南:快速掌握Django REST Framework嵌套路由
  • 2026重庆黄金回收商家推荐,高性价比回收门店盘点 - 诚鑫名品
  • 终极Windows系统清理优化:Win11Debloat完整指南