GetSelectMaxMinTmpSize【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit功能说明kernel侧Select接口的计算需要开发者申请临时空间本接口用于在host侧获取申请的最大最小临时空间大小开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。为保证功能正确申请的临时空间大小不能小于最小临时空间大小在最小临时空间-最大临时空间范围内随着临时空间增大kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能开发者可以根据实际的内存使用情况进行空间申请。函数原型[!NOTE]说明 GetSelectWithBytesMaskMinTmpSize、GetSelectWithBytesMaskMaxTmpSize、GetSelectWithBytesMaskMaxMinTmpSize接口废弃并将在后续版本移除请不要使用该接口。请使用GetSelectMinTmpSize、GetSelectMaxTmpSize、GetSelectMaxMinTmpSize接口。获取最小临时空间大小uint32_t GetSelectMinTmpSize(const ge::Shape src0Shape, const ge::Shape src1Shape, const uint32_t srcTypeSize, const ge::Shape maskShape, const uint32_t maskTypeSize, const bool isReuseMask)uint32_t GetSelectWithBytesMaskMinTmpSize(const ge::Shape src0Shape, const ge::Shape src1Shape, const uint32_t srcTypeSize, const ge::Shape maskShape, const uint32_t maskTypeSize, const bool isReuseMask)获取最大临时空间大小uint32_t GetSelectMaxTmpSize(const ge::Shape src0Shape, const ge::Shape src1Shape, const uint32_t srcTypeSize, const ge::Shape maskShape, const uint32_t maskTypeSize, const bool isReuseMask)uint32_t GetSelectWithBytesMaskMaxTmpSize(const ge::Shape src0Shape, const ge::Shape src1Shape, const uint32_t srcTypeSize, const ge::Shape maskShape, const uint32_t maskTypeSize, const bool isReuseMask)获取最大和最小临时空间大小void GetSelectMaxMinTmpSize(const ge::Shape src0Shape, const ge::Shape src1Shape, const uint32_t srcTypeSize, const ge::Shape maskShape, const uint32_t maskTypeSize, const bool isReuseMask, uint32_t maxValue, uint32_t minValue)void GetSelectWithBytesMaskMaxMinTmpSize(const ge::Shape src0Shape, const ge::Shape src1Shape, const uint32_t srcTypeSize, const ge::Shape maskShape, const uint32_t maskTypeSize, const bool isReuseMask, uint32_t maxValue, uint32_t minValue)参数说明表 1接口参数列表参数名输入/输出描述src0Shape输入输入src0的shape信息。src0为scalar时shape应为{1}。src1Shape输入输入src1的shape信息。src1为scalar时shape应为{1}。srcTypeSize输入输入srcTensor的数据类型大小比如数据类型为half此处应传入2。maskShape输入输入maskTensor的shape信息。maskTypeSize输入输入maskTensor的数据类型大小比如数据类型为bool此处应传入1。isReuseMask输入是否复用maskTensor输入的空间。与kernel侧保持一致。maxValue输出Select接口能完成计算所需最大临时空间大小。说明maxValue仅作为参考值有可能大于Unified Buffer剩余空间的大小该场景下开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。minValue输出Select接口能完成计算所需最小临时空间大小。返回值说明GetSelectMinTmpSize返回Select接口能完成计算所需最小临时空间大小。GetSelectMaxTmpSize返回Select接口能完成计算所需最大临时空间大小。GetSelectMaxMinTmpSize无返回值。约束说明无调用示例std::vectorint64_t shape0Vec {64, 128}; std::vectorint64_t shape1Vec {1}; std::vectorint64_t mask1Vec {64, 128}; ge::Shape src0Shape(shape0Vec); ge::Shape src1Shape(shape1Vec); ge::Shape maskShape(mask1Vec); uint32_t maxValue 0; uint32_t minValue 0; AscendC::GetSelectMaxMinTmpSize(src0Shape, src1Shape, 2, maskShape, 1, false, maxValue, minValue);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考