当前位置: 首页 > news >正文

CANN/asc-devkit向量最大值函数文档

asc_max

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

执行逐元素取最大值运算,计算公式如下:

$$ dst_i = max(src0_i, src1_i) $$

函数原型

  • 前n个数据计算
__aicore__ inline void asc_max(__ubuf__ int16_t* dst, __ubuf__ int16_t* src0, __ubuf__ int16_t* src1, uint32_t count) __aicore__ inline void asc_max(__ubuf__ half* dst, __ubuf__ half* src0, __ubuf__ half* src1, uint32_t count) __aicore__ inline void asc_max(__ubuf__ int32_t* dst, __ubuf__ int32_t* src0, __ubuf__ int32_t* src1, uint32_t count) __aicore__ inline void asc_max(__ubuf__ float* dst, __ubuf__ float* src0, __ubuf__ float* src1, uint32_t count)
  • 高维切分计算
__aicore__ inline void asc_max(__ubuf__ int16_t* dst, __ubuf__ int16_t* src0, __ubuf__ int16_t* src1, uint8_t repeat, uint8_t dst_block_stride, uint8_t src0_block_stride, uint8_t src1_block_stride, uint8_t dst_repeat_stride, uint8_t src0_repeat_stride, uint8_t src1_repeat_stride) __aicore__ inline void asc_max(__ubuf__ half* dst, __ubuf__ half* src0, __ubuf__ half* src1, uint8_t repeat, uint8_t dst_block_stride, uint8_t src0_block_stride, uint8_t src1_block_stride, uint8_t dst_repeat_stride, uint8_t src0_repeat_stride, uint8_t src1_repeat_stride) __aicore__ inline void asc_max(__ubuf__ int32_t* dst, __ubuf__ int32_t* src0, __ubuf__ int32_t* src1, uint8_t repeat, uint8_t dst_block_stride, uint8_t src0_block_stride, uint8_t src1_block_stride, uint8_t dst_repeat_stride, uint8_t src0_repeat_stride, uint8_t src1_repeat_stride) __aicore__ inline void asc_max(__ubuf__ float* dst, __ubuf__ float* src0, __ubuf__ float* src1, uint8_t repeat, uint8_t dst_block_stride, uint8_t src0_block_stride, uint8_t src1_block_stride, uint8_t dst_repeat_stride, uint8_t src0_repeat_stride, uint8_t src1_repeat_stride)
  • 同步计算
__aicore__ inline void asc_max_sync(__ubuf__ int16_t* dst, __ubuf__ int16_t* src0, __ubuf__ int16_t* src1, uint32_t count) __aicore__ inline void asc_max_sync(__ubuf__ half* dst, __ubuf__ half* src0, __ubuf__ half* src1, uint32_t count) __aicore__ inline void asc_max_sync(__ubuf__ int32_t* dst, __ubuf__ int32_t* src0, __ubuf__ int32_t* src1, uint32_t count) __aicore__ inline void asc_max_sync(__ubuf__ float* dst, __ubuf__ float* src0, __ubuf__ float* src1, uint32_t count)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src0、src1输入源操作数(矢量)的起始地址。
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src0_block_stride输入源操作数0单次迭代内不同DataBlock间地址步长。
src1_block_stride输入源操作数1单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src0_repeat_stride输入源操作数0相邻迭代间相同DataBlock的地址步长。
src1_repeat_stride输入源操作数1相邻迭代间相同DataBlock的地址步长。
count输入参与计算的元素个数。

返回值说明

流水类型

PIPE_V

约束说明

  • dst、src的起始地址需要32字节对齐
  • 操作数地址重叠约束请参考通用地址重叠约束。

调用示例

//total_length指参与计算的数据总长度 constexpr uint64_t total_length = 64; __ubuf__ half src0[total_length]; __ubuf__ half src1[total_length]; __ubuf__ half dst[total_length]; asc_max(dst, src0, src1, total_length);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1556994.html

相关文章:

  • Godot 4 开源RPG开发教程:快速搭建回合制战斗游戏
  • Insomnia API客户端:2024年最全面的开源跨平台API测试工具终极指南 [特殊字符]
  • 通达信缠论插件完整指南:让复杂技术分析变得简单直观
  • WebHaptics:为移动端网页添加触觉反馈的终极解决方案
  • MC9S08SG32定时器/PWM引擎(TPMV3)深度解析与实战避坑指南
  • 宁波汽车音响改装新选择:宁波乾音汽车音响旗舰店,3大核心优势揭秘,宝马原厂音响升级/路虎音响改装,音响改装品牌哪家好 - 音响改装门店分享
  • GRU4Rec训练速度优化:如何在GPU上实现每秒1500个mini-batch
  • 3步实现Minecraft极致光影:Iris与Sodium完美搭配指南
  • 图片压缩到200KB以内 手机小程序精确压缩方法 - 图片处理研究员
  • ComfyUI TTP Toolset:突破8K图像处理瓶颈的分块处理革命
  • Bamboo与ZooKeeper集成:分布式配置管理的完整实践指南
  • 从密文到明文:手把手解析SecureCRT会话密码恢复
  • 2026郑州空调维修避坑:高温天气不制冷、漏水、异响故障诊断+维修平台对比 - 一步到家
  • Markoff自定义配置:打造个性化Markdown写作环境
  • MC9S08DE60微控制器12位ADC模块:从原理到实战配置详解
  • 2026济南防水补漏维修团队实测盘点TOP4:济南业主房屋渗漏修缮靠谱选择 - 宅安选房屋修缮
  • 3步突破性实现A股智能分析自动化:从手动复盘到AI驱动的革命性转变
  • 2026年阜阳GEO服务商代理加盟选型靠谱推荐丨阜阳GEO优化代理合作路径与合伙人收益全解析 - 小随科技
  • OmenSuperHub:彻底释放惠普游戏本性能的开源控制工具
  • 2026年 北京丰台区防水堵漏推荐榜单:楼顶/外墙/卫生间/厨房/阳台/地下室/窗台防水施工公司精选! - 品牌发掘
  • Extended WPF Toolkit架构深度解析:企业级WPF控件库的完整解决方案
  • FlexiCubes高级技巧:如何使用正则化损失函数提升网格可制造性
  • Android自动化脚本实战:Auto.js深度解析与高级应用指南
  • WiFi6协议深度解析-基于AX200与Ubuntu20.04的无线监控与故障诊断实战
  • 学Simulink——燃料电池(PEMFC)热管理系统动态响应优化仿真
  • 2026深圳油烟机清洗实测:吸力变小、噪音大、油污堵塞深度清洁+平台对比 - 一步到家
  • MC68340 SIM40模块:系统配置与硬件保护机制深度解析
  • 学硕停招,低分全刷!
  • 探索Inkscape光学设计扩展:从创意到光路可视化的艺术之旅
  • GitHub Desktop终极汉化指南:5分钟实现界面完美本地化