当前位置: 首页 > news >正文

CANN Ascend C向量计算API

asc_bfloat162int32【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√功能说明将bfloat16_t类型数据转换为int32_t类型并支持多种舍入模式RINT舍入模式四舍五入成双舍入ROUND舍入模式四舍五入舍入FLOOR舍入模式向负无穷舍入CEIL舍入模式向正无穷舍入TRUNC舍入模式向零舍入函数原型前n个数据计算// RINT舍入模式 __aicore__ inline void asc_bfloat162int32_rn(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count) // ROUND舍入模式 __aicore__ inline void asc_bfloat162int32_rna(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count) // FLOOR舍入模式 __aicore__ inline void asc_bfloat162int32_rd(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count) // CEIL舍入模式 __aicore__ inline void asc_bfloat162int32_ru(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count) // TRUNC舍入模式 __aicore__ inline void asc_bfloat162int32_rz(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count)高维切分计算// RINT舍入模式 __aicore__ inline void asc_bfloat162int32_rn(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride) // ROUND舍入模式 __aicore__ inline void asc_bfloat162int32_rna(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride) // FLOOR舍入模式 __aicore__ inline void asc_bfloat162int32_rd(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride) // CEIL舍入模式 __aicore__ inline void asc_bfloat162int32_ru(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride) // TRUNC舍入模式 __aicore__ inline void asc_bfloat162int32_rz(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride)同步计算// RINT舍入模式 __aicore__ inline void asc_bfloat162int32_rn_sync(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count) // ROUND舍入模式 __aicore__ inline void asc_bfloat162int32_rna_sync(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count) // FLOOR舍入模式 __aicore__ inline void asc_bfloat162int32_rd_sync(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count) // CEIL舍入模式 __aicore__ inline void asc_bfloat162int32_ru_sync(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count) // TRUNC舍入模式 __aicore__ inline void asc_bfloat162int32_rz_sync(__ubuf__ int32_t* dst, __ubuf__ bfloat16_t* src, uint32_t count)参数说明参数名输入/输出描述dst输出目的操作数矢量的起始地址。src输入源操作数矢量的起始地址。count输入参与计算的元素个数。repeat输入迭代次数。dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。src_block_stride输入源操作数单次迭代内不同DataBlock间地址步长。dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。src_repeat_stride输入源操作数相邻迭代间相同DataBlock的地址步长。返回值说明无流水类型PIPE_V约束说明dst、src的起始地址需要32字节对齐。操作数地址重叠约束请参考通用地址重叠约束。调用示例constexpr uint32_t total_length 256; __ubuf__ bfloat16_t src[total_length]; __ubuf__ int32_t dst[total_length]; asc_bfloat162int32_rna(dst, src, 128);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
http://www.gsyq.cn/news/1342720.html

相关文章:

  • 《Sysinternals实战指南》进程和诊断工具学习笔记(8.24):Handle——谁占着不放?句柄泄漏排查、强制解锁与检索技巧
  • Go语言并发编程:sync包深度解析与实践
  • FICO创凭证标准错误:在折旧范围 01 中的业务与帐面净值规则冲突
  • 如何将普通桌面实时转换为3D立体视频?nunif iw3-desktop完全指南
  • ElevenLabs高棉文语音私有化部署终极方案(含Docker+Khmer IPA音素映射表),仅限前200位技术负责人获取
  • 3分钟掌握gmpublisher:Garry‘s Mod工坊发布的终极解决方案
  • 深入拆解 MySQL InnoDB 隔离级别:从 MVCC 到临键锁
  • rk3588/rk3576使用rkllm推理大模型,提供OpenAI服务
  • AI论文软件的实战手册:什么程度算学术不端?
  • C语言06(操作符)
  • 080.领域自适应:当你的YOLO在新车间“水土不服”时
  • VxWorks网络通信模块:网络协议栈解析(第五部分)
  • ComfyUI全面掌握-知识点详解——ComfyUI 开发与扩展基础(开发指南+环境搭建)
  • linuxcnc开发环境搭建
  • Win11 右键菜单缺少“新建文本文档“win11 某些软件中文乱码
  • 谷歌关键词优化seo需要怎么做?避开这4个最掏钱的布词误区
  • 2026年整箱榨菜厂家精选合集 - 行业平台推荐
  • Allen-Bradley 280D-F12Z-10B-CR启动控制模块
  • HTTP状态码与请求方式全解析【个人八股】
  • LangChain 是什么?从零开始学会 LangChain 的工程实践指南
  • 性价比高的国产PLM软件公司
  • 3.url编码
  • 关于 ops-transformer 和它背后那套系统,几个我见过最常见的误解
  • VGG16猫狗二分类数据集处理
  • ops-transformer 基础设施性能实验报告:GE 融合边界与 Runtime 调度效率实测
  • 手把手教你学Simulink——轨道车辆牵引电机直接转矩控制(DTC)及其磁链观测器仿真
  • 手把手教你学Simulink——考虑铁损的电动汽车永磁同步电机高阶矢量控制建模
  • 2026AI写作辅助软件实测排行榜!这几款才是真神器
  • Midjourney色彩一致性难题破解(CMYK→sRGB跨域校准实战手册)
  • 计算机毕业设计 | SpringBoot+vue医院药品管理系统(附源码+论文)