当前位置: 首页 > news >正文

CANN/asc-devkit SIMD int32转float函数

asc_int322float

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将int32_t类型转化为float类型,并支持多种舍入模式。

  • RINT舍入模式:四舍六入五成双舍入
  • ROUND舍入模式:四舍五入舍入
  • FLOOR舍入模式:向负无穷舍入
  • CEIL舍入模式:向正无穷舍入
  • TRUNC舍入模式:向零舍入

函数原型

// RINT舍入模式 __simd_callee__ inline void asc_int322float_rn(vector_float& dst, vector_int32_t src, vector_bool mask) // ROUND舍入模式 __simd_callee__ inline void asc_int322float_rna(vector_float& dst, vector_int32_t src, vector_bool mask) // FLOOR舍入模式 __simd_callee__ inline void asc_int322float_rd(vector_float& dst, vector_int32_t src, vector_bool mask) // CEIL舍入模式 __simd_callee__ inline void asc_int322float_ru(vector_float& dst, vector_int32_t src, vector_bool mask) // TRUNC舍入模式 __simd_callee__ inline void asc_int322float_rz(vector_float& dst, vector_int32_t src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_int32_t src; vector_float dst; vector_bool mask = asc_create_mask_b32(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_int322float_rn(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1552601.html

相关文章:

  • 如何快速上手Unity2D Components:初学者必备的10个核心组件
  • 4层纵深防御:构建企业级API安全防护体系
  • 揭秘ZLUDA:让非NVIDIA显卡运行CUDA程序的深度指南
  • 2027 成都融创全新升级|智能化教学体系上线,官方咨询渠道统一公布 - 成都单招培训
  • Adobe开源中心:探索Adobe开源项目的完整指南
  • CANN/asc-devkit int16转uint8函数
  • 高速ADC芯片MCP37D20-200:数字下变频与PLL时钟配置实战解析
  • Paralayout入门指南:10分钟掌握iOS像素完美布局神器
  • 通风配件专业供应商十大实力厂家解析,零套路采购放心之选 - mypinpai
  • Numix图标主题性能优化:如何让图标加载更快、内存占用更少
  • NSK W2507FA滚珠丝杠技术手册
  • 3步搞定跨平台局域网文件传输:LANDrop终极解决方案
  • MHmarkets:围绕执行效率与流程清晰度的要点复盘
  • 贡献你的力量!CushyStudio开源社区参与指南与贡献者奖励计划
  • 【字节跳动】第一部分:VAR间歇性变量奖励体系——定向诱导青少年熬夜成瘾底层方案
  • 深入理解 Dart 中的接口与实现
  • MPC5200 GPIO模块深度解析:从寄存器到驱动代码实战
  • 私有化协作底座:自主可控需求下,局域网即时通讯的基座革命
  • 2026年6月优质口碑好的抽屉式钣金货架生产厂家推荐,伸缩悬臂货架电动手摇/悬臂式伸缩货架,抽屉式钣金货架企业哪个好 - 品牌推荐师
  • 为什么这款跨平台待办工具能让你的效率提升300%?
  • Grok-4实测真相:识别灰盒模型的能力边界与落地风险
  • 2026年6月专业的HDPE板公司哪家可靠,HDPE板耐低温,寒冷环境不变形 - 品牌推荐师
  • PHP轻量工单系统源码包:含前后端代码、MySQL配置与Nginx/Apache部署脚本
  • CANN/oam-tools综合检测
  • 深入解析PowerPC 601 MMU:地址转换、TLB协同与内存保护机制
  • vum框架入门指南:如何快速构建Vue.js移动端应用
  • 2026年6月国内做得好的船用起重机生产厂家推荐,船用起重机/船用舵机/船用甲板机械/船用绞车,船用起重机实力厂家哪家好 - 品牌推荐师
  • Raspberry Pi上运行CapsuleFarmerEvolved:ARM设备低功耗挂机完整指南
  • 终极指南:如何在LIBRETINY与LibreTuya平台上使用AsyncTCP实现跨平台异步通信
  • 计算机知识分享论坛