当前位置: 首页 > news >正文

CANN/asc-devkit:浮点数转bfloat16函数

asc_float2bfloat16

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将vector_float类型转换成vector_bfloat16_t类型,写入目的操作数的上半部分或下半部分,并支持多种舍入模式与饱和模式:

  • RINT舍入模式:四舍六入五成双舍入。

  • ROUND舍入模式:四舍五入舍入。

  • FLOOR舍入模式:向负无穷舍入。

  • CEIL舍入模式:向正无穷舍入。

  • TRUNC舍入模式:向零舍入。

以asc_float2bfloat16_rd接口为例:

  • asc_float2bfloat16_rd:不饱和模式,写入目的操作数的上半部分。

  • asc_float2bfloat16_rd_sat:饱和模式,写入目的操作数的上半部分。

  • asc_float2bfloat16_rd_v2:不饱和模式,写入目的操作数的下半部分。

  • asc_float2bfloat16_rd_sat_v2:饱和模式,写入目的操作数的下半部分。

函数原型

// FLOOR舍入模式 __simd_callee__ inline void asc_float2bfloat16_rd(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rd_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rd_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rd_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) // RINT舍入模式 __simd_callee__ inline void asc_float2bfloat16_rn(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rn_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rn_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rn_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) // ROUND舍入模式 __simd_callee__ inline void asc_float2bfloat16_rna(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rna_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rna_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rna_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) // CEIL舍入模式 __simd_callee__ inline void asc_float2bfloat16_ru(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_ru_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_ru_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_ru_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) // TRUNC舍入模式 __simd_callee__ inline void asc_float2bfloat16_rz(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rz_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rz_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rz_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

  • 开启饱和模式和非饱和模式时,需配置ctrl寄存器,ctrl寄存器的详细说明请参见asc_set_ctrl.md。

调用示例

vector_bfloat16_t dst; vector_float src; vector_bool mask; asc_float2bfloat16_rd(dst, src, mask); // FLOOR舍入模式,不饱和模式,将src转换成vector_bfloat16_t类型并写入dst上半部分 asc_float2bfloat16_rd_sat(dst, src, mask); // FLOOR舍入模式,饱和模式,将src转换成vector_bfloat16_t类型并写入dst上半部分 asc_float2bfloat16_rd_v2(dst, src, mask); // FLOOR舍入模式,不饱和模式,将src转换成vector_bfloat16_t类型并写入dst下半部分 asc_float2bfloat16_rd_sat_v2(dst, src, mask); // FLOOR舍入模式,饱和模式,将src转换成vector_bfloat16_t类型并写入dst下半部分

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1554567.html

相关文章:

  • OpenFoodFacts-androidapp多语言支持:如何为全球用户提供本地化食品信息
  • IronOS深度解析:开源焊锡铁固件的实战应用与性能优化
  • Simple Thermostat 故障排除:常见问题与解决方案大全
  • WebHaptics高级技巧:创建自定义触感预设与动态强度控制
  • RevokeMsgPatcher深度解密:Windows平台即时通讯软件二进制补丁完整技术手册
  • MC9S12KG128内存映射控制(MMCV4)详解:突破64KB限制的嵌入式开发实战
  • Numix图标主题与Numix Circle、Numix Square的完美组合方案
  • Beyond Compare 5密钥生成器:3种终极解决方案完整指南
  • 链路层:亲密的网络旅程(十七):PPP 的“调参”艺术与多车道合流——LCP 的深度调优、链路体检与多链路聚合
  • MC68HC908JG16微控制器:振荡器与系统集成模块的深度解析与实战配置
  • 终极指南:在macOS上高效运行Windows应用的专业解决方案
  • 成为开放科学讲师:TOPS Open Science 101教学资格获取与课程组织完整指南 [特殊字符]
  • 2026南昌放心贵金属回收,CCIC 中检授权收黄金回收铂金回收白银回收持证实体门店 - 中安检金银铂钻回收
  • 终极指南:为OBS直播添加免费实时字幕的完整解决方案
  • 提示词优化器:让AI真正理解你的想法,告别无效对话的智能工具
  • Insomnia安全最佳实践:保护敏感API数据的10个关键步骤
  • 2026深圳轻高定全屋定制首选:诺芬迪——综合本土实力品牌 - 爱格研究所
  • MC9S08DE60 GPIO寄存器详解:从基础配置到中断与电气特性实战
  • 实地测评福州五家手表回收机构,官方认证资质逐一核验 - 讯息早知道
  • 术语俗话 --- 漏洞/后门/木马/病毒
  • 术语俗话 --- DNS/DHCP/NAT
  • 深入浅出Java日期格式化
  • Able Player响应式设计:移动端无障碍播放的最佳实践
  • 深入解析S12XS MCU串行通信接口:从SCI基础到红外与LIN应用
  • 2026 东莞黄金回收靠谱推荐!实测正规门店 + 避坑全攻略 - zzlzzl6688
  • VR视频转换终极指南:用VR-Reversal让普通屏幕玩转3D沉浸式体验
  • 留学签证证件照哪家靠谱?这份实用挑选指南帮你避坑解惑 - 速递信息
  • 上海正规门店高价回收芬迪/缪缪箱包,全套配件可额外核算溢价 - 奢品小当家
  • MPC555/556 L2U接口Show Cycle机制:总线监控与性能开销深度解析
  • FlexCAN消息缓冲区机制深度解析:从CAN协议到嵌入式实战