当前位置: 首页 > news >正文

CANN/asc-devkit:Half转BFloat16 SIMD API

asc_half2bfloat16

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将half类型数据转为bfloat16类型,并支持多种舍入模式。

  • RINT舍入模式:四舍六入五成双舍入
  • ROUND舍入模式:四舍五入舍入
  • FLOOR舍入模式:向负无穷舍入
  • CEIL舍入模式:向正无穷舍入
  • TRUNC舍入模式:向零舍入

函数原型

// FLOOR舍入模式 __simd_callee__ inline void asc_half2bfloat16_rd(vector_bfloat16_t& dst, vector_half src, vector_bool mask) // RINT舍入模式 __simd_callee__ inline void asc_half2bfloat16_rn(vector_bfloat16_t& dst, vector_half src, vector_bool mask) // ROUND舍入模式 __simd_callee__ inline void asc_half2bfloat16_rna(vector_bfloat16_t& dst, vector_half src, vector_bool mask) // CEIL舍入模式 __simd_callee__ inline void asc_half2bfloat16_ru(vector_bfloat16_t& dst, vector_half src, vector_bool mask) // TRUNC舍入模式 __simd_callee__ inline void asc_half2bfloat16_rz(vector_bfloat16_t& dst, vector_half src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_half src; vector_bfloat16_t dst; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_half2bfloat16_rna(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1350925.html

相关文章:

  • 工控机系统重装与环境配置全流程|工业AI离线部署标准化万能模板
  • 北京大学造出“变形金刚“AI芯片适配器
  • 三步搞定M3U8视频下载:N_m3u8DL-CLI-SimpleG终极指南
  • 空气动力学计算 · 趋势图谱(学生学习版)
  • 如何免费激活Windows和Office:3步实现永久激活的终极指南
  • 西南文创礼品定制技术拆解:高端礼品定制/会议纪念礼品/各类礼品团购/商务礼品定制/成都礼品批量定制/成都礼品批量订制/选择指南 - 优质品牌商家
  • Stargazer AI Copilot Desktop 使用说明
  • PHP 文件:深入解析与最佳实践
  • 【26年最新】新高考英语大纲词汇表3500个电子版PDF(含正序版、乱序版和默写版)
  • VSCode插件Claude Code for VSCode配置神马中转API详细教程_AI编程工具推荐_ClaudeCode中转API推荐
  • 2026年5月北京老房改造装修公司推荐:TOP5排名专业评测防隐患价格 - 品牌推荐
  • (总结)七大数学猜想:哲学 × 数学 思维范式全链条
  • AI生成镜头如何通过DIT审核?——Netflix《The Last Frame》技术白皮书首度公开(附VFX合规性检查清单PDF)
  • 汽车总线测试与仿真利器:TSMaster 5分钟快速上手指南
  • 【Sora 2批量视频生成黄金工作流】:实测吞吐提升4.8倍的关键配置——NVIDIA A100集群下每小时稳定输出217段1080p视频
  • 争议观点 Multi Agent 并不更强 单 Agent 反而更可靠的条件
  • Sora 2长视频生成实战手册(工业级分镜锚定技术首次公开)
  • python多任务框架?_?Python多任务框架Celery、Dramatiq与RQ对比与使用.txt
  • 暗黑破坏神2存档编辑器完整指南:三步轻松修改D2/D2R角色与装备
  • 中小团队如何利用 Taotoken 统一管理多模型 API 密钥与成本
  • DAP注意事项
  • 0x.Tools快速入门:10分钟内掌握Linux系统性能分析
  • 从研发投入和专利数据,能怎么判断一家工厂的产品定位?一份面向采购与上游销售的定位判读手册
  • CANN/asc-devkit矢量大于等于标量比较API
  • 少走弯路:2026 降AIGC平台测评与推荐指南
  • 2026年5月最新齐齐哈尔铁锋黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 诚信金利回收
  • 铜钟音乐:在信息洪流中找回纯粹听歌体验的现代Web应用
  • 哈佛教授刚警告“别让AI改写论文”,但我反手就用GPT这套技巧发了篇核心
  • 2026年5月最新泉州泉港黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 诚信金利回收
  • 2026年5月最新内江威远黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 诚信金利回收