当前位置: 首页 > news >正文

cann/asc-devkit: Reg矢量小于等于标量API

asc_le_scalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

按元素判断src_i <= value是否成立,若成立则输出结果为1,否则为0。

函数原型

__simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_int8_t src, int8_t value, vector_bool mask) __simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_uint8_t src, uint8_t value, vector_bool mask) __simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_int16_t src, int16_t value, vector_bool mask) __simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_uint16_t src, uint16_t value, vector_bool mask) __simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_half src, half value, vector_bool mask) __simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_bfloat16_t src, bfloat16_t value, vector_bool mask) __simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_int32_t src, int32_t value, vector_bool mask) __simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_uint32_t src, uint32_t value, vector_bool mask) __simd_callee__ inline void asc_le_scalar(vector_bool& dst, vector_float src, float value, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(掩码寄存器)。
src输入源操作数(矢量数据寄存器)。
value输入源操作数(标量)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_bool dst; vector_int8_t src; int8_t value = 5; vector_bool mask = asc_create_mask_b8(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_le_scalar(dst, src, value, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1552619.html

相关文章:

  • 如何永久备份微信聊天记录:3个简单步骤实现数据自主掌控
  • 终极指南:如何用ZenTao免费开源项目管理软件提升团队效率300%
  • CANN/Ascend C原子最小操作API
  • SVGuitar高级技巧:实现手绘风格和自定义形状的吉他和弦图
  • 2026年南宁市CPPM考试最新全攻略:科目题型、通过率、备考重点及官方双认证报考机构推荐 - 众智商学院课程中心
  • 2026年市政污水在线溶解氧仪优选品牌TOP10:荧光法技术全面替代下的国产化格局与选型指南 - 仪表品牌榜
  • CANN/asc-devkit SIMD int32转float函数
  • 如何快速上手Unity2D Components:初学者必备的10个核心组件
  • 4层纵深防御:构建企业级API安全防护体系
  • 揭秘ZLUDA:让非NVIDIA显卡运行CUDA程序的深度指南
  • 2027 成都融创全新升级|智能化教学体系上线,官方咨询渠道统一公布 - 成都单招培训
  • Adobe开源中心:探索Adobe开源项目的完整指南
  • CANN/asc-devkit int16转uint8函数
  • 高速ADC芯片MCP37D20-200:数字下变频与PLL时钟配置实战解析
  • Paralayout入门指南:10分钟掌握iOS像素完美布局神器
  • 通风配件专业供应商十大实力厂家解析,零套路采购放心之选 - mypinpai
  • Numix图标主题性能优化:如何让图标加载更快、内存占用更少
  • NSK W2507FA滚珠丝杠技术手册
  • 3步搞定跨平台局域网文件传输:LANDrop终极解决方案
  • MHmarkets:围绕执行效率与流程清晰度的要点复盘
  • 贡献你的力量!CushyStudio开源社区参与指南与贡献者奖励计划
  • 【字节跳动】第一部分:VAR间歇性变量奖励体系——定向诱导青少年熬夜成瘾底层方案
  • 深入理解 Dart 中的接口与实现
  • MPC5200 GPIO模块深度解析:从寄存器到驱动代码实战
  • 私有化协作底座:自主可控需求下,局域网即时通讯的基座革命
  • 2026年6月优质口碑好的抽屉式钣金货架生产厂家推荐,伸缩悬臂货架电动手摇/悬臂式伸缩货架,抽屉式钣金货架企业哪个好 - 品牌推荐师
  • 为什么这款跨平台待办工具能让你的效率提升300%?
  • Grok-4实测真相:识别灰盒模型的能力边界与落地风险
  • 2026年6月专业的HDPE板公司哪家可靠,HDPE板耐低温,寒冷环境不变形 - 品牌推荐师
  • PHP轻量工单系统源码包:含前后端代码、MySQL配置与Nginx/Apache部署脚本