当前位置: 首页 > news >正文

CANN/asc-devkit向量大于标量比较函数

asc_gt_scalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

对源操作数执行逐元素比较。对于src0_i > value,若条件成立则目的操作数对应结果位为1,否则为0,每个元素的比较结果占一个bit。

函数原型

__simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_uint8_t src, uint8_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_int8_t src, int8_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_bfloat16_t src, bfloat16_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_uint16_t src, uint16_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_int16_t src, int16_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_uint32_t src, uint32_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_int32_t src, int32_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_half src, half value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_float src, float value, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(掩码寄存器)。
src输入源操作数(矢量数据寄存器)。
value输入源操作数(标量)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_bool dst; vector_half src; half value = 1.0; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_gt_scalar(dst, src, value, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1557113.html

相关文章:

  • 2026年宁波GEO获客优化服务商盘点:本土实力阵营解析 - 起跑123
  • Roo Code Memory Bank终极指南:让AI助手记住你的项目上下文
  • 2026年宁波GEO获客优化服务商调研与合规推荐 - 起跑123
  • 终极指南:用YOLOv9快速构建高性能目标检测系统
  • 形式化方法 +《大象 Thinking in UML》 - -z-w-h
  • LocalAI:重新定义本地人工智能的边界,让AI回归你的掌控
  • 素数 / 质数 - -z-w-h
  • 宁波音响改装难题终结者:乾音汽车音响旗舰店3大核心优势揭秘,路虎原厂音响升级/问界原厂音响升级,音响改装门店怎么选择 - 音响改装门店分享
  • Node.js企业级配置管理架构深度解析:多格式配置融合与分层设计指南
  • Insomnia:2024年最完整的开源跨平台API测试工具终极指南
  • 超越内置工具:为什么选择AsciiFBXExporterForUnity进行Unity模型导出?
  • DeepLabCut入门指南:5步快速掌握无标记动物姿态估计技术 [特殊字符]
  • 解决Express.js日志难题:express-winston实战案例分析 [特殊字符]
  • 3步解决DeepSeek-V4模型在Atlas A2/A3硬件部署难题:AMCT量化转换实战指南
  • 为什么LocateAnything-3B能成为视觉定位的终极解决方案:实战技巧与完整指南
  • 从零极点分布到系统行为:频率响应与稳定性的直观解析
  • grunt-concurrent高级配置指南:limit、logConcurrentOutput、indent参数详解
  • 如何高效运用图数据库:3个核心技巧实战指南
  • 2026年宁波GEO获客优化服务商调研:合规运营成核心 - 起跑123
  • LoRA技术解析:低秩适应原理与权重空间应用
  • xiaozhi-esp32:基于MCP协议的ESP32 AI聊天机器人技术解析
  • Claude Code VS Code 插件集成(可视化使用)
  • 如何将手机变身专业卡车仪表盘:ETS2/ATS Telemetry Server完全指南
  • 超市秤盘电子表显示数字电子秤读数检测数据集VOC+YOLO格式104张10类别
  • 如何在iOS应用中快速集成MQTT客户端:CocoaMQTT完整指南
  • 揭秘macOS鼠标滚动的革命性优化:专业级事件处理完全手册
  • SkyDiffusion:用 BEV 视角打开街景→航拍图像合成新范式
  • Material Design Extensions文件对话框:打造专业的文件选择体验
  • Google Translate Mac客户端:终极免费翻译工具使用指南
  • 深度解析DeepEval:企业级LLM评估框架的完整实战指南