当前位置: 首页 > news >正文

CANN asc-devkit C API向量归约函数

asc_pair_reduce_sum【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√功能说明PairReduceSum: 相邻两个奇偶元素求和结果写入dst。例如src{1,2,3,4}则dst{3,7}。函数原型__simd_callee__ inline void asc_pair_reduce_sum(vector_half dst, vector_half src, vector_bool mask) __simd_callee__ inline void asc_pair_reduce_sum(vector_float dst, vector_float src, vector_bool mask)参数说明参数名输入/输出描述dst输出目的操作数矢量数据寄存器。src输入源操作数矢量数据寄存器。mask输入源操作数掩码掩码寄存器用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算为0时不参与计算。mask未筛选的元素在输出中置零。矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。返回值说明无流水类型PIPE_V约束说明当mask为奇数时最后被mask筛选的元素保持原值输出在dst的低位位置。调用示例vector_half dst; vector_half src; vector_bool mask asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_pair_reduce_sum(dst, src, mask);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
http://www.gsyq.cn/news/1348321.html

相关文章:

  • NoisePage查询编译技术深度剖析:LLVM JIT如何实现10倍性能提升
  • 2026年5月温州直流屏/交直流一体化电源/不间断电源/消防应急电源/eps应急电源厂家哪家好,认准温州平源电气有限公司 - 2026年企业推荐榜
  • ShawzinBot完全指南:如何在Warframe中轻松实现MIDI自动演奏
  • H3CSE 高性能园区网:MAD分裂检测技术详解
  • 百度健康杨明璐拆解AI大健康落地实践:从技术赋能到价值创造,构建全链路服务体系
  • CANN asc-devkit向量反量化函数
  • 泾县黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 2026年北京有害生物防制服务商深度横评:从应急消杀升级到科学防制体系 - 企业名录优选推荐
  • OpenCalib:自动驾驶多传感器外参标定工具箱深度解析与技术实现
  • 深度探索WinBtrfs:Windows环境下的Btrfs文件系统完整解决方案
  • 琅琊区黄金回收白银回收铂金回收店铺哪家好 靠谱门店推荐 - 莘州文化
  • 5分钟掌握ToolsFx:终极数据安全与密码学工具箱解决方案
  • 环烷基变压器油技术参数解析与场景适配全指南 - 奔跑123
  • 2026高效之选:专业的食品加工压滤机江苏厂家推荐 - 品牌2025
  • 2026年建筑模板、覆膜板与小红板优质厂家甄选指南top5 - 深度智识库
  • Vue Tree List 使用教程:3分钟上手Vue树形组件,轻松构建层级数据界面
  • Giter8高级技巧:掌握条件渲染和动态参数配置的终极指南
  • 内存安全分析与数据提取:Windows进程内存扫描技术在微信数据库解密中的应用
  • 大学生班级|基于SprinBoot+vue的大学生班级管理系统(源码+数据库+文档)
  • 需求跟踪矩阵的定义和作用
  • Aeneas音频文本对齐工具:3分钟实现专业级音画同步的终极指南
  • 如何快速掌握APK逆向:APKToolGUI图形化工具的完整实战教程
  • 2026年北京消杀公司怎么选?A级资质、HACCP合规、零风险保障完全指南 - 企业名录优选推荐
  • 多组学空间分析:肿瘤微环境的临床转化新视角
  • awesome-canvas项目贡献指南:如何成为Canvas开源社区的一员
  • Diamond社区贡献指南:如何参与开源项目开发
  • 如何快速生成黑苹果SMBIOS信息:GenSMBIOS完整指南
  • Octopress版本升级终极指南:从3.0到最新版本的平滑迁移技巧
  • 观察不同时段通过Taotoken调用大模型API的响应速度变化
  • 实验二:Windows下的路由器和xxx服务器和管理