当前位置: 首页 > news >正文

CANN/asc-devkit:asc_prelu函数文档

asc_prelu

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

源操作数src0大于0的情况下直接将src0写入目的操作数dst,否则将src0 * src1的结果写入dst。计算公式如下:

$$ dst = (src0 > 0) ? src0 : src0 * src1 $$

函数原型

__simd_callee__ inline void asc_prelu(vector_float& dst, vector_float src0, vector_float src1, vector_bool mask) __simd_callee__ inline void asc_prelu(vector_half& dst, vector_half src0, vector_half src1, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src0输入源操作数(矢量数据寄存器)。
src1输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_half dst; vector_half src0; vector_half src1; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src0, src0_addr); // src0_addr是外部输入的UB内存空间地址。 asc_loadalign(src1, src1_addr); // src1_addr是外部输入的UB内存空间地址。 asc_prelu(dst, src0, src1, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1343055.html

相关文章:

  • RISC-V异构计算中任务卸载优化与多播技术实践
  • 如何扩展TwicketSegmentedControl:自定义布局与动画效果
  • ARM服务器设备直通实战:从SMMUv3到VFIO的完整指南
  • 别再只会import了!用Python的importlib实现插件化架构(附完整代码)
  • 保姆级教程:用ArcGIS Pro搞定全国30米DEM数据下载与无缝拼接(附避坑指南)
  • FLUX.1-dev FP8量化模型:让中低端显卡流畅运行AI绘画的完整解决方案
  • Airflow Maintenance Dags高级配置指南:变量管理、调度优化与邮件告警
  • Marginalia代码实现原理:深入理解SQL查询注释的内部工作机制
  • Tensor Comprehensions高级特性:多GPU支持和内核重用策略的终极指南
  • CANN/asc-devkit Ascend C矢量压缩API
  • KaTrain围棋AI:如何用数据可视化与智能分析重塑围棋学习体验
  • Linux调度器演进:从O(1)到CFS再到EEVDF
  • 交易所技术三重门:吞吐量、安全性与合规性的不可能三角破解之道
  • Keypatch兼容性指南:从IDA 6.4到7.5的完美运行
  • 范戴克印相在AI时代的重生:基于CIE LAB色彩空间校准的Midjourney --raw参数深度优化方案(附实测ΔE<1.3数据报告)
  • image.nvim高级功能:虚拟填充、窗口重叠处理完全解析
  • 从零开始:用Rufus打造你的万能系统启动盘
  • CryptoJS 加密库完整指南:5个核心功能深度解析
  • 开源数字微流控实验室平台:用电场操控微观世界的革命性技术
  • VSCode 远程开发插件 WSL 与 SSH 模式区别是什么
  • OpenHTMLtoPDF终极指南:三步实现专业PDF文档生成
  • 【Midjourney扁平化风格实战指南】:零基础3步生成高转化UI图标,设计师私藏Prompt库首次公开
  • Lemur性能优化:10个提升证书管理平台响应速度的技巧
  • 软件研发 --- 应知应会 之 什么是云计算开发
  • 3步搞定歌词管理难题:LDDC歌词下载工具的完整实战指南
  • image.nvim配置详解:10个关键参数优化技巧
  • Vue-antd样式系统深度解析:从主题定制到组件样式覆盖的完整指南
  • feh图像查看器:快速轻量的Linux命令行图片浏览神器终极指南
  • 5月必看!央国企求职咨询机构优质推荐,央国企求职全流程服务/大学生就业规划/国企笔试面试培训,央国企求职咨询公司推荐 - 品牌推荐师
  • CANN/pypto张量创建指南