当前位置: 首页 > news >正文

CANN/asc-devkit Crd2Idx函数

Crd2Idx

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

Crd2Idx函数用于将多维坐标(Coordinate)通过布局(Layout)转换为内存位置索引(Index),这里的Layout包含了Shape和Stride信息。

对于一个布局Layout,其Shape为(d0, d1, ..., dn),Stride为(s0, s1, ..., sn),Coordinate为(c0, c1, ..., cn)到线性索引Index的转换公式为:

例如,对于Shape (3, 4, 5),Stride (20, 5, 1)和Coordinate (1, 2, 3):

维度0:c₀ * s₀ = 1 * 20 = 20 维度1:c₁ * s₁ = 2 * 5 = 10 维度2:c₂ * s₂ = 3 * 1 = 3 Index = 20 + 10 + 3 = 33

当Coordinate维度和Stride维度不相同时,可以采用去线性化(delinearize)的方法,使得Coordinate维度和Stride维度相同,再使用上述公式计算得到最终结果。

去线性化的方法介绍如下:对于一个n维数组,形状为(d0, d1, ..., dn),线性坐标c对应的多维坐标(c0, c1, ..., cn),可以通过以下公式进行转换:

例如:对于Shape ((2, 4), (3, 5)),Stride((3, 6), (1, 24)),Layout((2, 4), (3, 5)) : ((3, 6), (1, 24)),Coordinate(11, 12),按照列优先原则,Crd2Idx的结果为:

crd2idx = delinearize(11, 12) * stride = ((11 % 2, 11 / 2), (12 % 3, 12 / 3)) * ((3, 6), (1, 24)) = ((1, 5), (0, 4)) * ((3, 6), (1, 24)) = 1 * 3 + 5 * 6 + 0 * 1 + 4 * 24 = 129

总结上述过程,计算公式如下:

其中(d0, d1, ..., dn)为Shape,(s0, s1, ..., sn)为Stride,delinearize公式展开如下:

函数原型

// Layout输入,Coordinate转换为Index template <typename T, typename U, typename S> __aicore__ inline constexpr auto Crd2Idx(const T& coord, const Layout<U, S>& layout) // Shape和Stride输入,Coordinate转换为Index template <typename T, typename Shape, typename Stride> __aicore__ inline constexpr auto Crd2Idx(const T& coord, const Shape& shape, const Stride& stride)

参数说明

表 1模板参数说明

|参数名|描述| |--|--| | T | 张量坐标coord类型 | | U/Shape | 张量逻辑形状shape类型 | | S/Stride | 张量步长stride类型 |

表 2参数说明 | 参数名 | 输入/输出 | 描述 | |--------|----------|------| | coord | 输入 | Std::tuple结构类型,用于表示张量在不同维度上的坐标值。
输入的数据类型支持size_t和Std::Int。 | | layout | 输入 | 输入的Layout对象。
输入的数据类型支持Layout类型。 | | shape | 输入 | Std::tuple结构类型,用于定义数据的逻辑形状,例如二维矩阵的行数和列数或多维张量的各维度大小。
输入的数据类型支持size_t和Std:Int。 | | stride | 输入 | Std::tuple结构类型,用于定义各维度在内存中的步长,即同维度相邻元素在内存中的间隔,间隔的单位为元素,与Shape的维度信息一一对应。
输入的数据类型支持size_t和Std::Int。 |

返回值说明

返回根据Coordinate信息转换之后的索引值。

约束说明

输入参数需满足对应的数据类型要求。

调用示例

using namespace AscendC::Te; // Layout形式入参计算索引值 constexpr int M = 11; constexpr int N = 12; constexpr int blockM = 13; constexpr int blockN = 14; auto coord = MakeCoord(AscendC::Std::Int<20>{}, AscendC::Std::Int<30>{}); auto shape = MakeShape(MakeShape(AscendC::Std::Int<blockM>{}, AscendC::Std::Int<M/blockM>{}), MakeShape(AscendC::Std::Int<blockN>{}, AscendC::Std::Int<N/blockN>{})); auto stride = MakeStride(MakeStride(AscendC::Std::Int<blockN>{}, AscendC::Std::Int<blockM*blockN>{}),MakeStride(AscendC::Std::Int<1>{}, AscendC::Std::Int<M*blockN>{})); auto layout = MakeLayout(shape, stride); auto index = layout(coord); // decltype(index)::value = 590 index = Crd2Idx(coord, layout); // decltype(index)::value = 590 // Shape和Stride形式入参计算索引值 auto blockCoordM = AscendC::Std::Int<11>{}; auto blockCoordN = AscendC::Std::Int<12>{}; auto baseShapeM = AscendC::Std::Int<13>{}; auto baseShapeN = AscendC::Std::Int<14>{}; auto basestrideM = AscendC::Std::Int<15>{}; auto basestrideN = AscendC::Std::Int<16>{}; auto coord = MakeCoord(AscendC::Std::Int<0>{}, blockCoordN); auto shape = MakeShape(MakeShape(baseShapeM, baseShapeM), MakeShape(baseShapeN, baseShapeN)); auto stride = MakeStride(MakeStride(basestrideM, basestrideM), MakeStride(basestrideN, basestrideN)); auto index = Crd2Idx(coord, shape, stride); // decltype(index)::value = 192

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1345212.html

相关文章:

  • LeetCode 27 · 移除元素:双指针的两种打开方式
  • 如何在Linux系统上运行SOLIDWORKS:跨平台CAD解决方案
  • 如何一键管理数千首歌曲的同步歌词?智能字幕生成工具LRCGET深度解析
  • 免费开源乐谱识别神器:10分钟将纸质乐谱转为可编辑数字格式的终极指南
  • Amphenol ICC MSPEC2L0BC010 线束组件应用与兼容替代分析
  • 技术人的时间管理:高效利用每一天
  • 从零开始在Python项目中接入并使用Taotoken管理API调用
  • 抖音无水印视频下载神器:douyin-downloader开源工具完全指南
  • 如何用N_m3u8DL-CLI-SimpleG轻松下载加密M3U8视频:免费图形界面完整教程
  • 实战OpenAI API认证:深度解析API密钥与OAuth2.0的最佳实践方案
  • Windows 11 LTSC版终极解决方案:三分钟恢复完整Microsoft Store体验
  • 终极指南:如何在OBS Studio中免费使用VST插件实现专业级音频处理
  • 3个12位ADC+17个定时器+摄像头接口:STM32F207IGT6的电机控制与机器视觉资源
  • Airflow Maintenance Dags:7个关键维护工作流彻底解决Airflow运维难题
  • benchmark-ips深度解析:如何精准测量Ruby代码性能
  • 强力中文聊天语料库:一站式解决AI对话系统数据难题
  • 基于浏览器锁定的 CypherLoc 恐吓软件攻击机理与防御研究
  • 5分钟掌握WeKWS:打造智能设备的语音唤醒终极指南
  • 长沙写真推荐,按这4个标准选不会踩坑 - 麦克杰
  • 如何解决黑苹果USB端口识别问题:USBInjectAll内核扩展完整指南
  • ToolsFx密码学工具箱:一站式解决你的数据安全与编码转换需求
  • 如何用ESP32制作你的专属开源智能手表:DIY终极指南
  • Flet媒体处理实战指南:轻松构建音频视频播放应用
  • Asimov支持的开发依赖类型详解:从Node.js到Python、Go、Rust全覆盖
  • Unity AI Chat Toolkit:5分钟打造智能对话应用的终极指南
  • Windows iPhone网络共享驱动:一键安装苹果驱动,告别设备管理器黄叹号!
  • 百度网盘限速破解终极指南:baidu-wangpan-parse免费高速下载完整教程
  • 告别繁琐操作:3分钟学会精准下载GitHub任意文件或文件夹
  • SpaceX冲刺2万亿估值IPO,93%价值竟将来自AI?
  • 如何定义AI Agent的权限