当前位置: 首页 > news >正文

Transformer 理解

一、向量(矩阵)点积(相乘)可以表示相似度

想像一个三维坐标轴,将两个向量点积,如果:

  1. 结果为正:两向量方向一致,相似度高
  2. 结果为 0:两向量垂直
  3. 结果为负:两向量背离,相似度低

二、注意力机制(Q、K、V)理解

(对应图中:E 为 V)

Q:询问谁与我相似(展示自己的特征) K:回答谁与我相似(也展示自己的特征)

如上一,点积是为了寻找相似度,“谁与我更相似呢”

点积越大,代表相似度越高,代表其互相注意度也高,比如 fluffy 和 blue 与 creature

归一化后:

http://www.gsyq.cn/news/1610400.html

相关文章:

  • Speck2f神经形态芯片与低功耗瞳孔追踪系统解析
  • Arm CCA与CAEC:机密计算中的高效内存共享技术
  • NCM音乐文件解锁神器:3分钟极速转换的终极指南
  • 医学图像分割中的域泛化挑战与SRCSM解决方案
  • 如何构建企业级数据集成管道:Pentaho Kettle核心功能深度解析
  • 批量制作门店短视频工具推荐,鹿小云混剪高效拓客
  • 保姆级教程:用群晖Drive+cpolar,把Obsidian笔记库变成你的私有云知识库
  • CrabCode v1.0.9 更新速览!一次集中打磨,体验更清爽!
  • 从GD32VF103到HPM6000:手把手教你选型国产RISC-V单片机(附开发环境清单)
  • 微服务架构迁移:后端团队应该避免的常见陷阱
  • SpringBoot+Vue 旅游出行指南_ms ()abo平台完整项目源码+SQL脚本+接口文档【Java Web毕设】
  • 从零玩转Metasploit Framework:渗透测试核心平台实战指南
  • JDspyder京东抢购脚本:3分钟快速上手指南,轻松实现茅台秒杀自动化
  • Citrix Netscaler高危漏洞CVE-2025-12101:原理、修复与加固指南
  • 量子电路优化:强化学习在NISQ时代的应用与挑战
  • 未来展望:openEuler/easybox路线图与未实现命令的优先支持计划 [特殊字符]
  • 怎样高效使用BallonTranslator:面向新手的深度学习漫画翻译方案
  • 医院信息系统(HIS)
  • 深度学习加速器架构:混合精度计算与张量核心优化
  • 如何配置Kiran会话管理器:从基础设置到高级调优的7个技巧
  • 终极指南:5分钟让PlayStation手柄在Windows游戏上完美运行
  • FPGA稀疏卷积优化:SparsePixels框架解析与应用
  • 新手自动化测试入门:5个精选练手项目与实战框架搭建指南
  • 如何快速检测微信单向好友:5分钟找出谁删除了你
  • Windows 11终极清理指南:5分钟让电脑重获新生
  • 影刀RPA新手教程:大众点评数据采集完全指南——店铺信息、用户评价与竞争对手分析
  • 影刀RPA新手教程:列表完全指南——什么是列表、怎么往里加东西、怎么取出来
  • 告别CMAC!NIST SP800-108新版密钥派生实战:手把手教你用KMAC128/256
  • 【公共云三十问 之一】什么是公共云?
  • 终极指南:Destiny 2 Solo Enabler端口配置完全掌控