当前位置: 首页 > news >正文

大语言模型基本了解

大语言模型有四个基本能力:
1、语言理解能力,能理解人类所描述的问题
2、语言生成能力,能对人类提出的问题提供一个符合人类正常阅读习惯答案
3、多轮对话管理能力,面对正常连续发问的情况下,给出的答案不会前言不搭后语
4、一定的逻辑推理能力,在训练时数据编织了知识,具备了一定的推理能力
大语言模型本质上就是对下一个单词的的预测,既然是预测那就是概率问题,这必然导致一定程度
上的胡说报道,也是我们常说的幻觉问题

基础的数学知识:
矩阵:
m行n列矩阵或者m*n矩阵
矩阵加减法,矩阵乘法,常数与矩阵的乘法,矩阵的转置
向量的加减法,向量的转置,向量的乘法,向量内积运算的含义

随机变量:离散随机变量,连续随机变量

数学期望:随机变量平均值的反应
方差:随机变量与其数学期望之间的偏离程度

http://www.gsyq.cn/news/30796.html

相关文章:

  • 标签打印服务系统详细设计与实施文档
  • Transformer基本结构介绍
  • 20232427 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • (第七次)tensorflow与keras
  • (第六次)聚类和神经网络
  • [java 锁]
  • 深入解析:windows输入法中英切换(英文提示)ALT + SHIFT切换(搜狗输入法CTRL+SHIFT+E切换)英文键盘
  • 部分思维题
  • 别再踩坑!真正有效的最佳免费数据恢复软件,亲测能救
  • rent8_wechat 微信消息提醒设置教程 - 详解
  • Titanic轮船人员生存率预测
  • 自行搭建了几个AIGC小站点,可结合接口平台使用
  • Linux 内核空间 并发竞争处理 共享资源线程同步 - 实践
  • 【轨物方案】变频器物联网软硬件一站式解决方案 - 详解
  • 人工智能初了解
  • Hbase分布式数据库
  • MapReduce并行计算框架
  • Wyn 商业智能软件:3D 可视化大屏搭建与设备利用全指南
  • 什么是Java Lambda
  • Java 代理
  • 《算法与数据结构》第七章[算法2]:广度优先搜索(BFS) - 指南
  • 中转API为什么比官方更便宜?AI中转站成本揭秘
  • Java 混合编程
  • Java 语法糖
  • 纸笔群群友命题乱做
  • 本人对KMP如何匹配到所有结果的算法存在一些疑惑...
  • 完整教程:京东100道GO面试题及参考答案(上)
  • Ubuntu 系统 /dev/sdb2(RAID 关联磁盘)挂载操作手册
  • 解决 Windows 下 Claude 通过 cmd/powershell 运行出错失去响应的问题
  • 25.10.25随笔NOIP模拟赛总结