当前位置: 首页 > news >正文

Linux awk 数据分析、字段截取实战

一、awk 简介awk 是 Linux文本三剑客之一擅长按列截取、统计计算、格式化输出、日志数据分析默认以空格 / 制表符分割字段处理结构化日志、表格类文本效率极高。核心特点按行读取文本逐行拆分字段处理默认字段分隔符空格可自定义分隔符支持变量、判断、循环、数值运算常用于截取 IP、端口、访问量、服务统计基础语法bash运行awk [选项] 匹配规则{执行动作} 文件名二、内置变量必记$0整行全部内容$1第 1 列字段$2第 2 列字段依次类推NF当前行总字段数NR当前行号FS输入字段分隔符三、常用基础参数-F指定字段分隔符-v自定义外部变量四、基础字段截取实战1. 截取单列、多列bash运行# 只输出第一列 awk {print $1} test.txt # 输出第1列、第3列 awk {print $1,$3} test.txt # 输出整行内容 awk {print $0} test.txt2. 指定分隔符截取文件以冒号、逗号、斜杠分割时用-F指定分隔符bash运行# 以冒号分割取第一列 awk -F: {print $1} /etc/passwd # 以逗号分割截取字段 awk -F, {print $2} data.csv3. 打印行号、字段总数bash运行# 显示行号第一列 awk {print NR,$1} test.txt # 打印每行总列数 awk {print NF} test.txt # 打印最后一列 awk {print $NF} test.txt五、条件匹配筛选1. 匹配包含指定字符串的行bash运行# 匹配包含error的行输出整行 awk /error/{print $0} app.log # 匹配包含root的行输出第一列 awk /root/{print $1} /etc/passwd2. 数值条件判断bash运行# 第二列数值大于100才输出 awk $2100{print $1,$2} num.txt # 等于、小于判断 awk $38080{print $0} port.log3. 区间行筛选bash运行# 只输出5到10行内容 awk NR5 NR10{print $0} test.txt六、格式化输出与拼接自定义输出格式拼接符号、文字bash运行# 拼接字段与文字 awk {print IP:$1,状态:$2} net.log # 固定分隔符输出 awk {print $1|$3|$5} info.txt七、BEGIN、END 预处理与收尾BEGIN{}读取文本之前执行一次END{}读取文本全部结束后执行一次bash运行# 开头打印表头结尾统计总行数 awk BEGIN{print 用户名UID}{print $1,$3}END{print 总计行数:NR} /etc/passwd八、简单统计求和bash运行# 统计第二列所有数值总和 awk {sum$2}END{print 总和sum} score.txt # 统计匹配行数 awk /200/{count}END{print 成功请求数:count} access.log九、生产高频实战案例1. Nginx 日志截取访问 IPbash运行awk {print $1} access.log2. 筛选指定端口连接bash运行netstat -ant | awk $4~/8080/{print $0}3. 过滤空行与注释行bash运行awk !/^#/ !/^$/{print $0} nginx.conf4. 统计在线客户端数量bash运行ss -tn | awk NR1{ip[$5]}END{for(i in ip)print i,ip[i]}5. 多分隔符混合截取bash运行# 同时识别空格、冒号、斜杠作为分隔 awk -F[: /] {print $4} url.log十、三剑客场景区分速记grep单纯筛选匹配行sed批量修改、删除、替换文本awk列截取、统计、计算、结构化数据分析十一、极简命令总结取列awk {print $列数}改分隔符awk -F分隔符条件过滤awk /关键词/{print}数值统计sum$列头尾处理BEGIN{}、END{}
http://www.gsyq.cn/news/1351212.html

相关文章:

  • 【央行金融科技白皮书深度解码】:AI Agent在跨境支付、信贷审批、监管报送三大场景的9项强制性技术基线
  • Linux grep 文本过滤与正则实战——日志筛选、文本匹配神器
  • NotebookLM移动端响应延迟高达2.7秒?揭秘GPU加速未启用背后的架构真相,3步强制优化
  • 别再死磕传统SEO!2026年AI搜索流量爆发,头部GEO公司推荐与转型指南 - 商业科技观察
  • 实测taotoken在不同时段api调用的响应延迟与稳定性表现
  • 巧家县黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 江城哈尼族彝族自治县黄金回收贵金属回收店推荐 联系方式 - 莘州文化
  • SEO老炮儿绝不外传的ChatGPT写作心法(含独家“搜索意图-语义簇-段落权重”三维校准表)
  • TranslucentTB启动失败终极指南:3分钟解决Microsoft.UI.Xaml.2.8缺失问题
  • 别再盲猜了!NotebookLM样本量计算的5步工业级流程,含A/B测试最小样本量速查表(仅限内部团队流通版)
  • 【Veo 2K/4K视频生成终极设置指南】:20年AI视频工程师亲测的8项关键参数调优清单
  • 终极Windows本地语音转文字神器:TMSpeech完全免费离线解决方案
  • 禄丰市黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 晋宁区黄金回收白银回收铂金回收店铺哪家好 靠谱门店推荐 - 莘州文化
  • 施甸县黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 百度智能云部署DeepSeek R1模型(企业级生产环境实录):GPU资源利用率提升217%的5个隐藏参数
  • 2026年5月更新:为何余姚市视迈电子技术有限公司成为高精度温控器可靠之选 - 2026年企业推荐榜
  • AI视频生成革命性突破(Sora 2深度耦合UE5.4技术解密):NVIDIA Omniverse未公开的替代路径已验证
  • 在下不才----android 聊天功能全部逻辑已经跑通了
  • Dism++:你的Windows系统优化瑞士军刀,16国语言支持的免费神器
  • 景谷傣族彝族自治县黄金回收贵金属回收店推荐 联系方式 - 莘州文化
  • KMS_VL_ALL_AIO终极指南:三步永久激活Windows和Office系统
  • 金堂县黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 如何选新疆旅游团?2026年5月推荐五大评测伊犁草原摄影性价比高价格 - 品牌推荐
  • 金阳县黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 瑞丽市黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 锦江区黄金回收白银回收铂金回收店铺哪家好 靠谱门店推荐 - 莘州文化
  • 若尔盖县黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 加印了!谢谢大家,这本不讲空话的“AI落地说明书”为什么能卖爆?
  • Blender 3MF插件:实现CAD到3D打印的无缝转换完整指南