网络故障被甩锅时,怎么稳住局面,把问题查清楚
做网络这行,最让人无语的事情之一,不是设备坏了,也不是链路抖了,而是故障一来,第一句话往往不是“哪里出问题了”,而是“先看看是不是网络”。
这时候,很多人会急着解释,急着证明自己没问题,结果越说越乱,最后问题还没解决,自己先把节奏丢了。
其实,遇到这种情况,最重要的不是争辩,而是稳住。网络故障本身就很容易牵扯到多个环节,真正厉害的网络工程师,不是嘴上赢,而是能把问题拆开,让事实说话。
第一步,先把时间线捋清楚。
故障是什么时候开始的,影响了哪些业务,是全部用户都受影响,还是只是一部分人出问题,这些信息一定要先问清。很多时候,领导和同事说“网络慢了”,其实他们描述的是结果,不是现象。你要做的,是把模糊的说法变成可验证的信息。比如,是网页打不开,还是登录慢,是内网慢,还是外网慢,是固定时段发生,还是随机出现。时间线越清楚,排查方向就越准。
第二步,先看影响面,再看设备。
网络故障不是一上来就盯着交换机、路由器、防火墙猛查,而是先判断是单点问题,还是面的问题。如果只是某一个部门出问题,优先看接入口、终端、VLAN、端口状态、ARP、MAC 学习这些地方。如果是一大片业务都异常,那就要看核心链路、网关、路由、出口、策略和上联设备。
这个思路很重要,因为它能帮你快速缩小范围,也能避免在不相关的地方浪费时间。
第三步,别光看设备在线,还要看业务是否真的通
