办公室网络变慢?可能是后台程序在偷偷传数据
公司刚开完会,大家一窝蜂连上Wi-Fi,网速立马变得像蜗牛爬。这时候别急着重启路由器,打开Wi-Fi抓包工具比如Wireshark,看看谁在占用带宽。有次我们发现一个同事的备份软件正在自动上传几百兆的设计图,占满了上行通道。关掉它,网页秒开。
服务器响应延迟,从TCP握手开始查起
网站打不开,先别急着说是服务挂了。用tcpdump抓个包,看三次握手有没有完成。如果SYN发出去,没收到ACK,大概率是中间防火墙拦了或者目标端口不通。之前遇到过一次生产环境API调用超时,结果发现是新上的安全组规则没放行443端口,抓包一看,SYN重传三次后直接断了。
APP加载卡顿,手机也能做网络诊断
移动开发团队常碰到用户反馈“点按钮没反应”。让测试人员用Charles代理手机流量,所有请求一目了然。有一次发现某个图片资源死活加载不出来,原来是CDN节点异常返回了502,但APP没做错误提示,用户以为卡死了。定位到问题后,加上降级逻辑,投诉立马少了。
跨地区访问不稳,用MTR定位瓶颈点
分公司在上海,总部在北京,视频会议老是卡顿。ping延迟不高,但画面断断续续。换成MTR工具跑一下,发现第7跳的运营商线路丢包严重。拿着报告找ISP交涉,对方很快调整了路由策略。MTR结合了ping和traceroute,能清楚看到每一跳的延迟和丢包情况。
mtr -r -c 10 www.shanghai-office.com内部系统突然无法访问,DNS可能是元凶
某天早上,财务系统打不开,但外网正常。怀疑是DNS解析出问题,用dig命令查一下记录:
dig @192.168.1.1 finance.internal.company.com发现返回空应答。检查内网DNS服务器配置,原来是昨晚更新区域文件时少了个分号,导致整个zone加载失败。修好语法,重启服务,系统立刻恢复正常。
别只盯着设备状态灯,流量才是真相
交换机指示灯绿油油一片,不代表网络就健康。有个项目上线后总出问题,监控显示设备CPU不高,接口也没错包。后来用sFlow采样看了真实流量,才发现大量广播风暴来自一台老旧打印机,它不断发送ARP请求,拖垮了整个VLAN。换设备前,没人想到问题是它。