• 05-122021
  • 网络里有两个路由器有多可怕?医院IT亲历电话

    <<返回
    某天早晨被医院IT紧急叫醒,说医院电话系统故障,一个重要电话无法与另外院区联通。
    这家医院采用简捷通信的异地电话组网服务,将两个院区的部分电话(包括值班电话和客服电话)进行了整合,部分号码实现”一号多机“,两院区沟通比较方便。
    当然,这个组网的功能就是通过网络来实现的——网络现在已经成为电话沟通的基础。
    电话故障的排查,我们发现大部分电话机的工作都是正常的,IPPBX也没有异常日志。在排除设备故障之后,将重点方向放在网络上。
    第一步,就是抓取数据包进行分析。抓包分析显示,SIP电话数据有发包,没有收包。IPPBX电话交换机数据没有收到相关的数据包。而奇怪的是,SIP电话机和IPPBX电话交换机都能正常上互联网。
    第二步,进一步缩小排查范围,将重点放在SIP电话机到网络交换机和路由器这一端。根据Traceroute结果,数据的第二跳,居然是一个XX.XX.XX.1的网关,而本医院的网关,应该是XX.XX.XX.254,那么XX.XX.XX.1是怎么来的呢?
    第三步,追踪网关。医院IT分析认为,这个网关是一个未知的路由器设备。这个未知路由器和医院的主路由器都提供DHCP服务和网关服务。这个未知路由器拦截了某些类型的数据包,比如IP电话机的Invite注册数据包(也可能是不知道如何再转发)。
    IPPBX电话交换机穿透服务

    思路和解决方案

    很显然,如果要在一个大型三甲医院里查找一个偶然出现的路由器设备,是很艰巨的任务。 医院有好几栋楼,其中一栋还是几十层的高楼,几百个楼层交换机,数千个信息点。每个信息点都有嫌疑。
    而搞乱这样一个网络,则非常简单,成本还非常低。随便买一个几十元的路由器,接到医院局域网里,就能把网络DHCP服务搞乱了,如果同时接两个网口上来,还能引发一场网络风暴。
    什么?网络还有风暴?是的,广播包在局域网网内大量复制和传播,大量数据帧无序流动,导致网络性能急剧下降,甚至网络瘫痪。—— 这种现象,就叫做“网络风暴”!
    怎么解决呢?我们选择了回避主要矛盾,先扫好门前雪。
    解决办法
    IP网络电话机座机的网络设置,从原来的DHCP自动获取方式,改成静态IP地址,设置正确的子网掩码、网关和DNS解析。该电话机恢复正常。

    思考

    实际上,我们在使用说明书和产品介绍里,也或多或少地介绍了我们对局域网组网的一些简单建议。其中一个建议就是局域网内的每个网络设备都规划和分配静态IP地址。如果每个网络设备都有固定IP地址,那么在以后的管理、维护的时候,是不是就比较容易溯源了呢?

    那为什么我们的工程师或者客户的IT技术就没有做静态IP地址?
    实际上就是因为DHCP非常容易使用,而静态IP则需要多做一些繁琐工作。
    古话说“多易必多难”,意思是,容易的,必定困难多多。辩证法,与君共勉。