IP测量探索(七)——利用交换机检查IP系统状态

大家好,很高兴又见面了,相信这个系列能读到这里的都是本公众号的资深粉丝了,感谢大家一直以来的支持。前面我们用三期介绍了2110系统中的各项IP指标,希望大家对这些指标有一定了解。今天我们换个角度,通过交换机上的状态显示,辅助我们查看网络情况,检查IP系统是否出现了问题。本期的主要内容有:

  • 交换机信号转发原理简析
  • 哪些信息用来检查交换机的状态
  • 哪些信息用来检查网络连接状态
  • 确认系统连通性时需要检测哪些内容
  • 交换机的同步状态如何查看

1 交换机在IP系统中的重要性

1.1 交换机在IP系统架构中的作用

如下图是一个专业媒体制作领域IP系统架构实例,可将交换机的作用类比SDI时代的大型矩阵,可以看出交换机在专业媒体系统中已然成为了架构中的核心:

相较于矩阵,IP交换机的一点区别是所有实时IP信号,以及PTP同步均需要进入交换机,且由交换机进行信号分发,而矩阵往往只收录部分信号。

1.2 交换机信号转发原理简析

交换机对于信号的转发方式,可以根据其所处的OSI模型中的位置,来简单区分为两个过程:

图103 OSI七层模型

  • 二层交换:

交换机自诞生之初就是为了解决二层信号交换的问题,这也是交换机名称的由来。对于工作在OSI第二层(数据链路层)的交换机,其信号本身在交换机内部会根据设备MAC地址直接进行转发,发送端和接收端知道双方的MAC地址即可。

图104 二层交换机信号交换

而由于网络中常用三层的IP地址进行寻址,因此对于跨局域网的三层信号交换则需要在二层交换机的基础上增加一个三层路由器,从而实现路由的功能。

  • 三层路由:

随着以太网技术的发展,交换机仅二层的功能已经逐渐不满足复杂组网的需要,因此出现了将交换机和路由器合二为一的三层交换机,此时交换机本身即可实现信号路由的功能:

图105 二三层交换机混合组网架构

可以看出,在专业媒体制作领域的IP系统中,IP交换机扮演着一个十分核心的作用,因此交换机的基本状态、交换机中IP信号的状态、以及交换机同步状态等信息对系统运行状态检测十分关键。

2 确认交换机状态时需要检测哪些信息

2.1 检查交换机配置

若需要快速了解系统状态,需首先检查交换机配置信息,以确认交换机配置等情况是否正常,这里以华为为例:

  • display current-configuration | no-more:

图 106 检查交换机配置

2.2. 检查交换机温度

现有系统中交换机由于功耗大,发热大,因此其散热情况很受考验,尤其在转播车等空间较为紧张的区域格外需要关注温度情况,以华为为例:

  • display health | no-more

图107 检查交换机温度

其中current为当前温度,需注意不能超过major一项的警告温度。

2.3 检查交换机固件版本

交换机不同版本之间也有可能产生性能差异,因此在系统中还需要确认交换机版本以及补丁等信息。以华为为例:

  • display version | no-more

图108 检查交换机版本

如上图即可得知交换机软件版本为V200R005C10SPC800,patch为V200R005SPH012。

2.4. 检查交换机CPU占用

若交换机出现广播风暴等负载压力过大的情况,有可能导致交换机CPU过载,系统瘫痪,此时需关注交换机CPU占用信息。以华为为例:

  • display cpu | exclude 0%

图109 检查交换机占用

如上图即可看到交换机当前占用,历史占用,以及最大占用率和最大占用率出现的时间,以协助系统排查。

2.5 获取交换机诊断日志(常提供给厂商分析)

交换机厂商的诊断信息获取均有一套固定命令,以华为为例:

  • display diagnostic-information diag.txt
  • diagnose
  • collect diagnostic information

运行该命令耗时很长,可以获取到交换机的各类日志,状态等信息,建议在厂商指导下进行,运行完成后导出diag.txt文件即可。

3. 确认设备连接状态时交换机需要检测哪些信息

3.1 端口简略状态

设备连接到交换机时,首先需确认交换机端口连接状态,包括端口链路通断,端口占用等,此时可以利用交换机进行检测。以华为为例:

  • display interface brief

图110 检查交换机端口状态

如上图UP为端口连接状态,输入输出为端口带宽使用率,还可以看到端口输入输出的报错计数。

3.2 端口数据包统计

针对端口收发的数据包,还可以展示交换机的端口统计数据。以华为为例:

  • display interface counters 25GE 1/0/1

图111 检查交换机端口计数

如上图即为端口当前输入输出的组播,单播数据包计数,字节数等信息。

3.3 端口丢包信息统计

针对端口是否发生丢包以及报错,还可以利用交换机进行查询。以华为为例:

  • reset interface counters 25GE 1/0/1
  • display interface 25GE 1/0/1 | no-more

图112 检查交换机端口丢包

如上图即可看出当前端口不存在报错信息,且丢包数为0,若有报错等信息需检查端口物理连接,配置等情况。

3.4 端口光模块连接信息

现有交换机常使用光纤光模块进行连接,此时端口物理层连接状态可以在交换机中查看,当模块光纤出现故障时,常用来查看光功率等信息。以华为为例:

  • display interface 25GE 1/0/1 transceiver verbose | no-more

图113 检查光模块信息

如上图即可看到交换机该端口光模块供应商为Huawei,RX光功率为-0.05dBm,TX光功率为0.57dBm,均未超出或低于警告值。若检测出来发现超过或低于警告值需检查物理链路以及硬件情况。

3.5 MAC地址信息

设备连接到端口后,其MAC地址会告诉交换机以进行二层数据交换,此时查询交换机MAC地址表即可知道设备是否正确连接到相应端口。还可用来查看交换机是否有冲突的MAC地址,若有冲突则很有可能发生了系统环路。以华为为例:

  • display mac-address | no-more

图114 检查MAC信息

如上图可看到交换机每个端口报告的MAC地址,若有相同的MAC地址出现在不同端口则系统有可能产生环路,需要排除,以防链路中断。

4 确认系统连通性时交换机需要检测哪些信息

4.1 Ping检测

由于现阶段我们实际使用的多为三层混合组网架构,因此三层IP的互通直接影响了系统是否正常连通,此时常用Ping命令去检测设备和交换机的正常连接。以华为为例:

  • Ping 10.110.10.254

图115 Ping检测

如上图即为在交换机ping 10.254这一地址,可以正常互通没有丢包,且延时量很低且稳定。若系统出现无法ping通需要互通的地址或ping延时较大,需检查物理链路和交换机配置。

4.2 Arp检测

若系统中出现IP地址冲突时,可能常见某一地址时通时不通,常可利用Arp信息检测三层IP和二层MAC地址之间的对应关系。以华为为例:

  • display arp

图116 检查交换机arp表

如上图即为不同IP地址对应的MAC地址及报告该IP地址的端口,若同一IP地址对应不同的MAC地址,出现在不同的端口,则有可能系统中存在地址冲突,此时需要检查设备配置。

4.3 Stp检测

若系统中出现STP环路时,可能常见某一端口连接正常但是数据功能被禁用,无法传输任何数据包,此时可以利用交换机STP命令进行检测:

以华为为例,若某一端口为discard状态,则需要检测系统是否发生环路:

  • display stp brief

图117 检查交换机环路信息

如上图即可看到交换机各个端口的STP角色均为DEST,且状态都是正常转发状态。若系统中出现端口状态为discard阻止状态,则需要检查系统环路情况。

4.4 组播igmp snooping信息检测

检查系统二层组播信号是否正常传输,可以在交换机进行检测:

以华为为例,紫色即为当前端口收到的IP流,如此IP流即为PTP:

  • display igmp snooping group interface 25GE 1/0/1 vlan 21| no-more

图118 检查组播igmp snooping情况

如上图即可看到该端口该VLAN下存在224.0.1.129的PTP组播流,且已经传输5小时30分钟。

4.5 组播接收状态检测

检查交换机是否正常收到组播流,可以在交换机进行检测。以华为为例:

  • display multicast routing-table

图119 交换机组播路由表信息截图

图120 检查交换机组播接收状态

如上图即可看到设备192.168.99.199发送了,224.0.1.129的PTP组播流到vlanif 10虚拟端口,downstream一项则可以看到该组播流分发到了其他各个vlanif端口。

4.6 端口镜像检测

有时系统中某一设备发送和接收IP流的信息常无法直接检测,此时可以利用端口镜像,将被测设备的端口镜像到检测设备的端口,以检查设备是否正常收到组播流。以华为为例:

  • observe-port 1 interface 25GE 1/0/11
  • interface 25GE 1/0/7
  • port-mirroring observe-port 1 inbound
  • port-mirroring observe-port 1 outbound

图121 端口镜像检测

如上图,将25G 1/0/7端口输入输出均映射到25G 1/0/11端口,在7端口接上被测设备,在11端口接上测试设备,即可检测被测设备的收发IP流状态。

5 确认交换机同步状态时需要检测哪些信息

5.1 PTP状态检测

由于现有系统中交换机已经成为PTP分发的重要一环,因此检查交换机的同步状态可以帮助我们迅速确认系统状态,如交换机可检测每个开启PTP的端口当前的状态,domain等信息。以华为为例:

  • display ptp all | no-more

图122 PTP状态检测

如上图,可发现此时交换机100G端口1为从上游同步的端口,其他端口向下游分发,其中100G的49、52端口PTP状态为失败,需确认和系统设计架构是否一致,若不一致则说明系统PTP链路出现异常。

5.2 PTP上级时钟检测

由于交换机常从上游时钟同步PTP,并向下游发送,此时需检测交换机上游锁定的情况。以华为为例:

  • display ptp all | no-more

图123 检查交换机PTP上级时钟

如上图,即可看到交换机上游时钟的CLOCK ID、优先级等信息,且交换机当前锁定状态正常。如和系统设计同步架构、系统实际主时钟信息不一致,则需要检查PTP链路。

5.3 PTP数据包检测

另外由于PTP是利用数据包进行分发,因此可以检查交换机是否正常传输PTP数据包。以华为为例:

  • reset ptp statistics interface 25GE 1/0/1
  • display ptp interface 25GE 1/0/1

图124 检查交换机PTP数据包

如上图即可发现25G端口1正常接收和发送的PTP各类报文数量,重新检测一下需看到报文数量按照预定频率正常增长,若出现PTP报文数量异常则需要检查配置和PTP传输链路。

6 命令汇总

由于交换机品牌不同其各类命令也不一样,这里还总结了HUAWEI、CISCO、ARISTA三家交换机的常用检测配置,以便快速查阅:

表6 检查交换机配置

总结:

希望通过本期内容,让大家有一个新的角度来看待IP系统。交换机检测信息较多,需关注的要点也根据系统情况略有不同,以上仅是笔者的一些实践经验,难以涵盖实际系统中的各个情况,我们也是在不断的摸索中,还请各位不吝赐教,一起讨论,一起进步。

下期我们将介绍使用wireshark软件,通过分析数据包的情况,来检查IP系统的状态。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注