MCU单板或者整机(反复)重启、挂死。
重启、小系统、web无法登录、会场挂断、MCU离线
排查思路如 图1 所示。
本问题涉及MCU单板的工作状态方面的问题,排查的大致方向如下:
总体原则为“先定界,再定位”,排查全景图如图2-11所示。
图2MCU单板重启排查全景图
导出MCU的日志信息,在O类日志中查找reboot,看是否存在人为重启操作记录。
人为重启示例为web用户admin重启了该MCU。
半夜鸡叫示例:
根据MCU的额定功率、以及MCU的输入电源、插排的电源供电能力比对,是否存在电源供电功率不足的情况。
先通过断网测试确认是否可以正常加载,如果不能正常启动,则对网口镜像抓包来确认(此处的抓包最好是镜像抓包,MCUweb界面的抓包无法获取到全部的报文,可能导致问题判断不准确)。
以上四种情况的故障均需要通过交叉互换硬件的方式进行验证,将其他正常单板的CF卡、NP扣板、DSP、底板进行互换测试,达到确认是那个部件的故障的目的。
表1 现有局点案例
局点 |
问题描述 |
问题根因 |
解决措施 |
---|---|---|---|
局点1 |
MCU异常重启 |
SSH攻击造成MCU异常 |
在MCU的web界面将SSH服务关闭。并且找到攻击的源头,在防火墙上进行屏蔽。 |
局点2 |
MCU异常重启 |
插排的额定功率不足,导致MCU在会议过程中重启 |
整改机房内插排的连接,保证MCU的电源供电。 |
相关推荐
解决方案更多>