书犹药也,善读可以医愚;久尝其味,便可心如止水

    

服务器出现CPU0:Not Responding 的解决思路


image.png

解决思路

1.使用最小化测试思路,排查是哪颗物理CPU故障

2.经过每一个单CPU进行测试,2颗物理CPU均正常

3.更换主板,排除主板故障;更换主板后单CPU系统正常,两颗物理CPU系统启动失败,显示smpboot: CPU1: Not responding;smpboot,CPU无响应。

4,拔掉所有后背板连接线缆,系统启动正常。

5.反复插拔后背板不同的连接线缆,排查到拔掉USB线缆主机系统启动正常


根因

主机部件最小化测试结果确认主机硬件无问题,CPU 出现这个情况的可能常见原因(不排除其他原因)是因为USB设备接口上接入了含有问题的USB设备,(譬如键鼠的连接线短路等)导致服务器在开机引导时,服务器自检系统在等待CPU响应时,CPU无法正常获取USB设备的状态,导致服务器一直处于等待CPU响应的请求当中,当请求超时时,系统会在屏幕打印出CPUx:Not Responding信息(其中的x代表未响应的CPU的第x核数)。简单讲就是因为后背板外接的USB线缆混电故障,导致物理物理CPU在启动时,无法响应操作系统。从而导致系启动界面报警。


解决方案

更换USB设备或尝试重新插拔,启动正常。


建议与总结

首先要登录BMC管理口查看故障告警以及事件日志记录,如无告警信息的情况下采取最小化测试的方法定位问题。


所有原创文章采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。
您可以自由的转载和修改,但请务必注明文章来源并且不可用于商业目的。
本站部分内容收集于互联网,如果有侵权内容、不妥之处,请联系我们删除。敬请谅解!

添加新评论

icon_mrgreen.gificon_neutral.gificon_twisted.gificon_arrow.gificon_eek.gificon_smile.gificon_confused.gificon_cool.gificon_evil.gificon_biggrin.gificon_idea.gificon_redface.gificon_razz.gificon_rolleyes.gificon_wink.gificon_cry.gificon_surprised.gificon_lol.gificon_mad.gificon_sad.gificon_exclaim.gificon_question.gif

  赞助者打赏名单

未获取到内容,请按照主题指定的格式发布公告或动态内容!

  关于博主

既见君子,云胡不喜,浅喜如苍狗,深爱似长风

  近期评论

  •  安业喜: 我把公网ip地址换成域名,失败了,求恢复原状的方法~
  •  安业喜: 是动态公网ip,支持动态解析后域名添加吗,这样就可以永远不用动ip地址了。
  •  alaivv: 账号链接是不是挂了?打不开了
  •  55289861@qq.com: 非常感谢,我找了很久,你这篇文章很完美。
  •  55289861@qq.com: 感觉感谢,我找了很久。
  •  2: 周一已打赏 未推送订阅地址,还没发给我啊 楼主
  •  2: 已打赏 未推送订阅地址
  •  2: 打赏二维码在哪里?
  •  2: 打赏二维码在哪里?
  •  蹦极不拴绳: 这两个之前运行过,刚才第一条显示成功,第二条显示没有启动服务器服务,这两个运行完了添加还是没有...

很多东西宁缺毋滥,流星的光芒短暂而灼热闪耀。

让你变得更好的那个人,往往是你觉得很难与之相处的那个人。—— by 小宇

觉得自己做的到和不做的到,其实只在一念之间。

路在自己脚下,没有人可以决定我的方向。

你的选择是做或不做,但不做就永远不会有机会。

凡事顺其自然,遇事处于泰然,得意之时淡然,失意之时坦然,艰辛曲折必然,历尽沧桑悟然。