书犹药也,善读可以医愚;久尝其味,便可心如止水

    

服务器出现CPU0:Not Responding 的解决思路


image.png

解决思路

1.使用最小化测试思路,排查是哪颗物理CPU故障

2.经过每一个单CPU进行测试,2颗物理CPU均正常

3.更换主板,排除主板故障;更换主板后单CPU系统正常,两颗物理CPU系统启动失败,显示smpboot: CPU1: Not responding;smpboot,CPU无响应。

4,拔掉所有后背板连接线缆,系统启动正常。

5.反复插拔后背板不同的连接线缆,排查到拔掉USB线缆主机系统启动正常


根因

主机部件最小化测试结果确认主机硬件无问题,CPU 出现这个情况的可能常见原因(不排除其他原因)是因为USB设备接口上接入了含有问题的USB设备,(譬如键鼠的连接线短路等)导致服务器在开机引导时,服务器自检系统在等待CPU响应时,CPU无法正常获取USB设备的状态,导致服务器一直处于等待CPU响应的请求当中,当请求超时时,系统会在屏幕打印出CPUx:Not Responding信息(其中的x代表未响应的CPU的第x核数)。简单讲就是因为后背板外接的USB线缆混电故障,导致物理物理CPU在启动时,无法响应操作系统。从而导致系启动界面报警。


解决方案

更换USB设备或尝试重新插拔,启动正常。


建议与总结

首先要登录BMC管理口查看故障告警以及事件日志记录,如无告警信息的情况下采取最小化测试的方法定位问题。


所有原创文章采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。
您可以自由的转载和修改,但请务必注明文章来源并且不可用于商业目的。
本站部分内容收集于互联网,如果有侵权内容、不妥之处,请联系我们删除。敬请谅解!

添加新评论

icon_mrgreen.gificon_neutral.gificon_twisted.gificon_arrow.gificon_eek.gificon_smile.gificon_confused.gificon_cool.gificon_evil.gificon_biggrin.gificon_idea.gificon_redface.gificon_razz.gificon_rolleyes.gificon_wink.gificon_cry.gificon_surprised.gificon_lol.gificon_mad.gificon_sad.gificon_exclaim.gificon_question.gif

  关于博主

既见君子,云胡不喜,浅喜如苍狗,深爱似长风

  近期评论

  •  luo: netstat -ano|findstr "445" 执行到这里,没有看到...
  •  djccmhz: 在Linux下使用 -p 选项指定端口号的方式直接公网访问samba服务,安卓也可以使用npl...
  •  尘世美: 博主你好 这个修改完后可逆吗 我想恢复成原来的样子 对代码一点也不懂 能不能教我一下...
  •  Nathan: 在smb端前端做个nginx的upstream,指定同一个ip:port下的不同路径代理到后段...
  •  Nathan: 暂时无解
  •  XuJoe: 博主 我按照说的 成功了 ,但是 我现在有多个smb服务器 都想映射到常用PC中 127.0....
  •  无名管理员: 换个账号呗,肯定是你太频繁被检测了呗,不过这个程序不太好,你自己可以再优化下后使用,如果还有问...
  •  aaaaa: 你好,预约座位有时候会提示”证件因违章已被禁止预约”。你知道是为什么吗
  •  尘世美: 如果可以教一下如何使用域名绑定那就太完美了
  •  AEGE: 好

快乐地过是一天,不快乐地过也是一天,我为什么不快快乐乐地过每一天呢?

岂能尽随人愿,但求无愧我心。

在你内心深处,还有无穷的潜力,有一天当你回首看时,你就会知道这绝对是真的。

活在当下,别在怀念过去或者憧憬未来中浪费掉你现在的生活。

挫折时,要像大树一样,被砍了,还能再长;也要像杂草一样,虽让人践踏,但还能勇敢地活下去。