VNX/CLARiiON Dial Home常见错误代码 问题:磁盘分区 故障现象: VNX/CLARiiON Dial Home有哪些常见错误代码?.解决方案: 案例1:Storage Processor dials home‘7403’事件代码 这是一个比较常规的错误,但它本身无法说明问题的缘由。该事件表明存在SP故障,只有Unisphere中的告警或分析SPCOLLECT才是找出问题根源的关键。检查该问题需要两边SP的SPCOLLECT,且必须在问题发生之后采集(确保包含问题事件),随后上传日志到Service Center或powerlink。关于如何获取SPCOLLECT,请查看:如何使用SP Collect收集CLARiiON的SP日志以提高问题诊断的效率 案例2:Storage Processor dials home‘20c0’事件代码 该事件说明SP正忙,无法响应至少一个严重事件。它是一个超时事件,通常和SP重启有关。该事件本身无法说明问题的缘由。只有Unisphere中的告警或分析SPCOLLECTS才是找出问题根源的关键。检查此问题需要两边SP的SPCOLLECT,必须在问题发生之后采集(确保包含问题事件),随后上传日志到Service Center或powerlink。 案例3:Storage Processor dials home‘a23’事件代码 B 11/04/12 06:42:55 SP A a23 Peer SP Down. 3 0 0 这个错误说明Peer SP故障,原因可能是挂起、宕机、bugcheck(相当于Windows的蓝屏)。Peer SP的硬件依然存在,但处于下线状态,而且SPA和SPB之间的通信中断。该事件会导致系统错误LED亮起,并且如果主机故障转移软件配置正确的话,所有的活动LUN应该会被切换到另一个SP。 该事件表明Peer SP故障了,如果SP重启的原因已知(比如FLARE升级),那么可以忽略该事件。否则,需要收集SPCOLLECT以及Dump文件(如果发生了bugcheck reboot),由技术支持人员做出分析。 案例4:Storage Processor dials home‘944’事件代码 B ... SP A a23 Peer SP Down. 3 0 0 B ... SP B 944 Hard Peer Bus Error 2 0 0 该错误代表“Hard Peer Bus Error”,这说明两个SP之间的通讯已经中断,通常说明peer SP(不是报告这条错误的SP)已经重启或panic。如果SP重启的原因已知,那么可以忽略该事件。否则,需要收集SPCOLLECT以及Dump文件(如果发生了bugcheck reboot),由技术支持人员做出分析。检查该问题需要两边SP的SPCOLLECT(如果有dump文件也需要上传),必须在问题发生之后采集(确保包含问题事件),随后上传日志到Service Center或powerlink。 案例5:Storage Processor is faulted (事件代码 7127ca2...)" B Flaredrv 7127ca2a SPA is faulted. Fault Code: 0. FRU: CPU Module - Part Number: 303-113-400B should be replaced. A Flaredrv 7127ca2b SPB is faulted. Fault Code: 62. FRU: CPU Module - Part Number: 100-561-090, FRU: All DIMMs - Part Number: UNAVAILABLE should be replaced. A Flaredrv 7127ca2c SPB is faulted. The fault cannot be isolated. Fault Code: 41, 'Can't access disks'. A Flaredrv 7127ca2d SPB is in a hung state. The state code is: 45. Last state entered was: 'O/S running'. 这些错误说明peer SP发现一个故障,并且需要更换该SP的一个或多个部件,在目前的FLARE和VNX OE版本,有问题的SP记录在了错误中,但事件本身是由正常的SP记录的。例如第一个例子,SPA存在故障,SPB记录事件。这些错误在【peer SP的FLARE驱动已经启动,且SP依旧处于重启的过程中】的情况下会被报出。检查此问题需要两边SP的SPCOLLECT,必须在问题发生之后采集(确保包含问题事件),随后上传日志到Service Center或powerlink。备注:文章转载自EMC中文支持论坛
VNX/CLARiiON Dial Home常见错误代码-联想乐享知识库
⚡ 核心结论
本文来源联想官方,解答关于 VNX/CLARiiON Dial Home常见错误代码 的常见问题,包括:VNX/CLARiiON存储系统Dial Home报错代码7403,怎么办、VNX/CLARiiON存储系统Dial Home报错代码20c0,怎么办、VNX/CLARiiON存储系统Dial Home报错a23(Peer SP Down),怎么办等。
内容来源:联想官方
常见问题解答
VNX/CLARiiON存储系统Dial Home报错代码7403,怎么办
错误代码7403表示Storage Processor(SP)发生故障,但该代码本身不揭示根本原因。需结合Unisphere中的实时告警及SPCOLLECT日志分析定位问题。具体步骤:1. 确认问题发生后,立即分别采集SPA和SPB的SPCOLLECT(确保日志包含7403事件时间点);2. 将两份SPCOLLECT上传至Dell EMC Service Center或PowerLink;3. 同步检查Unisphere中是否存在关联告警(如SP离线、CPU异常、内存错误等)。注意事项:SPCOLLECT必须在故障发生后采集,否则无法捕获关键上下文;单侧SPCOLLECT不足以诊断,必须双SP日志齐备。
VNX/CLARiiON存储系统Dial Home报错代码20c0,怎么办
错误代码20c0表明Storage Processor正忙,无法响应至少一个严重事件,属于超时类事件,常与SP重启相关,但该代码本身不说明触发原因。根本原因需依赖Unisphere告警和SPCOLLECT日志分析。解决步骤:1. 在问题发生后,立即使用Unisphere或CLI同步采集SPA和SPB的SPCOLLECT(确保覆盖事件发生时刻);2. 检查Unisphere中是否出现SP重启、FLARE挂起或资源耗尽类告警;3. 将双SP日志打包上传至Dell EMC Service Center或PowerLink供技术支持分析。注意事项:若SP近期执行过固件升级或配置变更,需同步提供操作记录;仅采集单侧SP日志将导致诊断不完整。
VNX/CLARiiON存储系统Dial Home报错a23(Peer SP Down),怎么办
错误代码a23表示对端Storage Processor(Peer SP)已下线,可能原因为SP挂起、宕机或发生bugcheck(类似Windows蓝屏),此时SPA与SPB间通信中断,系统错误LED会亮起,且LUN会自动故障转移到正常SP。若已知SP重启原因(如FLARE版本升级),可忽略;否则需紧急处理:1. 立即采集SPA和SPB的SPCOLLECT(含事件时间戳);2. 若SP发生bugcheck重启,还需收集对应Dump文件;3. 将SPCOLLECT及Dump(如有)上传至Dell EMC Service Center或PowerLink。注意事项:Peer SP硬件仍在线但不可用,不可仅依赖当前SP日志,必须双SP日志齐全才能准确判断故障源。
VNX/CLARiiON存储系统Dial Home报错944(Hard Peer Bus Error),怎么办
错误代码944代表‘Hard Peer Bus Error’,即两个Storage Processor之间的专用通信总线发生硬性中断,通常意味着报告该错误的SP所对应的Peer SP已重启或陷入panic状态。该错误需结合上下文判断:若已知计划内操作(如固件升级)导致SP重启,可忽略;否则必须深入分析。解决步骤:1. 在问题发生后,同步采集SPA和SPB的SPCOLLECT;2. 若SP发生bugcheck并生成Dump文件,一并收集;3. 将全部日志(SPCOLLECT+Dump)上传至Dell EMC Service Center或PowerLink。注意事项:该错误本身不指向硬件故障,但可能预示背板、SP主板或互联电缆异常;日志采集必须严格在事件发生后执行,延迟采集将丢失关键线索。
VNX/CLARiiON存储系统Dial Home报错7127ca2系列(如SPA is faulted),怎么办
错误代码7127ca2系列(如7127ca2a/7127ca2b)表示对端Storage Processor被检测到硬件故障,例如CPU模块或内存(DIMM)失效,需更换对应FRU部件。该事件由正常SP上报,常见于Peer SP处于重启或挂起状态时。解决步骤:1. 立即采集SPA和SPB的SPCOLLECT(确保包含故障事件时间点);2. 根据错误信息中明确列出的FRU编号(如303-113-400B、100-561-090)准备备件;3. 将双SP日志上传至Dell EMC Service Center或PowerLink,由技术支持确认故障隔离结论与更换方案。注意事项:错误中‘Can't access disks’(故障码41)或‘hung state’(状态码45)表明SP已失去响应能力,不可尝试热插拔,须按标准硬件更换流程操作。