5137TOC.fm
Draft Document for Review October 14, 2014 10:19 am
vi
IBM Power Systems E870 and E880 Technical Overview and Introduction
4.3.2 Uncorrectable error introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
4.3.3 Processor Core/Cache correctable error handling . . . . . . . . . . . . . . . . . . . . . . . 150
4.3.4 Processor Instruction Retry and other try again techniques . . . . . . . . . . . . . . . . 150
4.3.5 Alternative processor recovery and Partition Availability Priority . . . . . . . . . . . . 151
4.3.6 Core Contained Checkstops and other PowerVM error recovery . . . . . . . . . . . . 151
4.3.7 Cache uncorrectable error handling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.3.8 Other processor chip functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.3.9 Other fault error handling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.3.10 Memory protection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
4.3.11 I/O subsystem availability and Enhanced Error Handling . . . . . . . . . . . . . . . . . 154
4.4 Enterprise systems availability details. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
4.5 Availability impacts of a solution architecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
4.5.1 Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
4.5.2 Virtual I/O redundancy configurations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
4.5.3 Live Partition Mobility . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
4.6 Serviceability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
4.6.1 Detecting errors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
4.6.2 Error checkers, fault isolation registers, and First-Failure Data Capture . . . . . . 163
4.6.3 Service processor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
4.6.4 Diagnosing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
4.6.5 Reporting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
4.6.6 Notifying . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
4.6.7 Locating and servicing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
4.7 Manageability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
4.7.1 Service user interfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
4.7.2 IBM Power Systems Firmware maintenance . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
4.7.3 Concurrent firmware update improvements . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.7.4 Electronic Services and Electronic Service Agent . . . . . . . . . . . . . . . . . . . . . . . 179
4.8 Selected POWER8 RAS capabilities by operating system . . . . . . . . . . . . . . . . . . . . . 183
Related publications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
IBM Redbooks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Online resources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Help from IBM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186