Considere os seguintes conceitos, extraidos de [1]:
Gerenciamento de incidentes: visa restaurar a operação normal de um serviço no menor tempo possível, de forma a minimizar impactos adversos para o negócio.
Gerenciamento de problemas: visa minimizar os impactos adver-sos de incidentes e problemas para o negócio, quando causados por falhas na infraestrutura de TI, assim como prevenir que incidentes relacionados a essas falhas ocorram novamente.
Dados os conceitos, o gerenciamento de incidentes tem como objetivo resolver o problema do servidor o mais breve possivel(por exemplo, subindo uma VM), mas não tem como lidar com a sobrecarga elétrica(o problema), até porque ainda não se sabe qual a causa raiz dela. O que se sabe é que subindo uma VM espelho o problema é temporariamente resolvido. Mas repare que, assim como o servidor, a VM deve também apresentar problemas por conta disso.
E o que o Gerenciamento de Problemas vai fazer a respeito? Como a causa ainda não é conhecida, vai investiga-la e, uma vez e descoberta, passa a compor os erros conhecidos.
Provavelmente o gerenciamento de incidentes terá que acionar um eletricista(que não está no escopo da TI), ou mesmo contactar a companhia eletrica. Talvez fazer uma manutenção no UPS também resolva.
Além disso, basta saber que um problema é a causa de um ou vários incidentes. Ora, se ha'problema de sobrecarga, possivelmente haverá vários incidentes neste servidor enquanto esse problema de sobrecarga não por solucionado.
Por fim, não acho que o termo estabilidade contenha erro. A estabilidade do servidor pode apresentar problemas, pode estar comprometida. O único erra tá na inversão conceitual.
Fonte:
[1] Implantando a Governança de TI, Aragon, 4ed.