| Bellacosa Mainframe e o laboratorio pratico em IBM Z Resiliencia |
☕ O Holocron da Resiliência IBM Z
30 Laboratórios Práticos
Do "Meu Primeiro Sysplex" até "Meu Datacenter Nunca Para"
A Resiliência no IBM Z vai muito além de conhecer siglas como HA, DR, Parallel Sysplex ou GDPS. Ela representa uma filosofia de engenharia construída ao longo de décadas para garantir que aplicações críticas permaneçam disponíveis mesmo diante de falhas de hardware, software, rede ou até desastres naturais. O objetivo deste guia é conduzir o Programador COBOL, Analista de Sistemas ou futuro Sysprog por uma jornada progressiva, mostrando como cada componente da plataforma contribui para a continuidade do negócio e como todos trabalham em conjunto para entregar disponibilidade praticamente ininterrupta.
A melhor forma de aprender é evoluir em etapas. Comece dominando os conceitos fundamentais de SLA, RPO, RTO, RAS e Single Point of Failure. Em seguida, compreenda a arquitetura do IBM Z, estudando CPC, LPARs, HMC e o papel do LIC. Depois avance para Parallel Sysplex, Coupling Facility, WLM e GDPS, entendendo como múltiplos sistemas operam como um único ambiente resiliente. Na sequência, aprofunde-se em DFSMS, Storage, CICS, Db2, IMS, MQ e estratégias de recuperação e continuidade dos negócios.
Procure sempre relacionar teoria com prática. Analise mensagens do sistema, consulte o SDSF, estude relatórios RMF e SMF, desenhe arquiteturas, simule cenários de falha e questione como sua aplicação reagiria a cada situação. O profissional que compreende Resiliência deixa de enxergar apenas programas COBOL e passa a entender todo o ecossistema que mantém milhões de transações funcionando com segurança, desempenho e confiabilidade. Esse é o caminho para evoluir de Padawan a Mestre no universo IBM Z.
🟢 NÍVEL 1 — PADAWAN (Labs 1–10)
Lab 1 – Descobrindo a Arquitetura IBM Z
Objetivo
Identificar todos os componentes físicos do ambiente.
Atividades
Localizar CPC
Identificar LPARs
Ver HMC
Identificar Storage
Solução
O aluno deve desenhar a arquitetura mostrando como todos os componentes se conectam.
Lab 2 – Identificando SPOFs
Objetivo
Encontrar Single Points of Failure.
Atividades
Analisar:
Rede
Storage
CICS
MQ
Db2
Solução
Criar uma tabela
| Componente | Existe redundância? |
|---|---|
| Storage | Sim |
| Switch | Não |
| Servidor DNS | Não |
Lab 3 – Calculando SLA
Dado:
99,5%
99,9%
99,99%
99,999%
Calcule:
indisponibilidade anual
mensal
diária
Solução
Utilizar tabela oficial de SLA.
Lab 4 – Descobrindo o RPO
Uma empresa aceita perder:
nenhuma transação
cinco minutos
uma hora
Classifique o RPO.
Solução
Relacionar cada cenário ao objetivo de recuperação.
Lab 5 – Descobrindo o RTO
Mesmo exercício.
Agora considerando tempo de recuperação.
Lab 6 – CFIA
Escolha um ambiente.
Analise:
"O que acontece se..."
Storage parar
CPU parar
Switch parar
Solução
Construir matriz de impacto.
Lab 7 – Conhecendo o WLM
No SDSF identificar:
Service Classes
Importance
Velocity
Solução
Explicar porque um Job Batch ficou esperando.
Lab 8 – Explorando RMF
Consultar:
CPU
I/O
Paging
Storage
Solução
Gerar relatório resumido.
Lab 9 – Health Checker
Executar
F HZSPROC
Interpretar avisos.
Lab 10 – Runtime Diagnostics
Executar Runtime Diagnostics.
Interpretar:
Loop
Espera
Deadlock
🟡 NÍVEL 2 — JEDI (Labs 11–20)
Lab 11 – Criando um Sysplex
Desenhar:
2 LPARs
1 Coupling Facility
Storage compartilhado
Solução
Apresentar diagrama.
Lab 12 – Entendendo a Coupling Facility
Identificar:
Lock Structure
Cache Structure
List Structure
Explicar função de cada uma.
Lab 13 – Simulando Falha de um Membro
Desligar uma LPAR (ambiente de laboratório).
Observar:
usuários continuam?
aplicações continuam?
Lab 14 – ARM
Parar uma região CICS.
Verificar reinício automático.
Lab 15 – DVIPA
Mover uma aplicação entre membros.
Confirmar:
IP continua igual.
Lab 16 – Sysplex Distributor
Monitorar distribuição de sessões.
Verificar balanceamento.
Lab 17 – LBA
Analisar recomendações do Load Balancing Advisor.
Lab 18 – Capacity on Demand
Criar cenário:
Black Friday.
Qual recurso ativar?
CBU?
CUoD?
OOCoD?
Justifique.
Lab 19 – DFSMS
Criar:
Storage Group
Management Class
Storage Class
Data Class
Associar Dataset.
Lab 20 – DFSMShsm
Migrar um dataset.
Recuperá-lo.
Verificar tempo.
🔴 NÍVEL 3 — MESTRE (Labs 21–30)
Lab 21 – CICSplex
Desenhar:
TOR
AOR
FOR
DOR
Fluxo completo.
Lab 22 – MQ
Criar:
Queue
Sender
Receiver
Enviar mensagens.
Simular parada do receptor.
Confirmar persistência.
Lab 23 – Db2
Executar:
RUNSTATS
REORG
Comparar Access Path.
Lab 24 – IMS
Criar fluxo:
Terminal
TM
Programa
IMS DB
Resposta.
Lab 25 – Metro Mirror
Desenhar:
Site A
Site B
Replicação síncrona.
Explicar RPO.
Lab 26 – Global Mirror
Mesmo exercício.
Agora com longa distância.
Explicar diferenças.
Lab 27 – Business Continuity
Escreva um BCP contendo:
responsáveis
comunicação
ordem de recuperação
testes
Lab 28 – Simulação Completa
O cenário:
🔥 Incêndio no Data Center Principal.
O aluno deve decidir:
ativa GDPS?
ativa CBU?
usa Metro Mirror?
muda DNS?
inicia ARM?
Justificar todas as decisões.
Lab 29 – Projeto de Arquitetura
Receba:
Banco Digital
20 milhões de clientes
PIX
Cartão
Internet Banking
Desenhe:
Hardware
Sysplex
CICSplex
MQ
Db2
Storage
DR
Lab 30 – O Desafio Final do Mestre
A empresa deseja atingir:
99,999% de disponibilidade
RPO = Zero
RTO = Menor que 5 minutos
Dois datacenters ativos
50 milhões de transações por dia
Atualizações sem parada
Crescimento de capacidade sem desligamento
Missão
Projetar toda a arquitetura IBM Z.
O projeto deve incluir:
IBM Z (CPCs e LPARs)
Parallel Sysplex
Coupling Facility
WLM
SFM
ARM
CICSplex (TOR, AOR, FOR e DOR)
IBM MQ
Db2 for z/OS
IMS (quando aplicável)
DFSMS
IBM Copy Services Manager
Metro Mirror ou Global Mirror
GDPS
Business Continuity Plan
Capacity on Demand (CBU, CUoD ou OOCoD)
Solução esperada
O aluno entrega um documento de arquitetura contendo:
diagrama completo da solução;
justificativa técnica para cada componente;
estratégia de alta disponibilidade;
estratégia de recuperação de desastres;
cálculo de SLA, RPO e RTO;
análise de Single Points of Failure e respectivas eliminações;
plano de testes de contingência;
plano de crescimento para os próximos cinco anos.
🏆 Certificação Bellacosa Mainframe
Ao concluir os 30 laboratórios, o aluno terá praticado os principais conceitos de resiliência do IBM Z, passando da compreensão dos fundamentos até o desenho de arquiteturas corporativas. Essa sequência é adequada tanto para um Programador COBOL Júnior que deseja entender a plataforma onde suas aplicações executam quanto para profissionais que pretendem evoluir para funções de Analista de Infraestrutura IBM Z, Sysprog, Especialista em Alta Disponibilidade ou Arquiteto Mainframe. Ela também pode servir como base para um curso completo de aproximadamente 40 horas, com exercícios, estudos de caso e desafios progressivos.