Translate

Mostrar mensagens com a etiqueta SYSABEND. Mostrar todas as mensagens
Mostrar mensagens com a etiqueta SYSABEND. Mostrar todas as mensagens

sexta-feira, 27 de março de 2026

🔥 COBOL NÃO QUEBROU… FOI O RTM QUE DECIDIU O DESTINO

 

Bellacosa Mainframe explica rtm o grande guarda-costas.

🔥 COBOL NÃO QUEBROU… FOI O RTM QUE DECIDIU O DESTINO

Se você trabalha com COBOL há anos, já viu isso acontecer:

💥 S0C7
💥 S0C4
💥 S878
…e aquele silêncio constrangedor no batch.

E aí vem a pergunta clássica:

👉 “O que aconteceu?”

Errado.

A pergunta certa é:

🧠 “O que o z/OS fez quando isso aconteceu?”

Porque no exato momento do ABEND…
quem assume o controle não é o seu programa.

É o RTM — Recovery Termination Manager.


🧠 O RTM: o juiz invisível do seu programa

O RTM é um componente do z/OS que entra em ação sempre que algo relevante acontece:

  • ✔️ Erro
  • ✔️ Falha
  • ✔️ Terminação normal (sim!)

👉 Ele é responsável por:

  • Capturar o erro
  • Tentar recuperar
  • Decidir o destino
  • Registrar tudo

💡 Tradução Bellacosa:

🔥 “O RTM é quem decide se seu programa vive… ou vira dump.”


🚨 Quando o ABEND acontece (o bastidor real)

Você vê:

S0C7 – erro de dados

O RTM vê:

  • Tipo de exceção
  • Estado da CPU (PSW)
  • Registradores
  • Control blocks
  • Contexto da task

👉 E imediatamente inicia o fluxo:

Erro → RTM → Recovery → Decisão → Dump → Investigação

💡 Isso acontece em milissegundos.


⚙️ Os serviços do RTM (o que ele realmente faz)

1️⃣ Captura do erro (o “detetive”)

O RTM intercepta:

  • Program checks (S0C4, S0C7…)
  • I/O errors
  • Machine checks
  • Falhas de memória

👉 Ele coleta o estado completo do sistema.

💡 Easter egg:

O SDWA é criado aqui — é literalmente o “snapshot do crime”.


2️⃣ Tentativa de recuperação (o “paramédico”)

Aqui entram os famosos:

  • ESTAE → nível da aplicação
  • FRR → nível do sistema

👉 O RTM pergunta:

“Alguém consegue salvar isso?”

💡 Curiosidade:

  • Muitos sistemas robustos usam ESTAE para evitar queda total
  • COBOL “puro” raramente usa diretamente… mas se beneficia disso sem saber

3️⃣ Decisão (o “juiz”)

Depois da tentativa:

  • Continua execução?
  • Finaliza a task?
  • Derruba o address space?

👉 Essa decisão é crítica.

💡 Insight:

Nem todo erro vira ABEND visível — alguns são absorvidos


4️⃣ Geração de evidência (o “perito”)

O RTM gera:

  • SYSUDUMP / SYSABEND / SYSMDUMP
  • SVC dump
  • LOGREC

👉 Isso vira seu material de análise.

💡 Frase forte:

Sem dump, você está cego.


🧹 RTM também limpa a bagunça (e isso é pouco falado)

Agora vem o que pouca gente sabe:

🔥 O RTM também atua quando TUDO DÁ CERTO

Quando seu job termina normalmente:

  • Fecha datasets
  • Libera memória
  • Cancela timers
  • Remove enqueues
  • Limpa control blocks

👉 Isso é feito de forma extremamente eficiente.

💡 Comentário Bellacosa:

“Se o RTM não limpasse… o z/OS virava um lixão em minutos”


🧩 RTM1 vs RTM2 (nível raiz)

🔹 RTM1 (System Level)

  • Falhas do sistema
  • Interface com FRR

🔹 RTM2 (Task Level)

  • Programas (COBOL aqui 👈)
  • Interface com ESTAE

👉 Fluxo clássico:

Erro

RTM1

FRR

RTM2

ESTAE

Decisão

💡 Isso é arquitetura de verdade.


📦 Dumps: o presente que ninguém quer… mas precisa

Tipos que você já viu:

  • SYSUDUMP → básico
  • SYSABEND → completo
  • SYSMDUMP → raiz (hex)

👉 E os de sistema:

  • SVC Dump
  • Standalone Dump

💡 Dica prática:

🔥 “Se o problema é estranho… peça SYSMDUMP”


🗂️ LOGREC: o histórico que salva sua vida

LOGREC guarda:

  • Erros de hardware
  • Eventos do sistema
  • Condições críticas

💡 Dica de ouro:

👉 Sempre comece por LOGREC antes do dump


🧠 SLIP e DAE (nível ninja)

🔹 SLIP

  • Armadilha de erro
  • Dispara dump sob condição

🔹 DAE

  • Evita dumps duplicados

💡 Produção sem isso:

caos + storage cheio


💥 Aplicação prática (COBOL raiz)

S0C7 — o clássico

👉 Normalmente:

  • Dado inválido em campo numérico

Mas o RTM te dá:

  • Instrução que falhou
  • Endereço
  • Conteúdo do campo

💡 Dica prática:

  1. Veja PSW
  2. Ache a instrução
  3. Verifique o dado
  4. Volte no código

🧠 Insight final (o que separa níveis)

❌ Júnior: “Deu S0C7”
❌ Pleno: “Campo inválido”
✅ Sênior: “Eu sei exatamente onde e por quê”


🏁 Conclusão (sem mimimi)

O RTM é:

  • 🔥 O guardião da estabilidade
  • 🔍 O perito do erro
  • ⚖️ O juiz da execução
  • 🧹 O faxineiro do sistema

💬 Frase pra levar pra vida

“COBOL não quebra…
o RTM só revela o que já estava errado.”

 

domingo, 28 de janeiro de 2007

O que é um Dump em Mainframe?

 

Bellacosa Mainframe explica Dump no Mainframe

O que é um Dump em Mainframe?

Quando um JOB sofre:

  • ABEND;

  • falha COBOL;

  • erro de memória;

  • problema no sistema;

o z/OS pode gerar algo extremamente importante chamado:

DUMP

Para iniciantes, dump parece algo assustador cheio de números estranhos.

Mas na prática ele é:

uma fotografia técnica do erro.


Definição simples

Dump é:

uma captura das informações da memória no momento da falha.

Ele ajuda a descobrir:

  • o que aconteceu;

  • onde ocorreu o erro;

  • qual variável causou problema;

  • qual instrução falhou.


Analogia simples

Imagine um acidente de carro.

Os investigadores analisam:

  • posição dos veículos;

  • marcas no chão;

  • velocidade;

  • danos.

O dump funciona exatamente assim:

ele registra o estado do programa no momento do erro.


O que o dump pode conter?

  • memória;

  • registradores;

  • variáveis;

  • instruções;

  • módulos;

  • chamadas de programa;

  • status do sistema.


Quando um dump é gerado?

Normalmente durante:

  • ABEND;

  • S0C7;

  • S0C4;

  • falha COBOL;

  • erro DB2;

  • erro CICS;

  • falha sistema.


Onde o dump aparece?

Principalmente:

  • spool;

  • SYSUDUMP;

  • SYSABEND;

  • CEEDUMP;

  • datasets de dump.


O que é SYSUDUMP?

Cartão DD usado para:

gerar dump simplificado.


Exemplo

//SYSUDUMP DD SYSOUT=*

Muito usado em troubleshooting


O que é SYSABEND?

Gera:

dump mais completo e detalhado.


Exemplo

//SYSABEND DD SYSOUT=*

O que é SYSMDUMP?

Dump binário/extenso.

Muito usado por suporte avançado IBM.


Exemplo

//SYSMDUMP DD DSN=MEU.DUMP,
// DISP=(NEW,CATLG)

O que é CEEDUMP?

Dump do:

Language Environment (LE).

Muito usado em:

  • COBOL;

  • PL/I;

  • C.


Exemplo

//CEEDUMP DD SYSOUT=*

O que existe dentro de um dump?


Registradores CPU

Estado do processador.


Endereços memória

Onde ocorreu falha.


Variáveis COBOL

Conteúdo dos campos.


Call stack

Sequência de chamadas.


Instrução que falhou

Linha/instrução responsável.


Como um dump aparece?

Exemplo típico:

PSW AT TIME OF ERROR

Ou:

REGISTER CONTENTS

Ou:

SYSTEM COMPLETION CODE=0C7

O que é PSW?

Program Status Word

Mostra estado da CPU no erro.


O que são registradores?

Pequenas áreas da CPU usadas durante execução.


O que é traceback?

Sequência de chamadas do programa.

Ajuda localizar:

  • módulo;

  • parágrafo;

  • rotina.


Dumps mais comuns no COBOL


S0C7

Erro numérico.


S0C4

Violação memória.


U4038

Erro aplicação.


Como analisar dump?


1. Identificar ABEND

Exemplo:

S0C7

2. Verificar módulo

Nome do programa.


3. Ler mensagens LE

Mensagens:

  • IGZ;

  • CEE.


4. Verificar campo problemático

Muito comum em COBOL.


5. Ler traceback


Exemplo COBOL clássico

Campo esperado:

99999

Valor recebido:

12A45

Resultado:

S0C7.

O dump ajuda localizar exatamente qual campo causou problema.


Como programadores usam dumps?

Para:

  • debugging;

  • análise de falhas;

  • localizar bugs;

  • entender memória.


Como operadores usam dumps?

Para:

  • abrir incidentes;

  • analisar ABEND;

  • enviar para suporte.


Dumps são grandes?

Muito.

Alguns podem ter:

  • milhares;

  • milhões de linhas.


Por isso muitos iniciantes se assustam

Mas normalmente:

apenas pequenas partes são realmente importantes.


O que procurar primeiro?


ABEND CODE


MODULE NAME


PSW


REGISTER CONTENTS


CEE/IGZ messages


TRACEBACK


O que é IPCS?

Ferramenta avançada de análise dump no z/OS.

Usada por:

  • suporte IBM;

  • sysprog;

  • especialistas sistema.


Dumps ajudam a resolver:

  • corrupção memória;

  • erro COBOL;

  • falha DB2;

  • problemas CICS;

  • loops;

  • storage violations.


Curiosidades incríveis

1. Dumps existem desde os primeiros mainframes IBM


2. Alguns dumps possuem milhares de páginas


3. Especialistas em dump são extremamente valorizados


4. Muitos problemas críticos só podem ser resolvidos via dump


Erros comuns de iniciantes


1. Ignorar dump


2. Não incluir SYSUDUMP

Dificulta troubleshooting.


3. Assustar-se com hexadecimal

Grande parte pode ser ignorada inicialmente.


4. Ler dump inteiro

Normalmente basta:

  • mensagens;

  • traceback;

  • ABEND.


Dicas importantes

Sempre use:

//SYSUDUMP DD SYSOUT=*

durante testes.


Aprenda:

  • S0C7;

  • S0C4;

  • U4038.


Leia mensagens CEE e IGZ


Use CEEDUMP em COBOL


Como dump aparece no dia a dia?

Praticamente em:

  • COBOL;

  • DB2;

  • CICS;

  • batch;

  • produção;

  • troubleshooting.


Fluxo simplificado

ERRO
 ↓
ABEND
 ↓
DUMP
 ↓
ANÁLISE
 ↓
CORREÇÃO

Resumo rápido

TipoFunção
SYSUDUMPDump simplificado
SYSABENDDump detalhado
SYSMDUMPDump binário
CEEDUMPDump LE/COBOL
PSWEstado CPU
TracebackSequência chamadas

Conclusão

Dump é uma das ferramentas mais importantes de troubleshooting no ambiente mainframe IBM Z.

Ele registra o estado do sistema e do programa no momento da falha, permitindo analisar ABENDs, localizar erros e resolver problemas complexos no z/OS com precisão.