Translate

Mostrar mensagens com a etiqueta Abend COBOL. Mostrar todas as mensagens
Mostrar mensagens com a etiqueta Abend COBOL. Mostrar todas as mensagens

sábado, 28 de dezembro de 2013

☕🔥 ABEND S806 — O “PROGRAMA FANTASMA” DO z/OS

 

Bellacosa Mainframe e o Abend S806

☕🔥 ABEND S806 — O “PROGRAMA FANTASMA” DO z/OS

Quando o Mainframe Diz:

“EU NÃO ENCONTREI O QUE VOCÊ MANDOU EXECUTAR.”

Se existe um ABEND que já fez TODO programador COBOL Junior Padawan olhar para o JCL em silêncio absoluto…

é o lendário:

🚨 S806

E normalmente ele aparece assim:

IEF450I JOBNAME STEP01 - ABEND=S806

ou:

CSV028I ABEND806-04 JOBNAME STEP01
PROGRAM PROGXYZ NOT FOUND

ou ainda:

IEC130I PROGRAM NOT FOUND

E então começa a crise existencial:

“MAS O PROGRAMA EXISTE!”
“EU COMPILEI!”
“FUNCIONAVA ONTEM!”
“O LOADLIB SUMIU?”
“O z/OS ESTÁ ME GASLIGHTEANDO?”

☕ Respira.

Porque o S806 é um dos ABENDs MAIS CLÁSSICOS da história do mainframe.

E um dos mais importantes para aprender:

JCL

LOADLIB

STEPLIB

LINKLIST

BINDER

EXEC PGM

load modules


🔥 O QUE É O S806?

O S806 é um:

🚨 PROGRAM NOT FOUND

Traduzindo:

O z/OS NÃO CONSEGUIU ENCONTRAR O PROGRAMA EXECUTÁVEL.


☕ A FILOSOFIA DO S806

Seu JCL disse:

//STEP1 EXEC PGM=COBPROG

O z/OS respondeu:

❌ “NÃO EXISTE NENHUM EXECUTÁVEL COM ESSE NOME NOS LUGARES ONDE PROCUREI.”


🔥 O QUE O z/OS FAZ QUANDO VÊ EXEC PGM=

Fluxo real:

EXEC PGM=PROG1
 ↓
Procurar módulo
 ↓
STEPLIB
 ↓
JOBLIB
 ↓
LNKLST
 ↓
SYS1.LINKLIB
 ↓
Encontrou?

Se NÃO:

💥 S806


☕ ANALOGIA BELLACOSA MAINFRAME

Imagine um aeroporto.

O sistema anuncia:

“CHAMEM O PILOTO DO VOO.”

Mas:

  • piloto não apareceu

  • nome errado

  • terminal errado

  • aeroporto errado

  • piloto nem existe

O voo nunca sai.

Isso é o:

☠️ S806


🔥 O MAIOR SEGREDO

S806 NÃO significa:

“source COBOL não existe.”

Significa:

o LOAD MODULE executável não foi encontrado.


☕ SOURCE ≠ EXECUTÁVEL

Isso traumatiza juniors.

Você pode ter:

✅ source COBOL
✅ compile OK

Mas sem:

LINK-EDIT/BINDER

não existe executável.


🔥 O MAIOR VILÃO DO S806

🚨 STEPLIB ERRADA

O rei absoluto.


☕ EXEMPLO CLÁSSICO

 //STEPLIB DD DSN=EMPRESA.TEST.LOAD,DISP=SHR

Mas o programa está em:

EMPRESA.PROD.LOAD

Resultado:

💥 S806


🔥 O ERRO MAIS HUMANO DA HISTÓRIA

//STEP1 EXEC PGM=COBPRG1

Mas o member real é:

COBPROG1

Faltou:

O

Resultado:

☠️ S806


☕ O MAINFRAME NÃO “ADIVINHA”

No z/OS:

nome precisa ser EXATO.


🔥 O S806 E O BINDER

Aqui nasce o verdadeiro conhecimento Jedi.


☕ O QUE É O BINDER?

Ferramenta que cria:

LOAD MODULES

Executáveis do z/OS.


🔥 FLUXO REAL COBOL

SOURCE COBOL
 ↓
COMPILER
 ↓
OBJETO
 ↓
BINDER/LINK-EDIT
 ↓
LOAD MODULE
 ↓
EXECUÇÃO

Se faltar binder:

💥 S806


☕ O ERRO CLÁSSICO DO PADAWAN

“Compilei com sucesso.”

Mas esqueceu:

LINK-EDIT


🔥 O S806 E O FTP ASCII

Lenda urbana real.

Load module transferido em:

ASCII

ao invés de:

BINARY

O executável vira lixo hexadecimal.

Às vezes:

  • S806

  • S0C1

  • S0C4

dependendo do dano.


☕ O S806 E O CALL

Outro clássico COBOL.

CALL 'CALCPGM'

Mas:

CALCPGM não existe na loadlib

Resultado:

💥 S806


🔥 O CALL DINÂMICO MALDITO

CALL WS-PGM

Mas:

WS-PGM = 'ABC123'

e esse módulo não existe.


☕ O S806 E O CICS

No CICS normalmente aparece como:

🚨 PGMIDERR

ou:

AEI0

ASRA

dependendo do cenário.


🔥 O S806 E O DB2

Outro clássico sombrio.

Programa depende de runtime DB2:

DSNHLI

ou módulos LE.

STEPLIB errada?

☠️ caos.


☕ COMO INVESTIGAR O S806 PASSO A PASSO


✅ PASSO 1 — IDENTIFIQUE O PROGRAMA

Mensagem:

CSV028I ABEND806-04 PROGRAM PROGXYZ NOT FOUND

Suspeito identificado.


✅ PASSO 2 — VERIFIQUE STEPLIB

Veja:

//STEPLIB DD DSN=...

Confirme:

  • dataset correto

  • DISP=SHR

  • biblioteca existe


✅ PASSO 3 — USE ISPF 3.4

Procure o member.

Existe?

PROGXYZ

✅ PASSO 4 — CONFIRA O NOME

Mainframe não perdoa:

  • typo

  • espaço

  • caractere errado


✅ PASSO 5 — VERIFIQUE O BINDER

Talvez o módulo nunca tenha sido gerado.


🔥 O SEGREDO DO ISPF 3.4

Veteranos vivem nele.

Comandos:

MEMBER

ou:

B

ajudam localizar executáveis.


☕ O S806 E O LNKLST

Se não há STEPLIB/JOBLIB:

o z/OS procura em:

LINKLIST

Bibliotecas globais do sistema.


🔥 O S806 FANTASMA

O mais traiçoeiro.

Funcionava ontem.

Hoje:

💥 S806

Porque:

  • loadlib mudou

  • promoção falhou

  • member deletado

  • IEBCOPY sobrescreveu

  • deploy incompleto


☕ O S806 E O PDSE

Hoje muitos ambientes usam:

PDSE

Mais moderno que PDS.

Mas problemas de sincronização e membros ainda acontecem.


🔥 O S806 E O JCLLIB

Às vezes o PROC aponta:

biblioteca errada

E o EXEC herda erro invisível.


☕ O DUMP DO S806

Normalmente pouco útil.

Porque o programa:

NEM CHEGOU A EXECUTAR.

O problema ocorre ANTES.


🔥 O OURO ESTÁ NAS MENSAGENS

Especialmente:

CSV028I
IEF452I
IEWxxxx

☕ COMO O VETERANO PENSA

Veterano vê:

S806

e imediatamente pergunta:

“ONDE ESTÁ A LOADLIB?”


🔥 CURIOSIDADE HISTÓRICA

O S806 vem da era:

IBM OS/360

Década de:

🏛️ 1960

Naquela época:

  • programas eram carregados fisicamente de bibliotecas em disco/tape

  • loader era parte vital do sistema

O S806 virou um dos ABENDs mais clássicos da história corporativa.


☕ EASTER EGG MAINFRAME

Veteranos brincam:

“S806 é o z/OS dizendo:

VOCÊ TEM CERTEZA QUE ESSE PROGRAMA EXISTE?”


🔥 O MAIOR ERRO DO PADAWAN

Ver:

S806

e recompilar COBOL.

Frequentemente o problema NÃO está no source.

Está em:

  • loadlib

  • binder

  • STEPLIB

  • deploy

  • member

  • ambiente


☕ COMO EVITAR S806


✅ Validar STEPLIB


✅ Confirmar LOADLIB


✅ Revisar BINDER


✅ Nunca FTP executável em ASCII


✅ Conferir nome do member


✅ Padronizar deploy


✅ Validar CALLs dinâmicos


🔥 A VERDADE FINAL

O S0C7 pune números inválidos.
O S0C4 pune memória inválida.
O S013 pune datasets incompatíveis.
O S322 pune tempo excessivo.
O S306 pune falhas de carregamento.

Mas…

☕ O S806 É O MOMENTO EM QUE O z/OS PROCURA UM PROGRAMA… E ENCONTRA APENAS O VAZIO.

terça-feira, 19 de novembro de 2013

☕🔥 ABEND S722 — O “ENCERRAMENTO MISERICORDIOSO” DO z/OS

Bellacosa Mainframe abend s722

 

☕🔥 ABEND S722 — O “ENCERRAMENTO MISERICORDIOSO” DO z/OS

Quando o Mainframe Diz:

“ALGUÉM DECIDIU MATAR ESSE JOB.”

Se existe um ABEND que confunde TODO programador COBOL Junior Padawan…

é o misterioso:

🚨 S722

Porque ele parece com:

S322

Mas NÃO é igual.

E aí começa o caos:

“Foi timeout?”
“Foi loop infinito?”
“O operador matou?”
“O JES executou?”
“O sistema entrou em guerra?”

☕ Respira.

Porque o S722 é um dos ABENDs mais interessantes para entender:

cancelamento manual

operação do z/OS

JES2

runaway jobs

comandos de operador

batch control

intervenção humana no mainframe


🔥 O QUE É O S722?

O S722 significa:

🚨 JOB CANCELADO PELO OPERADOR

Traduzindo:

ALGUÉM MATOU O JOB MANUALMENTE.


☕ O MAIOR SEGREDO

Diferente do:

S322

que é:

TIME LIMIT EXCEEDED

o:

S722

significa:

intervenção humana.


🔥 O QUE REALMENTE ACONTECE

O job está rodando:

EXECUTANDO...

Talvez:

  • lento

  • preso

  • loop infinito

  • consumindo CPU

  • esperando recurso

  • travando produção

Então o operador digita:

C jobname

ou:

P jobname

ou algum comando equivalente.

Resultado:

💥 S722


☕ ANALOGIA BELLACOSA MAINFRAME

Imagine um trem fora de controle.

O sistema ainda NÃO bateu.

Mas alguém puxa:

🚨 O FREIO DE EMERGÊNCIA

Isso é o:

☠️ S722


🔥 O S722 NÃO É NECESSARIAMENTE ERRO

Isso é MUITO importante.

Às vezes o job:

  • estava correto

  • estava lento

  • processava bilhões de registros

  • apenas demorava demais

E alguém cancelou.


☕ O S722 É “ABEND SOCIAL”

Porque envolve:

humanos.

Operadores.

Schedulers.

Produção.

Pressão.

Batch window.


🔥 O CENÁRIO CLÁSSICO

Sexta-feira

fechamento mensal

CPU alta

SLA atrasando

E então alguém vê:

JOB XYZ RUNNING 5 HOURS

Operador:

C XYZ

Resultado:

💥 S722


☕ O S722 vs S322

Essa diferença salva carreiras.


☕ S322

Sistema matou por tempo excedido.


☕ S722

Humano matou manualmente.


🔥 O MAIOR VILÃO DO S722

LOOP INFINITO

Porque operadores frequentemente cancelam:

  • jobs presos

  • loops

  • SQLs infinitos

  • SORTs monstruosos


☕ EXEMPLO COBOL CLÁSSICO

PERFORM UNTIL WS-FIM = 'S'

   READ CLIENTE

END-PERFORM

Mas:

WS-FIM nunca muda

Agora:

job nunca termina.

Operador vê CPU alta.

Resultado:

☠️ CANCEL JOB → S722


🔥 O “READ SEM EOF”

Trauma coletivo do COBOL batch.


☕ ERRO

READ ARQ

sem:

AT END

Agora:

loop eterno.


🔥 O SQL ASSASSINO

Outro clássico.

SELECT *
FROM TABELA_GIGANTE

Sem índice.

Sem filtro.

Sem COMMIT.

Agora o DB2 sofre.

Operador sofre.

Produção sofre.

Resultado:

💥 S722


☕ O S722 E O “WAIT”

Às vezes o job nem está usando CPU.

Ele está:

  • esperando fita

  • esperando lock

  • preso em ENQ

  • deadlock

  • I/O congelado

Alguém perde paciência.

CANCEL


🔥 O S722 E O JES2

O JES monitora jobs ativos:

SDSF ST

Operador vê:

  • CPU

  • tempo

  • status

  • initiator

E pode cancelar.


☕ O COMANDO DA MORTE

Em muitos ambientes:

C jobname

ou:

CANCEL jobname

🔥 O S722 E O DUMP

Aqui nasce o conhecimento Jedi.


☕ MUITAS VEZES NÃO HÁ ERRO REAL

O programa foi interrompido artificialmente.

Então o dump pode mostrar:

exatamente onde ele estava.


🔥 ISSO É OURO

Porque agora você pode descobrir:

  • loop

  • SQL lento

  • READ preso

  • WAIT

  • deadlock

  • SORT gigante


☕ COMO INVESTIGAR O S722 PASSO A PASSO


✅ PASSO 1 — VERIFIQUE JESMSGLG

Procure:

JOB CANCELLED

ou:

CANCELLED BY OPERATOR

✅ PASSO 2 — IDENTIFIQUE O STEP

STEP01

✅ PASSO 3 — ANALISE O SYSOUT

Última mensagem geralmente aponta:

  • loop

  • repetição

  • SQL preso


✅ PASSO 4 — VERIFIQUE CPU

Pergunte:

  • CPU alta?

  • elapsed alto?

  • I/O preso?


✅ PASSO 5 — ANALISE O DUMP

Veja:

  • PSW

  • offset

  • linha COBOL

  • SQL ativo

  • WAIT state


🔥 O SEGREDO DO PSW

O PSW mostra:

ONDE O JOB MORREU.

Mesmo cancelado manualmente.


☕ O OFFSET

Exemplo:

OFFSET X'01FA'

Cruze com listing COBOL.

Agora você encontra:

PERFORM UNTIL...

Boom.


🔥 O S722 E O SDSF

Ferramenta dos operadores Jedi.

Comandos:

ST
DA

Mostram:

  • jobs ativos

  • CPU

  • tempo

  • status


☕ O MAIOR ERRO DO PADAWAN

Ver:

S722

e corrigir apenas:

TIME=1440

Não.

Porque talvez:

o job estivesse realmente preso.


🔥 O S722 E O ABEND-AID

Ferramentas modernas mostram:

  • call stack

  • loops

  • SQL ativo

  • wait chain

Facilitando MUITO análise.


☕ O S722 E O DB2

Outro cenário clássico.

Programa faz:

cursor sem COMMIT

ou:

tablespace lock

Produção trava.

Operador cancela.


🔥 O S722 E O CICS

Equivalente filosófico no online:

AICA

Mas:


☕ AICA

Sistema mata task online.


☕ S722

Humano mata batch.


🔥 CURIOSIDADE HISTÓRICA

Nos anos 70/80:

Operadores controlavam datacenters quase manualmente.

Muitos S722 aconteciam literalmente por decisão operacional humana olhando consoles físicos.


☕ EASTER EGG MAINFRAME

Veteranos brincam:

“S722 significa:

Seu Job Irritou Alguém.”


🔥 O MAIOR ENSINAMENTO DO S722

Ele ensina algo profundo:

performance ruim afeta pessoas reais.

No z/OS:

  • batch window

  • SLA

  • produção

  • financeiro

  • folha

  • banco

dependem do tempo correto.


☕ COMO EVITAR S722


✅ Sempre tratar EOF


✅ Revisar loops


✅ Monitorar SQL


✅ Fazer COMMIT


✅ Validar índices DB2


✅ Evitar waits infinitos


✅ Testar volume real


✅ Conversar com Operação

Sim.

Isso é MUITO importante.


🔥 A VERDADE FINAL

O S322 pune excesso automático de tempo.
O AICA pune runaway tasks online.

Mas…

☕ O S722 É O JULGAMENTO HUMANO FINAL SOBRE UM JOB QUE PAROU DE RESPEITAR O TEMPO DO DATACENTER.


sábado, 15 de junho de 2013

☕🔥 ABEND S0C7 — O “COLAPSO DECIMAL” DO MAINFRAME

 

Bellacosa Mainframe abend s0c7

☕🔥 ABEND S0C7 — O “COLAPSO DECIMAL” DO MAINFRAME

Quando o IBM Z Olha Para Seus Dados e Diz:

“ISSO NÃO É UM NÚMERO VÁLIDO.”

Se existe um ABEND que traumatiza TODO programador COBOL iniciante…

é o lendário:

🚨 S0C7

O verdadeiro ritual de passagem do mundo mainframe.

E normalmente ele aparece assim:

SYSTEM COMPLETION CODE=0C7

ou:

DATA EXCEPTION

ou ainda:

ASRA/S0C7

no CICS.

E naquele momento…

o Junior Padawan entra em crise existencial:

“MAS O CAMPO É NUMÉRICO!”
“O COBOL ME TRAIU!”
“O ARQUIVO ESTÁ AMALDIÇOADO?”
“O HEXADECIMAL VIROU DEMÔNIO?”

☕ Respira.

Porque o S0C7 é um dos ABENDs MAIS IMPORTANTES da história do mainframe.


🔥 O QUE É O S0C7?

O S0C7 é um:

🚨 DATA EXCEPTION

Traduzindo:

A CPU IBM Z TENTOU EXECUTAR UMA OPERAÇÃO NUMÉRICA COM DADOS INVÁLIDOS.


☕ A FILOSOFIA DO S0C7

O mainframe leva números MUITO a sério.

No mundo COBOL:

NUMÉRICO NÃO É “PARECE NÚMERO”.

Numérico precisa ser:

matematicamente válido em nível hexadecimal.


🔥 O QUE REALMENTE ACONTECE

Imagine:

ADD WS-VALOR TO WS-TOTAL

O COBOL gera instruções decimais do IBM Z.

A CPU lê:

packed decimal
zoned decimal
binary
display numeric

Mas encontra:

lixo

Resultado:

💥 S0C7


☕ ANALOGIA BELLACOSA MAINFRAME

Imagine um caixa eletrônico.

Você digita:

100

Tudo certo.

Mas imagine digitar:

ABACAXI

O sistema trava.

O S0C7 é isso.


🔥 O MAIOR SEGREDO

O S0C7 NÃO É “ERRO DO COBOL”.

É:

erro de DADOS.


☕ O MAIOR VILÃO DO UNIVERSO MAINFRAME

🚨 COMP-3

O lendário:

PACKED DECIMAL


🔥 O QUE É COMP-3?

Formato compactado decimal.

Exemplo:

PIC S9(7)V99 COMP-3

Armazenado em hexadecimal.


☕ COMO O PACKED FUNCIONA

Número:

12345

vira algo parecido com:

12 34 5C

O último nibble:

C

significa:

positivo


🔥 O PROBLEMA

Se aparecer:

12 34 AF

a CPU olha e diz:

❌ “ISSO NÃO É DECIMAL VÁLIDO.”

Resultado:

☠️ S0C7


☕ O S0C7 É HARDWARE

Isso é incrível.

O erro NÃO nasce no COBOL.

Nasce:

na própria CPU IBM Z.

O processador decimal detecta inconsistência.


🔥 O ERRO MAIS CLÁSSICO DA HISTÓRIA

MOVE 'ABC' TO WS-VALOR-NUM

Depois:

ADD 1 TO WS-VALOR-NUM

Resultado:

💥 S0C7


☕ O “MOVE MALDITO”

Outro clássico:

MOVE SPACES TO WS-VALOR

em campo numérico.

Mais tarde:

COMPUTE WS-TOTAL = WS-VALOR + 1

Boom.


🔥 O S0C7 FANTASMA

O mais assustador.

Erro acontece LONGE da causa real.


☕ EXEMPLO

Linha 100:

MOVE SPACES TO WS-NUM

Linha 5000:

ADD WS-NUM TO WS-TOTAL

Explosão.

O erro nasceu MUITO antes.


🔥 O VERDADEIRO DEMÔNIO: LAYOUT ERRADO

O campeão absoluto em produção.


☕ EXEMPLO

Arquivo real:

CAMPO-A = 10 bytes

COPYBOOK antigo:

CAMPO-A = 8 bytes

Agora TODOS os campos seguintes deslocam.

Campo numérico recebe lixo.

Resultado:

☠️ S0C7


🔥 O REDEFINES DA MORTE

Outro clássico.

01 REGISTRO.
   05 VALOR-NUM PIC 9(05).

01 REGISTRO-R REDEFINES REGISTRO.
   05 VALOR-TXT PIC X(05).

Depois:

MOVE 'ABCDE' TO VALOR-TXT
ADD 1 TO VALOR-NUM

Resultado:

💥 S0C7


☕ O S0C7 NO CICS

No CICS geralmente aparece como:

🚨 ASRA + S0C7

Porque o CICS intercepta o program check.


🔥 COMO INVESTIGAR O S0C7 PASSO A PASSO


✅ PASSO 1 — IDENTIFIQUE O OFFSET

Exemplo:

OFFSET X'01FA'

Esse é o endereço da explosão.


✅ PASSO 2 — PEGUE O LISTING COBOL

Cruze offset com:

  • SYSADATA

  • compile listing

  • Abend-AID

  • Fault Analyzer


✅ PASSO 3 — IDENTIFIQUE A LINHA

Exemplo:

ADD WS-SALDO TO WS-TOTAL

✅ PASSO 4 — DESCUBRA QUAL CAMPO ESTÁ SUJO

Agora começa CSI Mainframe.


🔥 O SEGREDO DOS HEXADECIMAIS

Veteranos olham dump em HEX.

Porque o problema REAL está lá.


☕ EXEMPLO VÁLIDO

F1 F2 F3

EBCDIC:

123

☕ EXEMPLO INVÁLIDO

C1 C2 C3

EBCDIC:

ABC

Em campo numérico:

☠️ S0C7


🔥 COMO LER O DUMP


☕ PSW

GPS do desastre.


☕ REGISTERS

Especialmente:

R1
R13
R14
R15

☕ STORAGE DUMP

Aqui mora a verdade.

Veterano encontra:

  • packed inválido

  • espaço em numérico

  • sinal incorreto

  • overlay


🔥 O HEXADECIMAL MAIS TEMIDO

40404040

EBCDIC:

espaços

Campo numérico cheio de espaços.

Clássico S0C7.


☕ O S0C7 E O FILE STATUS

Junior acha:

arquivo abriu = tudo bem

Não.

O conteúdo pode estar:

corrompido.


🔥 O S0C7 E O DB2

Outro clássico.

COLUNA:

DECIMAL(9,2)

Programa espera:

PIC 9(5)

Mismatch.

Resultado:

💥 dados inválidos


☕ O S0C7 E O SORT

Arquivo alterado por SORT errado.

Campos deslocados.

Resultado:

☠️ S0C7


🔥 COMO EVITAR S0C7


✅ Nunca mover spaces para numérico


✅ Validar NUMERIC

IF WS-CAMPO NUMERIC

✅ Revisar layouts


✅ Sincronizar copybooks


✅ Cuidado com REDEFINES


✅ Validar entrada externa


✅ Revisar COMP-3


☕ O TEST-NUMVAL — MAGIA MODERNA

COBOL moderno possui:

FUNCTION TEST-NUMVAL

Excelente defesa contra S0C7.


🔥 CURIOSIDADE HISTÓRICA

O S0C7 nasceu junto com:

System/360

Década de:

🏛️ 1960

IBM criou hardware decimal porque bancos precisavam:

  • precisão financeira

  • decimal real

  • sem erro binário


☕ EASTER EGG MAINFRAME

Veteranos brincam:

“S0C7 é o imposto obrigatório para virar programador COBOL.”

Porque TODO mundo toma pelo menos um.


🔥 O MAIOR ERRO DO PADAWAN

Ver:

S0C7

e corrigir apenas a linha do ADD.

Não.

A causa pode ter nascido:

milhares de linhas antes.


☕ A VERDADE FINAL

O S0C1 destrói instruções.
O S0C4 destrói memória.
Mas…

☕ O S0C7 DESTRÓI A ILUSÃO DE QUE “PARECE NÚMERO” É SUFICIENTE.

Porque no IBM Z…

CADA BYTE DECIMAL PRECISA SER ABSOLUTAMENTE PURO.