El Jefe Midnight Lunch

✨ Bem-vindo ao meu espaço! ✨ Este blog é o diário de um otaku apaixonado por animes, tecnologia de mainframe e viagens. Cada entrada é uma mistura única: relatos de viagem com fotos, filmes, links, artigos e desenhos, sempre buscando enriquecer a experiência de quem lê. Sou quase um turista profissional: adoro dormir em uma cama diferente, acordar em um lugar novo e registrar tudo com minha câmera sempre à mão. Entre uma viagem e outra, compartilho também reflexões sobre cultura otaku/animes

Mostrar mensagens com a etiqueta sysplex. Mostrar todas as mensagens

quarta-feira, 8 de abril de 2026

💥 APERTA O ENTER E DERRUBA O DATA CENTER: SOBREVIVA AO LAB DE RESILIÊNCIA IBM Z

Bellacosa Mainframe experimentos reisiliencia em IBM Z

💥 APERTA O ENTER E DERRUBA O DATA CENTER: SOBREVIVA AO LAB DE RESILIÊNCIA IBM Z

🧪 Laboratório prático — do ABEND ao FAILOVER sem perder um byte

🎯 OBJETIVO DO LAB

Você vai simular:

💣 Falha de aplicação (ABEND)
⚙️ Restart automático (ARM)
🧩 Continuidade (Sysplex mental model)
🌍 Disaster Recovery (simulado estilo GDPS)
📊 Validação de RPO/RTO

👉 Resultado esperado:
Sistema continua — usuário nem percebe

🧠 CENÁRIO (VIDA REAL)

Você é dev COBOL em um banco:

Batch crítico processa pagamentos
Roda em z/OS
Usa Db2
Integra com CICS

💥 E claro… algo vai dar errado.

🧪 LAB 1 — “PROVOQUE O CAOS” (ABEND CONTROLADO)

🎯 Objetivo:

Gerar uma falha real

📄 Passo 1 — Programa COBOL com erro


IDENTIFICATION DIVISION.
PROGRAM-ID. LABFAIL.

DATA DIVISION.
WORKING-STORAGE SECTION.
01 WS-NUM PIC 9(3) VALUE ZEROS.
01 WS-VAL PIC 9(3).

PROCEDURE DIVISION.
    MOVE 100 TO WS-VAL
    DIVIDE WS-VAL BY WS-NUM GIVING WS-VAL
    DISPLAY 'PROCESSO FINALIZADO'
    STOP RUN.

👉 Resultado esperado:


S0C7 ou S0CB (divisão por zero)

💡 Comentário Bellacosa

“Se você nunca causou um ABEND de propósito… você ainda não domina o sistema.”

⚙️ LAB 2 — “DEIXA O SISTEMA SE VIRAR” (ARM)

🎯 Objetivo:

Simular restart automático

🧠 Conceito

ARM = Automatic Restart Manager

👉 Ele reinicia automaticamente o que caiu

📄 Passo 2 — Simulação lógica


JOB FAIL → ABEND
ARM detecta → restart automático
JOB reinicia → continua fluxo

🧪 Teste

Execute o programa com erro
Corrija o erro (WS-NUM ≠ 0)
Reexecute

👉 Agora imagine:

ARM faria isso sozinho
Sem operador

💡 Insight

“ARM é o operador que nunca dorme.”

🧩 LAB 3 — “NÃO PARE O SISTEMA” (MENTALIDADE SYSPLEX)

🎯 Objetivo:

Entender continuidade

🧠 Simulação conceitual

Imagine:

LPAR A → falha
LPAR B → assume

📄 Fluxo


Transação → LPAR A
Falha → redireciona → LPAR B
Usuário continua

💡 Easter Egg 🔥

“Sysplex não é cluster…
é cluster que não te deixa na mão.”

🌍 LAB 4 — “PERDEMOS O DATA CENTER” (DR SIMULADO)

🎯 Objetivo:

Simular desastre total

🧠 Cenário

Site A caiu 💥
Site B assume

📄 Exercício

Imagine seu sistema rodando
“Desligue” mentalmente o ambiente
Suba outro ambiente

👉 Perguntas:

Quanto tempo levou? (RTO)
Perdeu dados? (RPO)

💡 Resposta ideal

RTO → segundos/minutos
RPO → zero

🔥 Insight

“Se você precisa pensar muito no DR… ele já falhou.”

🧨 LAB 5 — “DESCUBRA SEU SPOF”

🎯 Objetivo:

Encontrar ponto único de falha

📄 Checklist

Um único job crítico?
Um único DB?
Um único operador? 😅

💡 Easter Egg

SPOF mais comum:
👉 Interface Teclado-Cadeira

🤖 LAB 6 — “AUTOMA OU MORRE”

🎯 Objetivo:

Entender automação

📄 Cenário

Sem automação:

detectar
analisar
agir

👉 minutos ou horas

Com automação:

detectar
agir

👉 segundos

💡 Insight brutal

“Sem automação, seu RTO é humano.”

🧪 LAB 7 — DR TEST (O GRANDE FINAL)

🎯 Objetivo:

Validar tudo

📄 Simulação

Derrube o “ambiente”
Ative backup
Valide sistema

📊 Checklist

Sistema subiu?
Dados íntegros?
Tempo aceitável?

💡 Regra de ouro

“DR não testado = DR inexistente”

🧠 CONSOLIDAÇÃO FINAL

🔗 RELAÇÃO DOS CONCEITOS

RAS → evita impacto
Models → define arquitetura
Planning → garante execução

💥 Fluxo completo


Falha pequena → ARM resolve
Falha média → Sysplex resolve
Desastre total → DR/GDPS resolve

🏁 MISSÃO FINAL DO LAB

👉 Você não está testando sistema
👉 Você está testando sobrevivência do negócio

🔥 FRASE FINAL

“No mainframe, o erro não é falhar…
é deixar o usuário perceber.”

terça-feira, 31 de março de 2026

🔥 SEUS DADOS NÃO MORAM NO DISCO… ELES VIAJAM PELO UNIVERSO DO z/OS 😳

Bellacosa Mainframe num mergulho no mundo storage do z/os

🔥 SEUS DADOS NÃO MORAM NO DISCO… ELES VIAJAM PELO UNIVERSO DO z/OS 😳

O guia proibido de Storage Management que revela como memória, disco e sysplex trabalham juntos (e quase ninguém entende)

Você acha que seu dataset “fica no disco”?

👉 Não fica.

No z/OS, dados:

sobem pra memória
descem pra disco
migram pra fita
aparecem em outro LPAR
e até existem fora do seu address space

💥 “No mainframe, dado não tem endereço fixo… tem estratégia.”

Se você quer sair do nível “usuário” e pensar como engenheiro de sistema, esse é o mapa completo 👊🔥

🧠 1. ADDRESS SPACE — O UNIVERSO DO PROGRAMA

Cada programa roda em um address space isolado.

🔥 O que isso significa?

memória protegida
ambiente independente
controle total do sistema

💡 Insight

cada address space é um “universo privado”

⚡ 2. 64-BIT ADDRESSING — MEMÓRIA INFINITA (QUASE)

Com 64 bits:

👉 até 16 EXABYTES

🔥 Evolução histórica

Era	Limite
24-bit	16MB 😱
31-bit	2GB
👉 64-bit	16EB 🤯

💡 Tradução Bellacosa

“acabou a desculpa de falta de memória”

🧠 Uso real

Java
Db2
middleware
grandes buffers

🧩 3. DAT — A MÁGICA DA TRADUÇÃO

DAT (Dynamic Address Translation):

👉 converte endereço virtual → real

🔥 Sem DAT:

programa quebraria
memória não funcionaria

💡 Tradução

“você nunca acessa memória real diretamente”

🧠 4. STORAGE REQUESTS — COMO A MEMÓRIA É PEDIDA

Programas pedem memória via:

GETMAIN
STORAGE OBTAIN

🔥 O sistema decide:

onde alocar
em qual subpool
com qual proteção

💡 Insight

memória é gerenciada, não livre

🧱 5. SUBPOOLS — ORGANIZAÇÃO INTERNA

Memória é dividida em:

👉 subpools

🔥 Exemplos:

SP0 → sistema
SP229 → usuário

💡 Tradução

“cada tipo de dado tem seu bairro”

🌍 6. DATA SPACES & HIPERSPACES — FORA DO ADDRESS SPACE

🔹 Data Spaces

dados fora do address space
acessados via AR

🔹 Hiperspaces

alta performance
acesso indireto

🔥 Tradução Bellacosa

“memória extra fora do seu universo”

🧠 Exemplo


Programa → usa Data Space → grande volume de dados

⚡ 7. PAGING — QUANDO A MEMÓRIA NÃO CABE

Se falta memória:

👉 dados vão para disco (paging)

🔥 Fluxo


Memória cheia
 ↓
página vai para DASD
 ↓
quando necessário → volta

💡 Problema

👉 excesso de paging = sistema lento 💀

💾 8. FLASH STORAGE — O TURBO MODERNO

Flash (SSD):

baixa latência
alta velocidade
ideal para OLTP

💡 Uso

Db2
logs
datasets críticos

🔗 9. PARALLEL SYSPLEX — MEMÓRIA COMPARTILHADA ENTRE SISTEMAS

Aqui fica poderoso 😄

🔥 O que é?

Vários z/OS trabalhando juntos:

👉 como um só sistema

💡 Elementos:

LPARs
Coupling Facility (CF)
links de comunicação

🧠 Exemplo


LPAR A → acessa dado
LPAR B → acessa o mesmo dado

💡 Tradução

“dados compartilhados em tempo real”

🧠 10. COUPLING FACILITY (CF) — O CÉREBRO COMPARTILHADO

🔹 Função:

lock management
cache
filas

🔥 Tipos:

Internal CF
External CF

💡 Tradução Bellacosa

“CF = memória compartilhada do sysplex”

⚡ 11. DUPLEXING — ZERO PERDA

🔥 O que faz?

duplica dados
garante disponibilidade

💡 Exemplo


CF primário → falha
CF secundário → assume

🧨 Curiosidade

Sistema continua rodando sem impacto 😳

🧠 12. CF OPERATIONS — O QUE ACONTECE POR TRÁS

CF gerencia:

locks
buffers
filas

💡 Uso real

Db2 data sharing
CICS
IMS

⚙️ 13. STORAGE + I/O + CPU — TUDO CONECTADO

Nada funciona isolado:


Memória → I/O → CPU → WLM → Storage

💡 Insight

performance é resultado do conjunto

🔄 14. PASSO A PASSO COMPLETO


Programa inicia
 ↓
recebe address space
 ↓
pede memória (GETMAIN)
 ↓
DAT traduz endereço
 ↓
usa data space se necessário
 ↓
paging ocorre se faltar memória
 ↓
dados vão para disco/flash
 ↓
sysplex compartilha dados via CF
 ↓
duplex garante disponibilidade

🧨 CURIOSIDADES (NÍVEL ROOT)

🤯 1. Você não controla diretamente onde o dado está

🔥 2. Dados podem estar fora do seu address space

💀 3. Paging excessivo mata performance

🧠 4. Sysplex permite vários sistemas compartilharem dados

⚡ 5. CF é o segredo da alta disponibilidade

🎯 RESUMO FINAL

✔ Address space = isolamento

✔ 64-bit = escala absurda

✔ DAT = tradução

✔ Subpools = organização

✔ Data space = expansão

✔ Paging = fallback

✔ Flash = velocidade

✔ Sysplex = escala

✔ CF = coordenação

✔ Duplexing = resiliência

💥 FRASE FINAL

“No z/OS, dados não ficam armazenados… eles são orquestrados entre memória, disco e múltiplos sistemas em tempo real.”

sexta-feira, 13 de fevereiro de 2026

🔥 “ENCLAVE NO z/OS: O JOB INVISÍVEL QUE MANDA MAIS QUE SEU COBOL” 💀

Bellacosa Mainframe analise o enclave no z/os

🔥 “ENCLAVE NO z/OS: O JOB INVISÍVEL QUE MANDA MAIS QUE SEU COBOL” 💀

Se você acha que quem manda no z/OS é o seu JOB, seu STEP ou seu programa COBOL… já começou errado 😈
Existe uma entidade silenciosa, poderosa e MUITO mais inteligente: o ENCLAVE.

E depois que você entende isso… nunca mais olha para performance, WLM ou CICS da mesma forma.

🧠 O QUE É UM ENCLAVE (SEM MIMIMI)

Um enclave no z/OS é uma unidade lógica de trabalho gerenciada pelo WLM (Workload Manager).

👉 Tradução Bellacosa:

É como se fosse um “JOB fantasma” criado pelo sistema pra medir, priorizar e controlar o que realmente importa.

Ele não aparece no JES como um JOB comum.
Ele não está preso a um único address space.
Mas… ele é quem decide quanto CPU você ganha ou perde.

🏛️ ORIGEM — POR QUE ISSO EXISTE?

Lá atrás, no mundo pré-WLM, o controle era baseado em:

Prioridade fixa
Dispatching clássico
Regras estáticas

Problema? 😬
Ambientes modernos (CICS, DB2, WebSphere, Java, API REST) quebraram esse modelo.

👉 A IBM respondeu com o WLM Goal-Oriented:

E aí nasceu o ENCLAVE:

Para representar transações distribuídas
Para permitir gerenciamento baseado em objetivos (response time, velocity, etc.)
Para desacoplar trabalho de address spaces

💡 Ou seja:

O enclave nasceu quando o mainframe percebeu que o mundo virou distribuído.

⚙️ COMO FUNCIONA NA PRÁTICA

Imagine isso:

Um request entra via CICS
Faz chamada DB2
Vai pra MQ
Volta pro CICS

👉 Isso tudo NÃO é um único processo linear

O z/OS cria um ENCLAVE para representar esse fluxo como uma única entidade lógica

🔄 O enclave acompanha:

Tempo de CPU
Tempo de resposta
Esperas (I/O, lock, etc.)
Prioridade dinâmica (via WLM)

🎯 O PAPEL DO WLM (O VERDADEIRO CHEFE)

O WLM não gerencia JOBs diretamente.

Ele gerencia:

👉 ENCLAVES

Com base em:

Service Class
Importance
Performance goals

💡 Resultado:

Dois programas idênticos podem ter comportamentos COMPLETAMENTE diferentes dependendo do enclave.

🧨 EXEMPLO REAL (COBOL DEV VAI SENTIR)

Você roda:

Um batch COBOL via JCL
Uma transação CICS chamando o mesmo programa

Mesmo código… MAS:

Contexto	Quem manda
Batch	JES / Dispatching
CICS	ENCLAVE + WLM

👉 Resultado:

No CICS, o desempenho é governado pelo enclave
No batch, não

💀 É por isso que “funciona no batch mas é lento no online”

🕵️ TROUBLESHOOTING (OU: POR QUE SEU JOB APANHA)

Se algo está lento e você ignora enclave… você está investigando errado.

🔍 Sintomas clássicos:

CPU baixa, mas resposta ruim
Transação lenta “sem motivo”
WLM aparentemente ignorando você

🧠 Possíveis causas:

Service class errada
Importance baixa
Goal impossível (ex: response time irreal)
Contenção em recursos compartilhados

🛠️ ONDE INVESTIGAR

RMF Monitor III
SMF 72 (WLM)
SDSF (delay reason)
CICS statistics

💡 Dica Bellacosa:

Se não olhou SMF 72, você não investigou WLM de verdade.

🧩 EASTER EGG (POUCA GENTE SABE)

🔥 Nem todo enclave é igual:

Existem:

Independent enclaves
Dependent enclaves

👉 Dependente = herda contexto
👉 Independente = vive sua própria vida

💡 E aqui vem o pulo do gato:

Um enclave pode atravessar múltiplos sistemas via sysplex

Sim… o “fantasma” atravessa LPARs 👻

🤯 CURIOSIDADES QUE EXPLODEM A MENTE

Enclaves são essenciais para Java no z/OS
DB2 usa enclaves para workloads distribuídos (DRDA)
z/OS Connect depende disso pra API REST

👉 Ou seja:

Sem enclave… não existe mainframe moderno

⚠️ ERROS CLÁSSICOS (E CAROS)

❌ “Aumenta a prioridade do address space”
👉 ERRADO — quem manda é o enclave

❌ “O problema é CPU”
👉 Nem sempre — pode ser política WLM

❌ “Batch está ok, então produção também está”
👉 Contexto diferente = enclave diferente

💬 COMENTÁRIO NO ESTILO RAIZ

Enclave é aquele tipo de coisa que:

Ninguém te ensina direito
Todo mundo usa sem saber
E quando dá problema… vira caos

💀

🧠 RESUMO DIRETO (SEM ENROLAR)

👉 Enclave é:

Uma unidade lógica de trabalho
Controlada pelo WLM
Independente de address space
Base para performance moderna no z/OS

🔥 FRASE PRA GRUDAR NA SUA CABEÇA

“Você acha que está rodando um programa…
mas quem está sendo julgado é o seu ENCLAVE.”

quarta-feira, 7 de janeiro de 2026

🔥 SEU VSAM ESTÁ TE SEGURANDO… OU TE LIMITANDO?

Bellacosa Mainframe apresenta o VSAM RLS superpoderes em dataset

🔥 SEU VSAM ESTÁ TE SEGURANDO… OU TE LIMITANDO?

💣 VSAM RLS: o modo transacional escondido do z/OS que poucos dominam (e menos ainda sabem usar direito)

Se você ainda trata VSAM como dataset batch com lock global…
👉 você está deixando throughput, concorrência e disponibilidade na mesa.

Hoje vamos abrir a caixa-preta do VSAM RLS (Record-Level Sharing) — no nível que interessa para quem já respira COBOL, CICS e JCL.

🧠 Origem: quando o VSAM precisou evoluir ou morrer

O VSAM nasceu lá atrás, nos tempos de:

Batch dominante
Processamento sequencial
Lock em nível de dataset

Só que o mundo mudou:

CICS explodiu
OLTP virou padrão
Multi-LPAR virou realidade

👉 E o VSAM começou a virar gargalo.

🚀 O nascimento do RLS

O RLS surgiu no z/OS como resposta direta a esse problema:

👉 permitir concorrência real sem reescrever tudo para DB2

Baseado em:

👉 IBM Coupling Facility

💡 Data de adoção forte: final dos anos 90 / início dos 2000 (z/OS já consolidando Parallel Sysplex)

⚙️ O que é VSAM RLS (sem romantismo)

VSAM RLS é:

Um mecanismo que move o controle de lock e cache para fora do dataset e coloca no Coupling Facility

Resultado:

🔐 Lock em nível de registro (ou CI)
🧠 Cache compartilhado entre LPARs
⚡ Acesso simultâneo real

🔍 Como funciona (visão de arquitetura)

Sem RLS:


Programa → VSAM → Disco
           (lock global)

Com RLS:


Programa → VSAM → CF (lock/cache) → Disco

👉 O CF vira o “gerente de concorrência”

🧪 IDCAMS: como nasce um VSAM RLS

Aqui começa a responsabilidade.


DEFINE CLUSTER(NAME(PROD.CLIENTES.RLS)
       INDEXED
       KEYS(10 0)
       RECORDSIZE(100 100)
       SHAREOPTIONS(3 3)
       LOG(UNDO)
       FREESPACE(10 10)
       )

⚠️ Pontos críticos

SHAREOPTIONS(3 3) → obrigatório para multi-acesso
LOG(UNDO) → rollback consistente
Dataset precisa ser SMS-managed

📖 Exemplo COBOL – leitura com RLS


SELECT CLIENTES ASSIGN TO VSAMFILE
       ORGANIZATION IS INDEXED
       ACCESS MODE IS RANDOM
       RECORD KEY IS WS-KEY
       FILE STATUS IS WS-STATUS.

READ CLIENTES
    INVALID KEY
        DISPLAY "NAO ENCONTRADO"
END-READ.

👉 Aqui o lock é gerenciado pelo RLS automaticamente.

✍️ Exemplo COBOL – gravação com concorrência


WRITE REGISTRO-CLIENTE
    INVALID KEY
        DISPLAY "ERRO NA GRAVACAO"
END-WRITE.

Ou update:


READ CLIENTES
UPDATE
    INVALID KEY
        ...
END-READ.

REWRITE REGISTRO-CLIENTE.

💡 O segredo:

👉 O lock é no registro, não no dataset.

⚖️ Locking: onde mora o poder (e o perigo)

Tipos:

🔹 RECORD → alta concorrência (recomendado)
🔹 CI → menos overhead, mais contenção

📊 Monitoramento (vida real)

Ferramentas:

RMF
SMF

Métricas que importam

Lock contention
CF response time
Cache hit ratio
Buffer efficiency

🚀 Pontos fortes (quando bem usado)

✔️ Concorrência absurda

Batch + CICS juntos
Sem fila de espera

✔️ Alta disponibilidade

CF permite resiliência
Recovery consistente

✔️ Escalabilidade

Multi-LPAR sem dor

💣 Pontos fracos (o lado sombrio)

❌ Complexidade operacional

Não é plug-and-play
Exige tuning constante

❌ Dependência do CF

Se o CF sofre…

👉 todo mundo sofre

❌ Debug mais difícil

Deadlock não é trivial
Problemas são distribuídos

⚠️ Limitações (que pegam senior distraído)

❌ Skip-sequential → proibido
❌ Sequential update clássico → problema
❌ Batch mal escrito → vira gargalo

🧪 Curiosidades de bastidor

💡 VSAM RLS é quase um “NoSQL raiz”

Sem SQL
Controle transacional básico
Altíssimo desempenho

💡 RLS vs DB2

VSAM RLS	DB2
Ultra rápido	Mais completo
Menos overhead	Mais recursos
Sem SQL	SQL completo

🧠 Caso real (modo guerra)

Cenário:

5 regiões CICS
2 jobs batch
1 dataset VSAM crítico

Sem RLS:

👉 fila de espera
👉 SLA estourando

Com RLS:

👉 concorrência plena
👉 throughput triplicado

⚙️ Tuning (o que separa júnior de senior)

🎯 Ajustes críticos

Buffer pool
Estrutura do CF
Lock level
Cache strategy

💡 Regra de ouro

RLS mal configurado é pior que não usar RLS

🔥 Insight final (Bellacosa mode ON)

VSAM RLS é isso:

“Transformar VSAM de arquivo batch em engine transacional distribuído”

Se você domina RLS:

👉 você reduz fila
👉 aumenta throughput
👉 salva SLA

Se você ignora:

👉 seu sistema vira gargalo invisível

☕ Fechamento

VSAM não morreu.

Ele só evoluiu.

E o RLS é o ponto onde:

👉 legado encontra alta performance
👉 batch encontra tempo real
👉 e o COBOL continua reinando 👑

sábado, 20 de julho de 2024

Road Map para Aprender Mainframe

O que um jovem padawan deve aprender para ser um especialista na Stack Mainframe. Um caminho com inúmeras possibilidades, requer esforço e dedicação, porém os frutos condizem ao esforço. Descubra o z/OS, codifique em COBOL, crie queries no SQL DB2 e vá além. #ibm #mainframe #cobol #cics #db2 #jcl #sdsf #qsam #vsam #query #sql #etl #jobs #procs #jes2 #lpar #sysplex

terça-feira, 2 de setembro de 2014

💣🔥 MONOPLEX vs SYSPLEX — QUANDO O SISTEMA PARA DE SER UMA MÁQUINA E VIRA UM ORGANISMO 🔥💣

Bellacosa Mainframe monoplex e sysplex o poder do hardware

💣🔥 MONOPLEX vs SYSPLEX — QUANDO O SISTEMA PARA DE SER UMA MÁQUINA E VIRA UM ORGANISMO 🔥💣

🧾 Expansão Comentada

Se você já trabalhou com mainframe, provavelmente já ouviu os termos monoplex e sysplex.
Mas a diferença entre eles vai muito além de arquitetura.

👉 Não é tecnologia. É mentalidade operacional.

🧠 MONOPLEX — O REINO DO “UMA MÁQUINA SÓ”

✔ Tradução direta:

Um monoplex é um único sistema mainframe rodando de forma independente.

💡 Expansão Bellacosa:

Você tem:

Um único z/OS ativo
Recursos locais
Controle centralizado
Tudo dependendo de UMA instância

👉 É como um JOB crítico rodando sem checkpoint:

Se falhar… volta do zero
Se parar… para tudo

⚠️ Limitações reais (que pouca gente fala):

Janela de manutenção obrigatória
Escala vertical cara (mais CPU, mais memória, mais $$$)
Ponto único de falha lógica
Isolamento entre workloads

💣 Analogia mainframe raiz:

Monoplex é um batch gigante rodando sozinho na fila JES2.
Se ele ABENDA… não tem fallback.

⚙️ SYSPLEX — QUANDO O MAINFRAME APRENDE A TRABALHAR EM EQUIPE

✔ Tradução direta:

Um sysplex conecta múltiplos mainframes em um ambiente cooperativo unificado.

💡 Expansão Bellacosa:

Aqui o jogo muda completamente:

Vários sistemas z/OS trabalhando juntos
Workload distribuído dinamicamente
Recursos compartilhados em tempo real
Sistema se comporta como UMA entidade lógica

🧩 Componentes que fazem a mágica acontecer:

Workload Manager (WLM) → decide quem executa o quê
Coupling Facility → cérebro compartilhado
XCF → comunicação entre sistemas

💣 Analogia Bellacosa:

Sysplex é um cluster de jobs cooperando via checkpoint compartilhado em memória.
Um falha… outro continua de onde parou.

🔥 O PONTO MAIS IMPORTANTE (E MAIS IGNORADO)

Você disse:

“No monoplex, disponibilidade é uptime de uma máquina
No sysplex, disponibilidade é projetada no sistema”

💥 Isso aqui é ouro.

Mas vamos aprofundar:

🧠 Monoplex:

Alta disponibilidade = evitar falhar

⚙️ Sysplex:

Alta disponibilidade = falhar sem impacto

👉 Isso muda tudo.

⚡ ESCALABILIDADE — O PULO DE MATURIDADE

Monoplex:

Scale-up (vertical)
Limite físico inevitável

Sysplex:

Scale-out (horizontal)
Adição de nós sem parada

💣 Analogia moderna:

Monoplex = subir a máquina no cloud (vertical scaling)
Sysplex = cluster Kubernetes antes do Kubernetes existir

💥 FALHA: O TESTE FINAL DE ARQUITETURA

Monoplex:

Falha = incidente
Recovery = reativo

Sysplex:

Falha = evento esperado
Recovery = automático

🧨 Exemplo real (nível produção):

Imagine:

Banco rodando CICS + DB2
Milhares de transações por segundo

👉 Em monoplex:

IPL → sistema indisponível

👉 Em sysplex:

Uma LPAR cai
WLM redistribui carga
Usuário nem percebe

🧬 O SEGREDO DO SYSPLEX (QUE O CLOUD AINDA PERSEGUE)

O sysplex resolve um problema que até hoje dá dor de cabeça em arquitetura distribuída:

👉 Consistência + disponibilidade + performance

Com ajuda do:

Coupling Facility (lock, cache, list structures)

💣 Traduzindo brutalmente:

Enquanto sistemas modernos brigam com:

cache inconsistente
race condition
eventual consistency

👉 O sysplex já fazia:

lock global
cache coerente
sincronização em hardware

⚠️ VERDADE QUE NINGUÉM TE CONTA

Sysplex NÃO é mágico.

Se mal projetado:

CF vira gargalo
WLM mal configurado gera desequilíbrio
Links saturam

👉 Ou seja:

Sysplex ruim é pior que monoplex bem feito.

🌍 O INSIGHT FINAL (O MAIS IMPORTANTE DE TODOS)

Você falou:

“o futuro já estava aqui”

💥 Vamos elevar isso:

O mainframe não ficou ultrapassado.
Ele resolveu cedo demais problemas que o resto da indústria só entendeu depois.

🚀 FRASE PRA CRAVAR

Monoplex é força.
Sysplex é estratégia.

segunda-feira, 9 de janeiro de 2012

🔥 Conhecimento básico sobre aplicações distribuídas – um guia para mainframers que sobreviveram ao monólito

🔥 Conhecimento básico sobre aplicações distribuídas – um guia para mainframers que sobreviveram ao monólito

1️⃣ Introdução: quando o monólito saiu da jaula

Mainframer raiz conhece bem o monólito confiável: CICS firme, DB2 consistente, batch noturno pontual como relógio suíço. Durante décadas, aplicação distribuída era vista como “coisa de Unix instável” ou “modinha client-server”.

Mas o mundo girou. A web cresceu, o mobile explodiu, a nuvem virou padrão e, de repente, o monólito começou a ser fatiado em serviços. Nasciam as aplicações distribuídas — e com elas, novos problemas… e velhos conceitos que o mainframe já conhecia muito bem.

💡 Easter egg: se você já lidou com VTAM, MQSeries e sysplex, você já entendeu aplicações distribuídas… só não sabia o nome moderno disso.

2️⃣ O que são aplicações distribuídas (sem buzzword)

Uma aplicação distribuída é aquela em que:

O processamento ocorre em vários nós
Cada parte da aplicação pode rodar em máquinas, containers ou regiões diferentes
A comunicação acontece por rede, não por memória compartilhada

Exemplos modernos:

Microservices em Kubernetes
APIs REST + filas (Kafka, MQ, RabbitMQ)
Frontend web → backend → banco → cache → serviços externos

No fundo, é o velho conceito de desacoplamento, agora amplificado.

3️⃣ Paralelos diretos com o mundo mainframe 🧠

Mundo Mainframe	Mundo Distribuído
CICS Transaction	Microservice
MQSeries	Event Streaming
Sysplex	Cluster
SMF / RMF	Telemetria / Observabilidade
Abend	Exception distribuída
Batch encadeado	Pipelines assíncronos

👉 Conclusão Bellacosa: mainframers não estão atrasados — estão adiantados há 30 anos.

4️⃣ Principais desafios (spoiler: não são novos)

🔹 Latência

No mainframe, o gargalo era I/O.
No distribuído, é rede + serialização + hops excessivos.

🔹 Falhas parciais

No mundo distribuído:

“Se algo pode falhar, vai falhar, mas só um pedaço.”

Isso lembra:

Regiões CICS indisponíveis
LPAR isolada
Subsystem down às 03:12 😈

🔹 Consistência

Aqui entra o famoso CAP Theorem — mas mainframer chama isso de:

“Escolher entre disponibilidade e integridade quando o caldo entorna.”

5️⃣ Conceitos essenciais que todo mainframer deve dominar

✔️ Comunicação síncrona vs assíncrona

Síncrona: REST, RPC (espera resposta)
Assíncrona: filas, eventos, fire-and-forget
👉 MQ old school total.

✔️ Escalabilidade horizontal

Escalar mais instâncias, não máquinas maiores
(trauma de quem pedia upgrade de MIPS aprovado em comitê 😅)

✔️ Observabilidade

Logs
Métricas
Traces distribuídos

📌 Curiosidade: SMF foi o avô do tracing moderno.

6️⃣ Passo a passo mental para entender qualquer sistema distribuído

1️⃣ Identifique quais serviços existem
2️⃣ Veja como eles se comunicam
3️⃣ Descubra onde estão os pontos de falha
4️⃣ Analise latência e dependências
5️⃣ Verifique quem é o dono do dado
6️⃣ Observe como o sistema se comporta quando algo cai

🧨 Dica Bellacosa: desligue mentalmente um serviço e pergunte
“O que quebra primeiro?”

7️⃣ Guia de estudo para mainframers curiosos 📚

Conceitos

Microservices vs Monólito
Event-driven architecture
Observabilidade
Resiliência e retries

Ferramentas modernas (com alma antiga)

Instana / Dynatrace → RMF da nuvem
Prometheus → SMF open source
Kafka → MQSeries com esteroides
Kubernetes → Sysplex com YAML

8️⃣ Aplicações práticas no dia a dia

Integrar mainframe com APIs modernas
Expor transações CICS como serviços
Monitorar ambientes híbridos
Diagnosticar falhas ponta a ponta
Atuar como tradutor cultural entre legado e cloud

🎯 Mainframer que entende distribuído vira peça-chave.

9️⃣ Comentário final (meia-noite, café frio ☕)

Aplicações distribuídas não são o fim do mainframe.
São apenas o mesmo problema antigo, rodando em mais lugares, com nomes novos e menos disciplina.

Quem sobreviveu a:

Batch quebrado em fechamento
Deadlock às 02h
Região CICS instável em dia útil

…tem todas as credenciais para dominar o mundo distribuído.

🖤 El Jefe Midnight Lunch aprova:
legado não é atraso — é memória de guerra.

Translate

quarta-feira, 8 de abril de 2026

💥 APERTA O ENTER E DERRUBA O DATA CENTER: SOBREVIVA AO LAB DE RESILIÊNCIA IBM Z

💥 APERTA O ENTER E DERRUBA O DATA CENTER: SOBREVIVA AO LAB DE RESILIÊNCIA IBM Z

🧪 Laboratório prático — do ABEND ao FAILOVER sem perder um byte

🎯 OBJETIVO DO LAB

🧠 CENÁRIO (VIDA REAL)

🧪 LAB 1 — “PROVOQUE O CAOS” (ABEND CONTROLADO)

🎯 Objetivo:

📄 Passo 1 — Programa COBOL com erro

💡 Comentário Bellacosa

⚙️ LAB 2 — “DEIXA O SISTEMA SE VIRAR” (ARM)

🎯 Objetivo:

🧠 Conceito

📄 Passo 2 — Simulação lógica

🧪 Teste

💡 Insight

🧩 LAB 3 — “NÃO PARE O SISTEMA” (MENTALIDADE SYSPLEX)

🎯 Objetivo:

🧠 Simulação conceitual

📄 Fluxo

💡 Easter Egg 🔥

🌍 LAB 4 — “PERDEMOS O DATA CENTER” (DR SIMULADO)

🎯 Objetivo:

🧠 Cenário

📄 Exercício

💡 Resposta ideal

🔥 Insight

🧨 LAB 5 — “DESCUBRA SEU SPOF”

🎯 Objetivo:

📄 Checklist

💡 Easter Egg

🤖 LAB 6 — “AUTOMA OU MORRE”

🎯 Objetivo:

📄 Cenário

💡 Insight brutal

🧪 LAB 7 — DR TEST (O GRANDE FINAL)

🎯 Objetivo:

📄 Simulação

📊 Checklist

💡 Regra de ouro

🧠 CONSOLIDAÇÃO FINAL

🔗 RELAÇÃO DOS CONCEITOS

💥 Fluxo completo

🏁 MISSÃO FINAL DO LAB

🔥 FRASE FINAL

terça-feira, 31 de março de 2026

🔥 SEUS DADOS NÃO MORAM NO DISCO… ELES VIAJAM PELO UNIVERSO DO z/OS 😳

🔥 SEUS DADOS NÃO MORAM NO DISCO… ELES VIAJAM PELO UNIVERSO DO z/OS 😳

O guia proibido de Storage Management que revela como memória, disco e sysplex trabalham juntos (e quase ninguém entende)

🧠 1. ADDRESS SPACE — O UNIVERSO DO PROGRAMA

🔥 O que isso significa?

💡 Insight

⚡ 2. 64-BIT ADDRESSING — MEMÓRIA INFINITA (QUASE)

🔥 Evolução histórica

💡 Tradução Bellacosa

🧠 Uso real

🧩 3. DAT — A MÁGICA DA TRADUÇÃO

🔥 Sem DAT:

💡 Tradução

🧠 4. STORAGE REQUESTS — COMO A MEMÓRIA É PEDIDA

🔥 O sistema decide:

💡 Insight

🧱 5. SUBPOOLS — ORGANIZAÇÃO INTERNA

🔥 Exemplos:

💡 Tradução

🌍 6. DATA SPACES & HIPERSPACES — FORA DO ADDRESS SPACE

🔹 Data Spaces

🔹 Hiperspaces

🔥 Tradução Bellacosa

🧠 Exemplo

⚡ 7. PAGING — QUANDO A MEMÓRIA NÃO CABE

🔥 Fluxo

💡 Problema

💾 8. FLASH STORAGE — O TURBO MODERNO

💡 Uso

🔗 9. PARALLEL SYSPLEX — MEMÓRIA COMPARTILHADA ENTRE SISTEMAS

🔥 O que é?

💡 Elementos:

🧠 Exemplo