✨ Bem-vindo ao meu espaço! ✨ Este blog é o diário de um otaku apaixonado por animes, tecnologia de mainframe e viagens. Cada entrada é uma mistura única: relatos de viagem com fotos, filmes, links, artigos e desenhos, sempre buscando enriquecer a experiência de quem lê. Sou quase um turista profissional: adoro dormir em uma cama diferente, acordar em um lugar novo e registrar tudo com minha câmera sempre à mão. Entre uma viagem e outra, compartilho também reflexões sobre cultura otaku/animes
domingo, 25 de fevereiro de 2024
MVS o parrudo sistema operacional dos IBM Mainframes
terça-feira, 28 de julho de 2020
☕🔥 Suporte à Produção Mainframe — engenharia operacional em estado bruto
| Bellacosa Mainframe apresenta Suporte a Produção |
☕🔥 Suporte à Produção Mainframe — engenharia operacional em estado bruto
Se você já deu CANCEL com o coração na mão, já leu dump em hexadecimal, já decorou mensagem $HASP melhor que CPF, então este texto não é para iniciantes.
Aqui falamos de Produção de verdade. Sem romantização. Sem power-point bonito.
🧠 Suporte à Produção Mainframe ≠ Operação
É engenharia operacional sob carga real.
Produção não é:
-
Rodar job
-
Reiniciar STC
-
Abrir chamado
Produção é:
-
Análise de impacto
-
Decisão em ambiente crítico
-
Entendimento sistêmico do z/OS
-
Correlação entre eventos aparentemente desconexos
Produção é onde o design encontra a realidade — e geralmente perde.
🕰️ Raiz Histórica (para quem veio do MVS, não do YouTube)
O Suporte à Produção nasce quando:
-
O batch deixou de ser “linear”
-
O online passou a ser 24x7
-
O negócio começou a depender de janela de processamento
-
O erro deixou de ser aceitável
A evolução foi clara:
-
Operador de console →
-
Analista de Produção →
-
Especialista em estabilidade operacional
Hoje, Produção é a última linha de defesa entre o z/OS e o prejuízo financeiro.
🎯 Objetivo Real do Suporte à Produção (versão sem marketing)
-
Garantir throughput, não apenas execução
-
Controlar contenção, não apenas erro
-
Preservar integridade transacional
-
Manter SLA, RTO e RPO
-
Atuar antes do incidente virar crise
☕ Veterano sabe:
Produção não corrige código — corrige efeito colateral.
🧩 Arquitetura de Conhecimento (o que separa júnior de veterano)
🖥️ z/OS — domínio do núcleo
-
JES2/JES3, initiators, classes, priorities
-
Spool contention
-
ENQ/DEQ, RESERVE, latch
-
WTOR, automation hooks
-
Dumps SVC vs SYSMDUMP
🔥 Apimentado:
Quem não entende JES não entende produção.
🧠 CICS — transação é sagrada
-
Task Control
-
Storage violation
-
Transaction isolation
-
Deadlock silencioso
-
Dumps DSNAP / CEEDUMP
☕ El Jefe truth:
CICS não cai — ele sangra em silêncio.
📬 MQ — quando o assíncrono vira gargalo
-
Depth x High/Low Threshold
-
Channels retrying
-
Poison message
-
Commit vs rollback
-
Impacto no batch e no online
🔥 Easter egg:
Fila cheia é sintoma, não causa.
🔌 Integration Bus (Broker)
-
Flow degradation
-
Message backlog
-
XML/JSON parsing cost
-
CPU vs I/O trade-off
-
Propagação de erro invisível
☕ Fofoquice técnica:
Quando o Broker falha, todo mundo aponta para o mainframe.
🧪 REXX — automação tática
-
Monitoramento ativo
-
Ações condicionais
-
Coleta de evidência
-
Resposta automática a eventos
-
Integração com SDSF, consoles e logs
🔥 Produção sem REXX é operação cega.
🗄️ DB2 Utilities — o campo minado
-
REORG mal planejado
-
RUNSTATS atrasado
-
Lock escalation
-
Deadlock intermitente
-
Log pressure
☕ Frase clássica:
“Não mexe agora… deixa rodar.”
🌐 WebSphere / Acesso Remoto
-
JVM pressure
-
Thread starvation
-
Timeout mascarado
-
Latência invisível
-
Cascata de falhas
🔥 Curiosidade:
O Web cai rápido. O mainframe aguenta a culpa.
🔍 Funcionamento Real em Produção (sem filtro)
-
Sintoma aparece longe da causa
-
Métrica parece normal
-
SLA corre
-
Dump gerado
-
Análise cruzada (JES + CICS + DB2 + MQ)
-
Decisão com risco calculado
-
Execução mínima, impacto máximo
-
Ambiente estabiliza
-
Post-mortem técnico
-
Documentação (que ninguém lê… até precisar)
🧠 Mentalidade do Veterano
✔️ Não confia em “achismo”
✔️ Não executa comando sem rollback mental
✔️ Pensa em efeito dominó
✔️ Prefere degradar a parar
✔️ Sabe quando não agir
☕🔥 Regra de ouro:
Em Produção, o comando mais perigoso é o que “sempre funcionou”.
🥚 Easter Eggs de Produção
-
Todo ambiente tem um job que “ninguém encosta”
-
Sempre existe um dataset com DISP=SHR que não deveria
-
Todo incidente grave começa com:
“Isso nunca aconteceu antes…”
-
O melhor analista é o que não aparece no incidente report
🧨 Conclusão — El Jefe Midnight Lunch Manifesto
Suporte à Produção Mainframe é:
-
Arquitetura viva
-
Engenharia sob estresse
-
Decisão sem margem de erro
-
Responsabilidade sem aplauso
Não é glamour.
Não é palco.
É confiança operacional.
☕🔥 Se você já sobreviveu a uma madrugada de produção,
você sabe:
Produção não ensina — ela seleciona.
sexta-feira, 1 de outubro de 2010
☕🔥 RACF Hardcore — Segurança Mainframe sem verniz
| Bellacosa Mainframe apresenta o RACF |
☕🔥 RACF Hardcore — Segurança Mainframe sem verniz
Se você já perdeu acesso ao próprio TSO, já bloqueou produção com um PERMIT mal dado, ou já ouviu
“foi só uma alteração de RACF…”
então este texto é para você.
Aqui não tem introdução infantil.
Aqui é RACF raiz, técnico, sistêmico e perigoso — do jeito que veterano respeita.
🕰️ História & Origem — por que o RACF nasceu paranoico
O RACF (Resource Access Control Facility) surge nos anos 70, quando a IBM percebeu que:
Controle por good behavior não escala
Segurança precisava ser centralizada
Auditoria não podia ser opcional
RACF foi desenhado para:
Negar por padrão
Controlar quem, o quê, quando e como
Integrar com o núcleo do z/OS
☕ Verdade inconveniente:
RACF não confia nem no SYSADM. E está certo.
🔐 Por onde começar com Segurança (visão de veterano)
Segurança não começa no comando. Começa no modelo mental.
Princípios reais:
Least Privilege
Segregation of Duties
Accountability
Auditabilidade
🔥 Easter egg:
Ambiente “funcionando” ≠ ambiente “seguro”.
🏗️ A Estrutura de Grupos — o esqueleto invisível
Grupos RACF não são “organizacionais”.
São domínios de autoridade.
Grupos pais controlam filhos
OWNER ≠ SUPGROUP
Hierarquia mal desenhada vira bomba relógio
📌 Exemplo técnico:
ADDGROUP FINANCE SUPGROUP(SYS1) OWNER(SYS1)
ADDGROUP FINANCE.PAYROLL SUPGROUP(FINANCE)
☕ Comentário ácido:
Grupo mal definido é privilégio eterno.
⌨️ Os Comandos RACF — bisturis, não martelos
ADDUSER / DELUSER
ADDGROUP / DELGROUP
CONNECT / REMOVE
PERMIT
ALTUSER / ALTGROUP
SETROPTS
🔥 Regra de Produção:
Se você não sabe desfazer, não execute.
🗑️ Definindo & Excluindo Grupos RACF
Criar grupo é fácil.
Excluir é trauma.
Antes de um DELGROUP:
Usuários conectados?
Perfis com OWNER?
DATASET PROFILE ownership?
Surpresas em ACL herdada?
☕ Fofoquice técnica:
DELGROUP em produção é evento histórico.
👤 Definindo Usuários — mais que um ID
Um usuário RACF é:
Identidade
Responsabilidade
Risco
Campos críticos:
SPECIAL / OPERATIONS / AUDITOR
PASSWORD interval
REVOKE / RESUME
OMVS / DFP / CICS
📌 Exemplo:
ADDUSER JOSE NAME('JOSE SILVA') DFLTGRP(FINANCE) PASSDATE(30)
🔥 Easter egg:
Usuário genérico é pecado capital.
🔗 Conectando Usuários a Grupos
CONNECT é onde a segurança realmente acontece.
AUTHORITY (USE, READ, CONNECT, JOIN)
GROUP-SPECIAL
OWNER implícito
☕ Verdade nua:
CONNECT errado é privilégio que ninguém vê.
🗂️ Perfis de Conjunto de Dados (DATASET PROFILES)
O coração do RACF clássico.
HLQ como fronteira de poder
DISCRETIONARY ≠ MANDATORY
UACC mal definido = vazamento
📌 Exemplo:
ADDSD 'FINANCE.PAYROLL.**' OWNER(FINANCE) UACC(NONE)
PERMIT 'FINANCE.PAYROLL.**' ID(PAYUSR) ACCESS(READ)
🔥 Curiosidade:
UACC(READ) já causou mais incidente que bug de COBOL.
🌐 Perfis Gerais de Recursos (CLASS Profiles)
Aqui o RACF vira onipresente:
CICS
IMS
MQ
SDSF
OPERCMDS
FACILITY
☕ El Jefe warning:
Quem ignora classe FACILITY não entende z/OS moderno.
🧨 Recursos Especiais do RACF
SPECIAL
OPERATIONS
AUDITOR
TRUSTED
WARNING vs FAIL
🔥 Comentário venenoso:
SPECIAL demais é insegurança institucionalizada.
⚙️ O Comando SETROPTS — o painel nuclear
SETROPTS controla:
Ativação de classes
Auditoria
Regras globais
Password rules
📌 Exemplo:
SETROPTS CLASSACT(DATASET) RACLIST(DATASET) REFRESH
☕🔥 Regra sagrada:
SETROPTS sem planejamento vira outage invisível.
🔄 RACF Remote Sharing Facility (RRSF)
RACF em modo distribuído:
Compartilhamento de identidades
Replicação de perfis
Confiança entre sistemas
🔥 Curiosidade:
RRSF mal configurado espalha erro em escala industrial.
🔗 RACF e Sysplex — segurança em cluster
No Sysplex:
Database compartilhado
Consistência obrigatória
Propagação imediata
☕ Verdade dura:
No Sysplex, erro local vira problema global.
🧪 Programas Utilitários RACF
Ferramentas para quem não vive no ISPF:
IRRDBU00
IRRUT200
IRRICE
unloads para auditoria
Análise offline
🔥 Easter egg veterano:
Auditor sério não confia só em LISTUSER.
🧠 Mentalidade de Segurança Mainframe (nível veterano)
✔️ Segurança é processo, não produto
✔️ Tudo que não está definido será explorado
✔️ RACF não protege sistema — protege negócio
✔️ Auditor não é inimigo
✔️ Log é prova histórica
🥚 Easter Eggs & Fofoquices RACF
Todo ambiente tem um ID “histórico”
Sempre existe um dataset que “ninguém sabe de quem é”
Segurança forte incomoda — e é esse o objetivo
Incidente sério sempre começa com:
“Mas esse acesso sempre existiu…”
☕🔥 Conclusão — Manifesto El Jefe RACF
RACF não é:
Cadastro
Burocracia
Entrave
RACF é:
Arquitetura de confiança
Controle de risco
Linha final de defesa do z/OS
☕🔥 Se você domina RACF,
você não protege arquivos —
protege a empresa inteira.
quarta-feira, 1 de setembro de 2010
☕🖥️ Suporte à Produção Mainframe — o coração que mantém o z/OS batendo
| Bellacosa Mainframe apresenta Suporte a Produção |
☕🖥️ Suporte à Produção Mainframe — o coração que mantém o z/OS batendo
Se desenvolvimento é o cérebro, Suporte à Produção Mainframe é o sistema nervoso central do ambiente z/OS. É quem sente a dor antes do usuário ligar, quem age antes do SLA estourar e quem garante que o batch das 23h termine antes do café esfriar ☕.
Vamos destrinchar esse tema com história, funcionamento, aplicações práticas, dicas de guerra, curiosidades, easter eggs e aquela fofoquice técnica que só mainframer raiz conhece.
🕰️ Origem & História — de Operador de Sala ao Analista de Produção
Nos primórdios do mainframe:
Existia a sala de máquinas
Operadores ficavam de olho em luzes piscando, fitas rodando e impressoras cantando
Um abend era quase um evento social 😅
Com a evolução:
Chegaram MVS, JES2, SDSF, CICS online
Depois z/OS, DB2, MQ, WebSphere, Integration Bus
E o operador virou Analista de Suporte à Produção, com visão técnica, analítica e estratégica
👉 Hoje, Suporte à Produção não é “apagar incêndio”, é prevenção, análise e controle do ecossistema.
🎯 O que é Suporte à Produção Mainframe?
É a área responsável por:
Acompanhar processamento batch e online
Analisar incidentes, falhas e degradação
Atuar em eventos críticos de produção
Garantir disponibilidade, performance e integridade
Usar ferramentas do z/OS para diagnóstico rápido e preciso
💡 Resumo Bellacosa:
Suporte à Produção é quem garante que o sistema funcione mesmo quando tudo conspira contra.
🎓 O que deve aprender para trabalhar em Suporte à Produção Mainframe
Esse programa de capacitação é praticamente um manual de sobrevivência do ambiente produtivo IBM Mainframe.
📚 Estrutura Geral
Artigos
Exercicios
Videos
Manuais IBM
👉 Ideal para quem quer pensar como Produção, não só executar comandos.
🧠 Objetivo Real (o que ninguém fala no folder)
Além do texto bonito, o curso prepara o aluno para:
Tomar decisão sob pressão
Escolher a melhor solução, não a mais óbvia
Entender impacto sistêmico
Dialogar com desenvolvimento, infraestrutura, segurança e negócio
💬 Frase clássica de produção:
“Pode até funcionar… mas em produção é outra história.”
👥 Público-Alvo (quem sobrevive bem nesse mundo)
Profissionais de TI
Operadores de Mainframe
Analistas em transição para Produção
Quem já cansou de ouvir:
“Na homologação funcionou…”
📌 Pré-requisitos
TSO/ISPF
SDSF
Noções de z/OS
Inglês básico (sim, mensagem de erro não vem em português 😄)
🧩 Estrutura Curricular — o arsenal do Suporte à Produção
Vamos ao mapa das armas:
🖥️ z/OS
JES2, spool, jobs, STCs
WTOR, WTO, mensagens
Performance, datasets, enqueues
Easter egg: quem nunca decorou mensagem $HASP?
🧠 CICS
Regiões online
Transações travadas
Dumps, abends, filas
Curiosidade: CICS raramente “cai”… ele se defende
📬 MQ
Filas cheias
Mensagens presas
Canais parados
Dica de ouro: produção ama fila vazia e canal ativo
🔌 Integration Bus (Broker)
Integração entre mundos
Mensagens XML/JSON
Transformações e rotas
Fofoquice: quando quebra, ninguém sabe de quem é a culpa 😅
🧪 REXX
Automação de tarefas
Scripts de monitoramento
Ações rápidas em incidentes
Easter egg raiz: REXX salva madrugada!
🗄️ DB2 – Utilitários
REORG, RUNSTATS, COPY
Locks, deadlocks
Espaço e performance
Dica Bellacosa: DB2 lento quase sempre avisa antes
🌐 WebSphere / Servidores de Aplicação
Acesso remoto
Integração web
Monitoramento de serviços
Curiosidade: quando o web cai, o mainframe “leva a culpa”
🔍 Funcionamento na Prática — um dia típico de Produção
Batch inicia
Job abenda
SLA começa a gritar
SDSF aberto
Mensagem analisada
Dataset bloqueado
Lock liberado
Job restartado
Negócio segue
Usuário nem ficou sabendo 😎
👉 Isso é Suporte à Produção bem feito.
💡 Dicas de Ouro (nível Bellacosa Mainframe)
✔️ Aprenda a ler mensagens, não só copiar
✔️ Conheça o impacto do comando antes de executar
✔️ Documente tudo (memória falha às 3h da manhã)
✔️ Produção exige calma, método e sangue frio
✔️ O melhor incidente é o que não vira chamado
🥚 Easter Eggs & Curiosidades
Todo ambiente tem um job “maldito”
Sempre existe um STC que ninguém sabe para que serve
Produção aprende mais em 1 incidente do que em 10 cursos
O melhor elogio:
“Nem percebemos que deu problema.”
☕ Conclusão Bellacosa Mainframe
O Suporte à Produção Mainframe não é apenas uma função — é uma mentalidade.
É entender:
Tecnologia
Processo
Negócio
Risco
Responsabilidade
Quem passa por Produção:
Vira profissional mais completo
Aprende a pensar grande
Ganha respeito técnico
📌 Em resumo:
Se o mainframe é o coração da empresa,
Suporte à Produção é quem garante que ele nunca pare de bater.