| Bellacosa Mainframe publica o Manual Proibido da IA |
🔥 O manual proibido da IA prática: Machine Learning, Deep Learning e LLMs em um só lugar
🧠🐍🔥 Cheatsheet Python para IA (Inteligência Artificial)
👉 Essencial para Machine Learning, Deep Learning e IA Generativa
🧠 Stack Principal de IA
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import torch # PyTorch (Deep Learning)
import tensorflow as tf # TensorFlow / Keras
from sklearn import datasets
📊 Base Matemática — NumPy
IA = Álgebra linear + estatística + otimização
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
a + b
np.dot(a, b)
np.mean(a)
np.std(a)
📚 Dados — Pandas
df = pd.read_csv("dataset.csv")
df.head()
df.info()
df.describe()
🧹 Preparação de Dados (80% do trabalho real)
Tratar valores ausentes
df.fillna(0, inplace=True)
Converter categorias → números
pd.get_dummies(df, columns=["cidade"])
Normalização
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
👉 Essencial para redes neurais.
✂️ Dividir dados (Treino/Teste)
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, random_state=42
)
🤖 Machine Learning Clássico (Scikit-Learn)
Regressão Linear
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
pred = model.predict(X_test)
Classificação
from sklearn.tree import DecisionTreeClassifier
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
Avaliação
from sklearn.metrics import accuracy_score
accuracy_score(y_test, pred)
🧠 Deep Learning — PyTorch
Tensor (base do DL)
import torch
x = torch.tensor([1.0, 2.0, 3.0])
Modelo simples
import torch.nn as nn
model = nn.Linear(3, 1)
Forward pass
output = model(x)
🔥 Treinamento básico PyTorch
loss_fn = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
for epoch in range(100):
pred = model(x)
loss = loss_fn(pred, y)
optimizer.zero_grad()
loss.backward()
optimizer.step()
👉 Loop de aprendizado da rede.
🧠 Deep Learning — TensorFlow / Keras
Modelo sequencial
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
model = Sequential([
Dense(64, activation="relu"),
Dense(1)
])
Compilar
model.compile(
optimizer="adam",
loss="mse"
)
Treinar
model.fit(X_train, y_train, epochs=10)
👁️ IA para Visão Computacional
from PIL import Image
import numpy as np
img = Image.open("foto.jpg")
img_array = np.array(img)
🗣️ IA para NLP (Processamento de Linguagem)
Tokenização simples
texto = "Python é incrível"
tokens = texto.split()
Com Transformers 🤯
from transformers import pipeline
classifier = pipeline("sentiment-analysis")
classifier("I love Python!")
🤖 IA Generativa (LLMs)
Exemplo básico com API
from openai import OpenAI
client = OpenAI()
resp = client.chat.completions.create(
model="gpt-4.1-mini",
messages=[{"role": "user", "content": "Explique IA"}]
)
print(resp.choices[0].message.content)
📊 Visualização de resultados
plt.plot(history.history["loss"])
plt.show()
🧪 Salvando modelos
Scikit-Learn
import joblib
joblib.dump(model, "modelo.pkl")
PyTorch
torch.save(model.state_dict(), "modelo.pt")
TensorFlow
model.save("modelo.h5")
⚡ Pipeline completo de IA
1️⃣ Coletar dados
2️⃣ Limpar e preparar
3️⃣ Dividir treino/teste
4️⃣ Treinar modelo
5️⃣ Avaliar
6️⃣ Ajustar hiperparâmetros
7️⃣ Implantar
🧠 Tipos principais de IA
📊 Machine Learning
-
Regressão
-
Classificação
-
Clustering
🧠 Deep Learning
-
Redes neurais
-
CNN (imagens)
-
RNN / Transformers (texto)
🤖 IA Generativa
-
Chatbots
-
Geração de imagens
-
Código automático
🔥 Bibliotecas essenciais
| Área | Bibliotecas |
|---|---|
| ML | Scikit-Learn |
| Deep Learning | PyTorch, TensorFlow |
| NLP | Transformers, spaCy |
| Visão | OpenCV |
| Dados | Pandas, NumPy |
| Visualização | Matplotlib, Seaborn |
💥 Superpoderes da IA com Python
🔥 Previsão de demanda
🔥 Detecção de fraude
🔥 Recomendação personalizada
🔥 Visão computacional
🔥 Chatbots inteligentes
🔥 Automação cognitiva
🔥 Análise de sentimentos
🔥 Sistemas autônomos
☕ Frase de guerra da IA
👉 “Dados são o combustível.
Algoritmos são o motor.
Python é o cockpit.”
Se quiser, posso criar algo ainda mais poderoso:
🔥 Cheatsheet Python para IA Generativa (LLMs)
🔥 Roadmap completo AI Engineer
🔥 Python para Machine Learning em produção
🔥 IA aplicada a negócios corporativos
🔥 IA para modernização de sistemas legados
🔥 Python + IA para Mainframe modernization
Só dizer — a próxima etapa é nível lendário 😎
🔥🐍📊 Cheatsheet Python para Machine Learning
👉 O guia essencial para construir modelos preditivos do zero à produção
🧠 Stack Principal de Machine Learning
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, mean_squared_error
📊 Carregar e explorar dados
df = pd.read_csv("data.csv")
df.head()
df.info()
df.describe()
👉 Sempre faça EDA (Exploratory Data Analysis).
🧹 Limpeza de dados
Valores ausentes
df.fillna(0, inplace=True)
# ou
df.dropna(inplace=True)
Remover duplicados
df.drop_duplicates(inplace=True)
🔤 Converter dados categóricos
One-Hot Encoding
df = pd.get_dummies(df, columns=["categoria"])
Label Encoding
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
df["classe"] = le.fit_transform(df["classe"])
📐 Separar variáveis (X e y)
X = df.drop("target", axis=1)
y = df["target"]
✂️ Dividir treino e teste
X_train, X_test, y_train, y_test = train_test_split(
X, y,
test_size=0.2,
random_state=42
)
👉 80% treino — 20% teste é padrão.
⚖️ Normalização (IMPORTANTÍSSIMO)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
👉 Essencial para:
-
SVM
-
KNN
-
Redes neurais
-
Regressões
🤖 Regressão (prever números)
Linear Regression
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
pred = model.predict(X_test)
Avaliação
mean_squared_error(y_test, pred)
🧠 Classificação (prever categorias)
🌳 Decision Tree
from sklearn.tree import DecisionTreeClassifier
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
pred = model.predict(X_test)
👥 K-Nearest Neighbors
from sklearn.neighbors import KNeighborsClassifier
model = KNeighborsClassifier(n_neighbors=5)
model.fit(X_train, y_train)
🚀 Random Forest (super popular)
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier()
model.fit(X_train, y_train)
👉 Excelente baseline.
⚡ Support Vector Machine
from sklearn.svm import SVC
model = SVC()
model.fit(X_train, y_train)
📊 Avaliação de classificação
accuracy_score(y_test, pred)
Métricas mais completas
from sklearn.metrics import classification_report
print(classification_report(y_test, pred))
📉 Matriz de confusão
from sklearn.metrics import confusion_matrix
confusion_matrix(y_test, pred)
📈 Validação cruzada
from sklearn.model_selection import cross_val_score
scores = cross_val_score(model, X, y, cv=5)
scores.mean()
👉 Mede robustez do modelo.
🔍 Ajuste de hiperparâmetros
Grid Search
from sklearn.model_selection import GridSearchCV
params = {"n_estimators": [50, 100, 200]}
grid = GridSearchCV(RandomForestClassifier(), params)
grid.fit(X_train, y_train)
grid.best_params_
🧠 Clustering (sem rótulos)
K-Means
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=3)
kmeans.fit(X)
labels = kmeans.labels_
👉 Descobrir padrões ocultos.
📊 Visualização
plt.scatter(X[:,0], X[:,1], c=labels)
plt.show()
🧪 Pipeline completo
from sklearn.pipeline import Pipeline
pipeline = Pipeline([
("scaler", StandardScaler()),
("model", RandomForestClassifier())
])
pipeline.fit(X_train, y_train)
👉 Evita erros de pré-processamento.
💾 Salvar modelo treinado
import joblib
joblib.dump(model, "modelo.pkl")
📥 Carregar modelo
model = joblib.load("modelo.pkl")
⚡ Fazer previsão em novos dados
novo = [[5.1, 3.5, 1.4, 0.2]]
model.predict(novo)
🧠 Workflow ideal de Machine Learning
🔥 Pipeline profissional
1️⃣ Coleta de dados
2️⃣ Limpeza e preparação
3️⃣ Engenharia de features
4️⃣ Divisão treino/teste
5️⃣ Treinamento
6️⃣ Avaliação
7️⃣ Ajuste fino
8️⃣ Deploy
📦 Bibliotecas essenciais
| Finalidade | Biblioteca |
|---|---|
| Dados | Pandas |
| Matemática | NumPy |
| Visualização | Matplotlib / Seaborn |
| ML | Scikit-Learn |
| Deep Learning | PyTorch / TensorFlow |
💥 Tipos principais de problemas
📊 Regressão
Prever valor contínuo
👉 preço, temperatura, demanda
🧠 Classificação
Prever categoria
👉 spam, fraude, diagnóstico
🔍 Clustering
Descobrir grupos
👉 segmentação de clientes
☕ Frase de guerra do Machine Learning
👉 “Dados são o novo petróleo —
Modelos são a refinaria.”