open to work

Gabriel
Henrique

_

~/.gabriel

$ cat about.txt

Data Engineer construindo a infraestrutura

que transforma dados brutos em receita.

Arquiteto dos pipelines de CRM (+R$ 500M) e

Data Owner do Catálogo para 3.000+ usuários/mês.

 

$ echo $STACK

→ Python · SQL · Airflow · Databricks · Azure · Spark

 

$ echo $LOCATION

São Paulo, SP · Brasil

 

15+ Projetos entregues 500K+ Linhas de código 10TB+ Dados processados 98% Uptime de pipelines 3+ Anos de experiência 15+ Projetos entregues 500K+ Linhas de código 10TB+ Dados processados 98% Uptime de pipelines 3+ Anos de experiência
01

O que eu faço

01

Ownership & Pipelines

Não construo apenas pipelines, sou dono dos produtos de dados de ponta a ponta. Priorizo confiabilidade, performance e qualidade para garantir que a informação gere impacto real na tomada de decisão do negócio.

SparkDatabricksAzureAirflow
02

Automações & Impacto

Projetei e entreguei soluções de automação e web crawlers que destravam valor real de negócio, não apenas vitórias técnicas, alinhando tecnologia à estratégia comercial.

PythonSeleniumScrapyFastAPI
03

Performance & SQL

Otimizo queries legadas e pipelines ELT/ETL com cortes de tempo superiores a 80% através de performance tuning hands-on, servindo 3.000+ usuários de forma escalável.

SQLPythonSASPostgreSQL
02

Stack

Apache Spark 88%
Azure (Cloud) 88%
Apache Airflow 87%
SAS 85%
FastAPI / Flask / Node.js 82%
Web Scraping (Selenium, Scrapy, BS4) 85%
Git & GitHub 88%
03

SQL Playground

— consulte meus dados

📂 db_gabriel

▸ gabriel

nome TEXT idade INT cidade TEXT estado TEXT email TEXT github TEXT disponivel BOOL

▸ familia

parentesco TEXT apoio TEXT entende_de_ti TEXT descricao TEXT

▸ hobbies

nome TEXT categoria TEXT freq_semanal INT nivel_dedicacao TEXT nota_mental TEXT

▸ estudos

instituicao TEXT curso TEXT tipo TEXT ano_inicio INT ano_fim INT status TEXT

▸ certificacoes

titulo TEXT emissor TEXT ano INT impacto TEXT

▸ habilidades

nome TEXT nivel INT categoria TEXT anos_exp INT

▸ soft_skills

habilidade TEXT contexto TEXT

▸ ferramentas

nome TEXT categoria TEXT nivel TEXT uso_diario BOOL

▸ experiencia

cargo TEXT empresa TEXT ano_inicio INT ano_fim TEXT descricao TEXT

▸ conquistas

marco TEXT ano TEXT impacto_negocio TEXT
gabriel_db=#

-- 👹 Bem-vindo ao meu banco de dados pessoal!

-- Tenta rodar alguma query. Exemplos:

--

-- SELECT * FROM gabriel;

-- SELECT nome, nivel FROM habilidades WHERE nivel > 85;

-- SELECT * FROM estudos ORDER BY ano_inicio DESC;

-- SELECT cargo, empresa FROM experiencia;

-- SHOW TABLES;

--

-- Dica: clica nos exemplos abaixo 👇

gabriel_db=#
gabriel familia hobbies estudos certificacoes habilidades soft_skills ferramentas experiencia conquistas SHOW TABLES
04

Projetos

01

CVM-210 Data Pipeline

Pipeline end-to-end para analytics de fundos de investimento CVM 210. Ingestão serverless via AWS Lambda, armazenamento em S3 Data Lake e processamento distribuído no Databricks com Medallion Architecture (Bronze→Silver→Gold).

🎯 Destaque: Arquitetura Medallion automatizada (AWS + Databricks) processando dados restritos CVM 210 com Delta Lake (ACID).

AWSDatabricksPySparkS3
02

PNAD COVID Data Engineering

Arquitetura completa de Data Lake na AWS com Medallion Architecture. Processamento de 1.1M de registros via Glue (PySpark), queries analíticas em Athena e dashboards de impacto em Power BI sobre COVID-19 no Brasil.

🎯 Destaque: Processamento de 340+ MB de dados raw (1.1M+ registros) via AWS Glue (PySpark) e Athena.

AWS GluePySparkAthenaPower BI
03

Obesity Prediction

Modelo preditivo de ML para saúde preventiva: classifica riscos de obesidade analisando padrões comportamentais (dieta, atividade física, transporte) em vez de métricas antropométricas tradicionais.

🎯 Métrica: Pipeline End-to-End com acurácia de 87% (Random Forest) e interface web interativa via Streamlit.

PythonScikit-learnPandasML
04

Ibovespa Forecasting System

Sistema de Machine Learning para previsão da direção diária do Ibovespa. Pipeline completo com feature engineering avançado, otimização automatizada de hiperparâmetros e validação rigorosa via holdout temporal.

🎯 Métrica: Acurácia de 75.76% e otimização automatizada via Optuna com validação holdout temporal.

PythonMLFeature Eng.Forecasting
05

Loan Default Prediction

Modelo preditivo (Random Forest) para propensão à inadimplência com dashboard analítico interativo em Dash/Plotly. Visualização de risco por estado/região, métricas-chave de default e análise de portfólio de crédito.

🎯 Métrica: Acurácia de 72% e dashboard analítico interativo para tomada de decisão corporativa.

PythonRandom ForestDashPlotly
05

Certificações

— arrasta pro lado
AZ

Azure Fundamentals (AZ-900)

Microsoft

2026

HBS

Aspire Leaders Program

Aspire Institute (Harvard Business School)

2025

AF

Airflow 3 DAG Authoring

Astronomer

2025

AF

Airflow 3 Fundamentals

Astronomer

2025

SC

Scrum Foundation

Certiprof

2023

PY

Python — Nano Course (80h)

FIAP

2022

06

Experiência

2023 — presente agora

Data Governance / Data Engineer

Bradesco

Arquiteto e gerencio os pipelines de dados core de um CRM que suporta R$ 500M+ em receita mensal. Atuo como Data Owner do Catálogo de Dados interno (3.000+ usuários/mês). Otimizei processamentos SQL/ELT em +80% e construí automações com alto impacto de negócio.

2024 — 2026

Data Engineer (Consultoria)

Confidencial (NDA)

Desenvolvimento autônomo de ETLs processando milhões de registros diários. Construção de pipelines e automações utilizando Python, DBT e DuckDB. Criação de frameworks para acelerar o desenvolvimento codando também em Node.js, Java e Scala.

2022 — 2023

Data Engineer / Software Engineer

Keyrus · Estágio

Desenvolvimento de pipelines ETL/ELT e features para catálogo de dados corporativo. Implementação de business glossary, integrações MySQL e refatoração de SQL legado com ganhos de +50% em performance.

07

Estudos

2026 — presente cursando

MBA Gestão de Pessoas e Tecnologia

FIA Business School

Liderança técnica e visão corporativa. Foco em conectar a engenharia de dados aos objetivos de negócio, gerenciando a interseção crucial entre times, tecnologia e resultados financeiros.

2025 — 2026

Pós-Graduação em Análise de Dados

FIAP

Aprofundamento em inteligência analítica e modelagem avançada. O elo essencial para garantir que a infraestrutura técnica de dados suporte decisões precisas e orientadas a valor.

2022 — 2024

Tecnologia em ADS

FATEC-SP

O alicerce da minha visão como Data Engineer. Fundamentos rigorosos em arquitetura de sistemas, engenharia de software e modelagem para construir infraestruturas robustas e escaláveis.

08

Vamos trabalhar
juntos.

Aberto para desafios de alto impacto em Data Engineering e parcerias em consultoria. Manda uma mensagem!