open to work

Gabriel
Henrique

~/.gabriel

$ cat about.txt

Data Engineer construindo a infraestrutura

que transforma dados brutos em receita.

Arquiteto dos pipelines de CRM (+R$ 500M) e

Data Owner do Catálogo para 3.000+ usuários/mês.

$ echo $STACK

→ Python · SQL · Airflow · Databricks · Azure · Spark

$ echo $LOCATION

São Paulo, SP · Brasil

$ _

15+ Projetos entregues ◆ 500K+ Linhas de código ◆ 10TB+ Dados processados ◆ 98% Uptime de pipelines ◆ 3+ Anos de experiência ◆ 15+ Projetos entregues ◆ 500K+ Linhas de código ◆ 10TB+ Dados processados ◆ 98% Uptime de pipelines ◆ 3+ Anos de experiência ◆

Ownership & Pipelines

Não construo apenas pipelines, sou dono dos produtos de dados de ponta a ponta. Priorizo confiabilidade, performance e qualidade para garantir que a informação gere impacto real na tomada de decisão do negócio.

SparkDatabricksAzureAirflow

Automações & Impacto

Projetei e entreguei soluções de automação e web crawlers que destravam valor real de negócio, não apenas vitórias técnicas, alinhando tecnologia à estratégia comercial.

PythonSeleniumScrapyFastAPI

Performance & SQL

Otimizo queries legadas e pipelines ELT/ETL com cortes de tempo superiores a 80% através de performance tuning hands-on, servindo 3.000+ usuários de forma escalável.

SQLPythonSASPostgreSQL

Python 95%

SQL (Spark SQL, Data Warehousing, PostgreSQL) 93%

Azure Databricks 90%

Apache Spark 88%

Azure (Cloud) 88%

Apache Airflow 87%

SAS 85%

FastAPI / Flask / Node.js 82%

Web Scraping (Selenium, Scrapy, BS4) 85%

Git & GitHub 88%

📂 db_gabriel

▸ gabriel

nome TEXT idade INT cidade TEXT estado TEXT email TEXT github TEXT disponivel BOOL

▸ familia

parentesco TEXT apoio TEXT entende_de_ti TEXT descricao TEXT

▸ hobbies

nome TEXT categoria TEXT freq_semanal INT nivel_dedicacao TEXT nota_mental TEXT

▸ estudos

instituicao TEXT curso TEXT tipo TEXT ano_inicio INT ano_fim INT status TEXT

▸ certificacoes

titulo TEXT emissor TEXT ano INT impacto TEXT

▸ habilidades

nome TEXT nivel INT categoria TEXT anos_exp INT

▸ soft_skills

habilidade TEXT contexto TEXT

▸ ferramentas

nome TEXT categoria TEXT nivel TEXT uso_diario BOOL

▸ experiencia

cargo TEXT empresa TEXT ano_inicio INT ano_fim TEXT descricao TEXT

▸ conquistas

marco TEXT ano TEXT impacto_negocio TEXT

gabriel_db=#

-- 👹 Bem-vindo ao meu banco de dados pessoal!

-- Tenta rodar alguma query. Exemplos:

-- SELECT * FROM gabriel;

-- SELECT nome, nivel FROM habilidades WHERE nivel > 85;

-- SELECT * FROM estudos ORDER BY ano_inicio DESC;

-- SELECT cargo, empresa FROM experiencia;

-- SHOW TABLES;

-- Dica: clica nos exemplos abaixo 👇

gabriel_db=#

gabriel familia hobbies estudos certificacoes habilidades soft_skills ferramentas experiencia conquistas SHOW TABLES

CVM-210 Data Pipeline

Pipeline end-to-end para analytics de fundos de investimento CVM 210. Ingestão serverless via AWS Lambda, armazenamento em S3 Data Lake e processamento distribuído no Databricks com Medallion Architecture (Bronze→Silver→Gold).

🎯 Destaque: Arquitetura Medallion automatizada (AWS + Databricks) processando dados restritos CVM 210 com Delta Lake (ACID).

AWSDatabricksPySparkS3

GitHub ↗

PNAD COVID Data Engineering

Arquitetura completa de Data Lake na AWS com Medallion Architecture. Processamento de 1.1M de registros via Glue (PySpark), queries analíticas em Athena e dashboards de impacto em Power BI sobre COVID-19 no Brasil.

🎯 Destaque: Processamento de 340+ MB de dados raw (1.1M+ registros) via AWS Glue (PySpark) e Athena.

AWS GluePySparkAthenaPower BI

GitHub ↗

Obesity Prediction

Modelo preditivo de ML para saúde preventiva: classifica riscos de obesidade analisando padrões comportamentais (dieta, atividade física, transporte) em vez de métricas antropométricas tradicionais.

🎯 Métrica: Pipeline End-to-End com acurácia de 87% (Random Forest) e interface web interativa via Streamlit.

PythonScikit-learnPandasML

GitHub ↗

Ibovespa Forecasting System

Sistema de Machine Learning para previsão da direção diária do Ibovespa. Pipeline completo com feature engineering avançado, otimização automatizada de hiperparâmetros e validação rigorosa via holdout temporal.

🎯 Métrica: Acurácia de 75.76% e otimização automatizada via Optuna com validação holdout temporal.

PythonMLFeature Eng.Forecasting

GitHub ↗

Loan Default Prediction

Modelo preditivo (Random Forest) para propensão à inadimplência com dashboard analítico interativo em Dash/Plotly. Visualização de risco por estado/região, métricas-chave de default e análise de portfólio de crédito.

🎯 Métrica: Acurácia de 72% e dashboard analítico interativo para tomada de decisão corporativa.

PythonRandom ForestDashPlotly

GitHub ↗

Azure Fundamentals (AZ-900)

Microsoft

2026

HBS

Aspire Leaders Program

Aspire Institute (Harvard Business School)

2025

Airflow 3 DAG Authoring

Astronomer

2025

Airflow 3 Fundamentals

Astronomer

2025

Scrum Foundation

Certiprof

2023

Python — Nano Course (80h)

FIAP

2022

2023 — presente agora

Data Governance / Data Engineer

Bradesco

Arquiteto e gerencio os pipelines de dados core de um CRM que suporta R$ 500M+ em receita mensal. Atuo como Data Owner do Catálogo de Dados interno (3.000+ usuários/mês). Otimizei processamentos SQL/ELT em +80% e construí automações com alto impacto de negócio.

2024 — 2026

Data Engineer (Consultoria)

Confidencial (NDA)

Desenvolvimento autônomo de ETLs processando milhões de registros diários. Construção de pipelines e automações utilizando Python, DBT e DuckDB. Criação de frameworks para acelerar o desenvolvimento codando também em Node.js, Java e Scala.

2022 — 2023

Data Engineer / Software Engineer

Keyrus · Estágio

Desenvolvimento de pipelines ETL/ELT e features para catálogo de dados corporativo. Implementação de business glossary, integrações MySQL e refatoração de SQL legado com ganhos de +50% em performance.

2026 — presente cursando

MBA Gestão de Pessoas e Tecnologia

FIA Business School

Liderança técnica e visão corporativa. Foco em conectar a engenharia de dados aos objetivos de negócio, gerenciando a interseção crucial entre times, tecnologia e resultados financeiros.

2025 — 2026

Pós-Graduação em Análise de Dados

FIAP

Aprofundamento em inteligência analítica e modelagem avançada. O elo essencial para garantir que a infraestrutura técnica de dados suporte decisões precisas e orientadas a valor.

2022 — 2024

Tecnologia em ADS

FATEC-SP

O alicerce da minha visão como Data Engineer. Fundamentos rigorosos em arquitetura de sistemas, engenharia de software e modelagem para construir infraestruturas robustas e escaláveis.

Nome

Mensagem

Ou me encontra por aqui:

GitHub ↗ LinkedIn ↗ Dev.to ↗ Medium ↗ X (Twitter) ↗

Gabriel
Henrique

O que eu faço

Ownership & Pipelines

Automações & Impacto

Performance & SQL

Stack

SQL Playground

Projetos

CVM-210 Data Pipeline

PNAD COVID Data Engineering

Obesity Prediction

Ibovespa Forecasting System

Loan Default Prediction

Certificações

Azure Fundamentals (AZ-900)

Aspire Leaders Program

Airflow 3 DAG Authoring

Airflow 3 Fundamentals

Scrum Foundation

Python — Nano Course (80h)

Experiência

Data Governance / Data Engineer

Data Engineer (Consultoria)

Data Engineer / Software Engineer

Estudos

MBA Gestão de Pessoas e Tecnologia

Pós-Graduação em Análise de Dados

Tecnologia em ADS

Vamos trabalhar
juntos.

Gabriel Henrique

O que eu faço

Ownership & Pipelines

Automações & Impacto

Performance & SQL

Stack

SQL Playground

Projetos

CVM-210 Data Pipeline

PNAD COVID Data Engineering

Obesity Prediction

Ibovespa Forecasting System

Loan Default Prediction

Certificações

Azure Fundamentals (AZ-900)

Aspire Leaders Program

Airflow 3 DAG Authoring

Airflow 3 Fundamentals

Scrum Foundation

Python — Nano Course (80h)

Experiência

Data Governance / Data Engineer

Data Engineer (Consultoria)

Data Engineer / Software Engineer

Estudos

MBA Gestão de Pessoas e Tecnologia

Pós-Graduação em Análise de Dados

Tecnologia em ADS

Vamos trabalharjuntos.

Gabriel
Henrique

Vamos trabalhar
juntos.