Skip to content

Inteligência de dados com Databricks e Microsoft Fabric para os novos!

Este artigo é baseado em duas palestras que ocorreram no dia 19/11/2025 na Universidade de Vila Velha (UVV).

Uma meta que se renova todos os anos!

Palestra na UVV durante o evento TI 360

Voltar à Universidade de Vila Velha é mais do que um compromisso profissional — é uma meta pessoal que retorna a cada ano. No dia 19 de novembro de 2025, tive novamente essa oportunidade ao palestrar no evento TI 360 da UVV. Desta vez, abordei uma perspectiva amadurecida: como plataformas avançadas de dados estão se tornando surpreendentemente acessíveis, sem sacrificar poder e escala.

A conversa com Susiléa Abreu e toda a equipe reafirma por que apostamos em educação e compartilhamento. Não se trata apenas de "Databricks é bom" ou "Microsoft Fabric é poderoso" — a história é mais nuançada e interessante.

O paradoxo das plataformas modernas

Há alguns anos, montar uma infraestrutura de dados exigia grande esforço: integrar data warehouse, ETL, visualização e lakehouse. Cada peça trazia complexidades, licenças e equipes especializadas, resultando em centralização excessiva no BI.

Plataforma moderna de dados

Arquitetura moderna de dados (Lakehouse)

Hoje, o paradoxo é fascinante: Microsoft Fabric e Databricks são simples para casos iniciais, mas lidam com petabytes, tempo real e ML em produção.

Ambas foram projetadas para progressão natural: comece simples e escale, com todos os recursos na mesma solução conforme a maturidade avança.

Databricks: Plataforma Unificada Centrada em Dados

Sem dúvida, o Databricks dividiu águas com o Lakehouse, convergindo data warehouse (controle transacional) e data lake (flexibilidade e custo baixo).

Databricks Lakehouse Architecture

Arquitetura Databricks Lakehouse

Em um mundo serverless, destaca-se por:

Palestra na UVV durante o evento TI 360

  • Delta Lake como storage (Parquet com ACID transactions)
  • Compute separado do storage (pague só pelo uso)
  • SQL Warehouses (BI rápido), All-Purpose Clusters (ETL), Jobs Clusters (automação)
  • Feature Store, MLflow (ciclo de ML), Vector Search (GenAI)
  • Query Federation (consulte Snowflake, BigQuery etc. sem replicar)
  • Multi-cloud (AWS, Azure, GCP) com formatos abertos

Para escala:

  • Medallion Architecture (Bronze/Silver/Gold)
  • Unity Catalog (UC) com suporte a Apache Iceberg (Public Preview 2025), ABAC (Beta para acesso dinâmico via tags) e Metrics para governança
  • Workflows com retry, alertas e linhagem
  • Streaming via Structured Streaming

Um analista inicia com SQL/Python em notebooks; empresas escalam sem fricção.

Microsoft Fabric: Arquitetura Unificada

O Fabric resolve silos de ferramentas com um all-in-one no mesmo SKU: cresça só em infraestrutura, otimizando com Spark e revisões.

Plataforma Microsoft Fabric

Arquitetura Microsoft Fabric

Ao habilitar Fabric:

  • Data Factory (orquestração)
  • Data Engineering (Spark notebooks/jobs)
  • Data Warehouse (analíticas)
  • Real-Time Analytics (KQL)
  • Power BI integrado
  • Data Science (Python, R, Azure ML)
  • OneLake elimina duplicações, com suporte a Iceberg tables (virtualização Delta/Iceberg para interoperabilidade) e segurança unificada.

Convergência das Plataformas

"Qual escolher?" Depende. Veja a comparação:

Critério Microsoft Fabric Databricks
Ecossistema Microsoft (Power BI, M365) Multi-cloud (AWS, Azure, GCP)
ML/IA Foco AI Functions, Copilot (GA 2025) MLflow, Vector Search, Feature Store
Licenciamento Capacidade fixa Pay-per-use, spot instances
Governança OneLake com Iceberg/Delta Unity Catalog com Iceberg/ABAC
Visualização Power BI nativo Integra Power BI/Tableau/Looker

Insight da UVV: Ambas convergem em Spark, Delta Lake/Iceberg (ACID, time travel). Não assusta mais processar bilhões — mindset é a barreira nas empresas. Analistas sênior ingerem, processam, aplicam ML e visualizam com poucas linhas ou UI.

Agradecimento Final

Palestra na UVV durante o evento TI 360 Obrigado a Susiléa Abreu, equipe UVV e participantes do TI 360 em 19/11/2025. Essa iniciativa reflete minhas contribuições em 2025 para democratizar dados no ES, Brasil e mundo!

Comente ou conecte no LinkedIn!

Referências

Plataformas:

Arquitetura:

ML/IA:

Comments