Skip to content

Vithor

Databricks | Lakehouse Federation

Databricks: Lakehouse Federation

Na Datasource Expert realizamos constantemente apresentações técnicas sobre soluções e boas práticas de mercado aplicado a área de dados. Desta vez, nosso tema foi abordar o Lakehouse Federation presente no Databricks.

O que é?

Lakehouse Federation é uma tecnologia que acessar bancos de dados SQL externos, atualmente este são os suportados:

  • MySQL
  • PostgreSQL
  • Amazon Redshift
  • Snowflake
  • Microsoft SQL Server
  • Azure Synapse (SQL do Data Warehouse)
  • Google BigQuery
  • Databricks

Futuramente acompanhe em Microsoft | Fontes de dados com suporte.

Arquitetura de Referência: Azure Databricks

Esta é uma excelente opção, quando você deseja uma estratégia zero-etl ou evitar a "cópia da cópia" dos dados. Imagina, você já possui uma abordagem de armazenamento dos dados analíticos no Snowflake, Google BigQuery ou Azure Synapse e também no Databricks e deseja simplesmente realizar um "join" entre esses dados, com certeza Query Federation do Databricks será perfeito!

Vantagens: * Visão unificada de seus dados: O Lakehouse Federation oferece uma visão unificada de todos os seus dados, independentemente de onde eles estejam armazenados.

  • Análise em tempo real: Acesse e analise seus dados em tempo real, sem a necessidade de mover ou copiar dados.

  • Simplicidade e flexibilidade: É fácil configurar e usar, e oferece suporte a uma ampla variedade de fontes de dados.

  • Redução de custos e aumento da eficiência: Elimine a necessidade de integrações complexas e redundantes.