Sobre

Sobre o Blog PySpark Descomplicado

Este é um Blog destinado ao compartilhamento de diversos tutoriais e materiais práticos de forma simples, com exemplos didáticos e úteis às tarefas de engenharia e análise de dados.

Meu intuito é trazer um pouco da minha experiência de anos atuando com engenharia e análise de dados, utilizando o PySpark, para um contexto simples, com material em português e com códigos bem estruturados e construídos para utilizar o máximo potencial de sistemas distribuídos para resolver problemas de diversas naturezas no cotidiano de um profissional de dados.

E quem sou eu?

Eu sou Genicleito Gonçalves, Engenheiro de Dados a mais de 6 anos com vasta experiência em PySpark, Airflow, Python, Google Cloud, BigQuery, SQL, Hubspot (CRM), DataStudio, Metabase, dentre várias outras ferramentas de engenharia e análise de dados. Possuo experiência como líder técnico e com diversos times, como: pesquisadores da área de saúde, serviços financeiros e de investimento, times de consultoria, marketing, produto, desenvolvedores, dentre outros.


Comentários

Postagens mais visitadas deste blog

Como ler dados em formato CSV com o PySpark

Como instalar o PySpark e Jupyter Notebook

Como utilizar o PySpark no Google Colab