Sobre o curso

Objetivo do curso

Apresentar de forma prática os principais conceitos que são necessários para se trabalhar com dados utilizando a linguagem Python. O curso percorre todo o fluxo dos dados, desde os principais conceitos de programação com Python e como utiliza-los para realizar análises dos dados, depois vendo as diversas formas de extrair e preparar o dado, finalizando com as diversas formas de visualização dos dados (dataviz), com isto valorizando os seus resultados. Para tornar o profissional mais capacitado, o curso também possui um módulo de SQL para análise de dados, assim apresentando o tipo de banco de dados mais utilizado no mundo.

Estará apto a:

Utilizar a principal e mais completa linguagem de programação para se trabalhar com dados: Python. Sabendo como extrair e preparar os dados, como realizar análises de dados obtidos e quais os principais tipos de análises que podem ser feitas, também conhecerá e saberá como e quando utilizar os principais gráficos disponíveis para a análise de dados, assim valorizando os seus resultados. Por fim irá ver os principais comandos para trabalhar com a linguagem SQL, utilizada em bancos de dados relacionais. 

Público Alvo:

Profissionais e estudantes de todas as áreas que queiram conhecer Data Analytics e descobrir formas de extrair, analisar e apresentar os resultados obtidos.

Salário

A média salarial nacional de um Data Analyst depende do nivel de conhecimento do profissional. Podendo variar em um salário de R$ 5.984/mês a R$ 8.298/mês.

Conteúdo programático

  • Análise de Dados com Python

    Revisão de Fundamentos de Python

    • Criação de variáveis;

    • Tipos de variáveis;

    • Listas;

    • Tuplas;

    • If-else;

    • Laços.

     

    Introdução ao shell IPython e Jupyter Notebook

    • Principais funcionalidades de ambas as ferramentas.

     

    Biblioteca NumPy para cálculos numéricos

    • Conceito de array;

    • Índices;

    • Fatiamento de matrizes;

    • Operações entre arrays.

     

    Biblioteca Pandas para análise de dados

    • Criação e manipulação de dataframe;

    • Concatenação e fusão de dataframes;

    • Métodos de seleção loc e iloc.

     

    Biblioteca Matplotlib e Seaborn para criar visualizações e gráficos.

    • A importância de se criar bons gráficos e como utilizá-los para dar força às suas análises.

     

    SciPy

    • Ferramenta de computação científica de alta performance.

     

    Apresentar a distribuição Anaconda direcionada para análise de dados.

    • Aprenda a agregar todas as ferramentas para análise de dados;

    • Bibliotecas e recursos necessários para trabalhar com Data Science e Machine Learning;

    • Python, Jupyter Notebook, NumPy, Pandas e Scikit-Learn.

     

    Armazenamento de dados

    • Formas de realizar carga e armazenamento de dados em vários formatos de arquivos.

     

    Tratamento de Dados

    • Tratamento e manipulação de dados: princípios de data minings.

     

    Operação de dados

    • Fundamentos para realizar agregação e operações em grupos de dados.

     

    Introdução sobre séries temporais

    • Introdução sobre séries temporais, conversões, indexação, seleção e geração de subconjuntos.

     

    Introdução à estatística básica

    • Medidas centrais;

    • Quartis;

    • Decis e como utilizá-las na análise.

     

    Bibliotecas de modelagem de dados

     

    • Principais modelagens do Scikit-Learning.

  • ETL com Python

    Introdução ao ETL

    • Aprenda o que é Extract, Transform and Load (ETL).

     

    Introdução a linguagem Python

    • Programação orientada a objetos;

    • Pacotes Pandas, Numpy, Scipy, Scikit-learn e Seaborn;

    • Trabalhe com Machine Learning.

     

    Extração de dados na prática

    • Comunicação com outros sistemas ou bancos de dados para capturar os dados que serão inseridos no destino onde serão convertidos para um único formato;

     

    Importância da transformação do dado

    • Correção, padronização e tratamento dos desvios e inconsistências, transformando os dados de acordo com as regras do negócio;

    • Operações de Qualidade de Dados.

     

    Processo preparação de dados na prática

    • Os dados são trabalhados para serem transformados em informação.

     

    Como transferir dados de diversas fontes para diversos destinos

    • Assim que são finalizados os tratamentos necessários nos dados, a carga no destino (um banco de dados ou arquivo CSV) é iniciada;

    • O processo de Load é a etapa final.

     

    Geração de relatórios com ferramentas gráficas do Python

     

    • Realize funções de análise e gere relatórios.

  • Visualização de Dados (Dataviz)

    Introdução

    • Introdução a Visualização

    • Quarteto de Anscombe

    • Exemplos bons e ruins de visualizações

    • Motivos para aplicar a visualização

    • Principais bibliotecas de visualização em Python

     

    Tipos de visualização

    Tipos de Visualização (comparativo entre diferentes tipos de dados e a visualização adequada)

     

    Visualização com gráficos

    • Gráfico de Pontos

    • Gráfico de Barras

    • Gráfico de Dispersão

    • Gráficos de séries temporais

    • Mapa de calor

    • Gráficos de redes

    • Gráficos de sunburst

    • Gráficos estatísticos (Boxplot, Pizza)

     

    Visualização avançada

     

    • Nuvem de palavras

    • Gráficos de Mapas

    • Gráficos interativos com Plotly 

    • Gráficos interativos com Bokeh

  • SQL para Análise de Dados

    Instalação e configuração do banco de dados

    • Instalação e Configuração do SGBD (Sistema de gerenciamento de banco de dados)

     

    Introdução ao banco relacional

    • SQL (Structured Query Language ou Linguagem de Consulta Estruturada)

      • Diferenciar entre DDL (LInguagem de Definição de Dados) e DML (Linguagem de Manipulação de Dados)

    • Tipos de dados

    • Conceitos de tabela e relacionamento

    • Exercícios de fixação

     

    DDL (Data Definition Language) - Linguagem de Definição de Dados

    • Base de dados

    • Criação de tabelas

      • Chave primaria

      • indice

    • Relacionamentos

      • Chave estrangeira

    • Alteração de tabelas

    • Exclusão de tabelas

    • Exercícios de fixação

     

    DML (Data Manipulation Language) - Linguagem de Manipulação de Dados

    • Inclusão de dados

    • Atualização de dados

    • Exclusão de dados

     

    DQL (Data Query Language) - Linguagem de Consulta de dados

     

    • Consultas simples

    • Consultas elaboradas

      • Join

      • Inner join

      • Outer join

      • Left join

      • Right join

      • Full join

    • Como salvar os resultados das consultas em arquivo *.CVS

Pré-requisitos

Conhecimentos de lógica de programação. 

Certificação Impacta

Um dos títulos mais respeitados do país, atesta a qualidade e os conhecimentos de profissionais especializados nas mais variadas áreas de TI, Gestão e Design. Ao concluir o curso, você tem 90 dias a contar da data de término do curso para agendar seu exame.
Saiba mais sobre a certificação Impacta

Próximas turmas

Data e horário
Preços e descontos
Nenhuma turma no momento

O que os alunos dizem sobre a Impacta

Ver mais depoimentos