Curso intensivo

Introdução à Análise de dados em R

Formato: Remoto (online)

Data e horário: 1 a 4 de julho, das 19h às 22h

O curso “Introdução à Análise de Dados em R” é uma oportunidade ideal para quem deseja iniciar sua jornada na ciência de dados utilizando a linguagem R. Dividido em quatro aulas abrangentes, o curso oferece uma visão completa, desde os conceitos básicos até técnicas avançadas de manipulação e de visualização de dados.

Na primeira aula, os participantes recebem um “Overview de R”, onde são introduzidos aos fundamentos da linguagem. Esta seção cobre desde o uso de R como uma calculadora para realizar operações matemáticas básicas até a criação e manipulação de diferentes tipos de objetos. Os alunos aprenderão a utilizar operadores lógicos e expressões condicionais, essenciais para filtrar e explorar dados. Ao final desta aula, será possível importar e analisar um conjunto de dados simulados, aplicando os conceitos aprendidos de maneira prática.

A segunda aula, “Saindo do Zero na Manipulação de Dados”, foca na preparação do ambiente de trabalho e na introdução a pacotes essenciais como tibble, dplyr e lubridate. Os participantes irão comparar data.frames com tibbles, explorar funções essenciais do dplyr para manipulação de dados e aprender a manipular datas com os pacotes lubridate. A aula é estruturada com revisões e exercícios práticos para reforçar o aprendizado.

Na terceira aula, “Manipulando Quase Qualquer Base de Dados”, aprofunda na transformação de datasets para o formato tidy. Os alunos aprenderão a usar funções como pivot_longer e pivot_wider para transformar dados, além de técnicas para separar e unir dados. A aula também aborda como lidar com dados ausentes e transformar vetores de texto em datasets, trabalhar com nesting data e operar funções entre multiplas colunas. Aplicações avançadas e desafios práticos consolidam o aprendizado, preparando os participantes para enfrentar problemas reais de análise de dados.

A quarta aula do curso é dedicada à “Visualização de Dados em R” com foco no pacote ggplot2. Após uma introdução sobre a importância da visualização de dados, os alunos são apresentados aos pacotes necessários. A seção cobre a gramática dos gráficos, ensinando a mapear variáveis para atributos estéticos em objetos geométricos. Os participantes aprenderão a criar e personalizar os cinco tipos de gráficos essenciais: histogramas, boxplots, barplots, scatterplots e lineplots. Além disso, a seção aborda técnicas para ajustar a estrutura dos gráficos, como a personalização de títulos, legendas e cores de fundo, utilizando a função theme().


Quemuel Baruque

É formado em Ciências Sociais (2021) pela UFAL, mestre (2023) e doutorando (2023-) em Ciência Política e Relações Internacionais pelo DCP-UFPE. Tem expertise em modelos estatísticos multivariados, modelos econométricos, estratégias robustas de inferência causal, webscraping, packaging, programação funcional, aplicações em shiny e mentoria em R. Tem experiência com monitoramento e avaliação de políticas públicas (SSP-AL 2019; CGEE 2021, SEPLAG-PE 2023-2024), Data Pipeline e automação de ETL’s (CGEE 2021-2022, CEPAL 2022, SEPLAG-PE 2023-2024; Quaest 2024).

Inscreva-se neste curso
← Voltar à lista de cursos