Como desafio pessoal às vezes tento replicar gráficos que acho interessante. O portal Nexo, em particular, costuma ter lindas visualizações de dados. Vou tentar replicar os gráficos desta publicação. Como o foco desta postagem está na visualização e em mostrar exemplos de aplicações do ggplot2 vou omitir as (longas) manipulações de dados, deixando indicadas as fontes (com links) que usei. Numa postagem futura pretendo fazer um tutorial mais detalhado de como reproduzir estes gráficos.

Continue reading

Às vezes eu me proponho como desafio tentar replicar alguma visualização interessante. Há um tempo atrás eu estava navegando o Our World in Data e encontrei alguns gráficos interessantes relacionando variáveis socio-econômicas com indicadores subjetivos de bem-estar e felicade. Há várias maneiras de mensurar o bem-estar e eu achei interessante ## 'data.frame': 156 obs. of 9 variables: ## $ Overall rank : int 1 2 3 4 5 6 7 8 9 10 .

Continue reading

Carregando os pacotes Muitos já devem estar familiarizados com a apresentação do historiador Hans Rosling sobre a evolução da expectativa de vida e do PIB per capita dos países em torno do mundo. Este post vai mostrar como usar o ggplot2 e o tidyverse para explorar estes dados. Pode-se acessar uma versão simplificada da base de dados pelo pacote gapminder. ### Tutorial Gapminder ### library(tidyverse) library(extrafont) library(ggplot2) library(gapminder) library(kableExtra) ########################## data(gapminder) d <- gapminder Análise exploratória De início é sempre importante verificar se há problemas com os dados.

Continue reading

Nos últimos anos a América Latina como um todo vêm enfrentando complicações políticas e econômicas. Usando alguns dados do Banco Mundial e de censos de opinião como o Latin American Public Opinion Project (LAPOP) e o Latinobarómetro tento visualizar como está o sentimento público em relação à democracia e à economia. Todos os dados analisados são de 2017. Economia O desempenho da América Latina como um todo tem sido fraco nos últimos anos.

Continue reading

O Latin American Public Opinion Project (LAPOP) aplica a cada dois anos um questionário em diversos países da América Latina. Uma parte destas perguntas investiga a confiança que as pessoas afirmam ter pelas suas instituições. Os dados estão disponíveis gratuitamente na página do LAPOP. Aqui vou examinar apenas as respostas aos questionários aplicados no Brasil em 2017. Confiança média nas instituições Os entrevistados são questionados quanto a sua confiança num rol de instituições e devem atribuir um número, de 1 a 7, para cada uma.

Continue reading

Gráfico de Colunas Há duas funções para criar gráficos de colunas: o geom_bar() e geom_col(). O gráfico mais simples é o de contagem. A base diamonds traz o preço e alguns atributos de uma amostra de diamantes. Uma das características listadas é a qualidade do corte do diamante: em ordem crescente eles são categorizados em Fair, Good, Very Good, Premium e Ideal. Com o geom_bar pode-se facilmente visualizar a quantidade de observações em cada categoria.

Continue reading

Gráfico de linha Gráficos de linha são frequentemente usados para representar séries de tempo, isto é, valores que mudam ao longo do tempo. O ggplot oferce alguma variedade de opções para este fim, mas a mais comum é geom_line(). Este geom exige argumentos tanto para o eixo-x como para o eixo-y. Em geral, o eixo-x representa o tempo e o eixo-y o valor da variável de interesse. Este ponto pode parecer irrelevante, mas será importante para entender algumas das dificuldades em usar séries de tempo com o ggplot.

Continue reading

Author's picture

Vinicius Oike Reginatto

Mestre em Economia (FEA/USP)

São Paulo, Brasil