Bar graph with percentages - ggplot2

1
v1 = c("Sim","Não","Não","Não","Não","Sim","Sim","Sim","Sim","Sim")
v2 = c("branco","branco","pardo","preto","pardo","pardo","preto","branco","preto","pardo")
dados = data.frame(v1,v2)

I want to build a bar chart with relative frequencies totaling 100% within each category of variable v1 (Yes / No).

I tried this way:

ggplot(dados,aes(x=as.factor(v2),y=percent())) +
  geom_bar(aes(y = (..count..)/sum(..count..))) +
  geom_text(aes(y = ((..count..)/sum(..count..)),
                label=scales::percent((..count..)/sum(..count..))),stat="count", vjust = -0.25)+
  scale_y_continuous(labels = percent) + labs(y = "Percentual",x="Raça/Cor")+
  facet_grid(.~v1)

But it is not totaling 100% within each category of v1. Any help?

    
asked by anonymous 01.10.2017 / 16:23

1 answer

4

This part of frequency is hard to do for direct ggplot2. I'd rather do the counts before and then just plot.

library(tidyverse)

dados <- data_frame(
  v1 = c("Sim","Não","Não","Não","Não","Sim","Sim","Sim","Sim","Sim"),
  v2 = c("branco","branco","pardo","preto","pardo","pardo","preto","branco","preto","pardo")
)

freq <- dados %>%
  group_by(v1, v2) %>%
  summarise(n = n()) %>% 
  mutate(freq = n / sum(n) * 100) %>% 
  ungroup()

freq
# A tibble: 6 x 4
     v1     v2     n     freq
  <chr>  <chr> <int>    <dbl>
1   Não branco     1 25.00000
2   Não  pardo     2 50.00000
3   Não  preto     1 25.00000
4   Sim branco     2 33.33333
5   Sim  pardo     2 33.33333
6   Sim  preto     2 33.33333

ggplot(freq, aes(x = 1, y = freq, fill = v2, label = round(freq, 1))) +
  geom_col() +
  geom_text(position = position_stack(vjust = 0.5)) +
  facet_wrap(~v1) +
  theme_void(18)

    
01.10.2017 / 17:02