Author: Antonio Olinto Ávila da Silva

Gráfico de barras com erro padrão

São muitas as opções para se fazer um gráfico de barras com a indicação do erro padrão (ou outra medida de dispersão) no R. Com uma rápida busca na rede pode-se ter dezenas de sugestões. Eu resolvi contribuir com mais uma.

Meu objetivo era representar a variação da densidade de algumas espécies medida em períodos noturnos e diurnos.
A partir de três tabelas, uma contendo as médias, outra o erro padrão e uma terceira com o número de observações, utilizo os comandos barplot, points, arrows e text para gerar o gráfico desejado.
Os dados das tabelas são copiados para o R pelo comando read.delim (clique aqui para mais detalhes) e transformados em matrizes pelo comando as.matriz.

Médias


SP1 SP2 SP3 SP4
D 10 12 15 20
N 20 15 12 10

Erros padrões


SP1 SP2 SP3 SP4
D 1 2 3 4
N 3 2 1 5

Número de observações


SP1 SP2 SP3 SP4
D 30 40 35 10
N 20 50 20 27

# copia os dados das tabelas para o R
means <- as.matrix(read.delim(“clipboard”,row.names=1))
se <- as.matrix(read.delim(“clipboard”,row.names=1))
n <- as.matrix(read.delim(“clipboard”,row.names=1))
 

# calcula a amplitude da variação do erro
se.sup<-means+se
se.inf<-means-se


# desenha o gráfico

bp<-barplot(means,beside=T,ylim=c(0,max(se.sup*1.15)),
ylab=”densidade”,legend.text=c(“Diurno”,”Noturno”),
args.legend=list(x = “topleft”, bty=”n”))
points(bp,means,pch=19)
arrows(bp,se.sup,bp,se.inf, code=3,angle=90,length=0.05)
text(bp,se.sup+1,n)

 





Identificando grupos em um dendrograma

As técnicas de agrupamento (cluster analysis) são muito úteis para organizar, ou classificar, dados observados em estruturas de fácil interpretação. Uma ótima referência é o livro Numerical Ecology with R (Boccard et al. 2011). O tuturial do pacote vegan (clique aqui) também trás explicações e exemplos interessantes.

Os dendrogramas são como mobiles, seus grupos são sempre os mesmos, mas podem mudar de posição. O grupo 1 não é necessariamente o primeiro à esquerda, nem o grupo 2 vem a seguir. Isto pode complicar na hora de interpretar os fatores relacionados na formação dos grupos. Um bom exemplo está na página 38 do tutorial do vegan. Temos a figura de um dendrograma seguida de um boxplot. Se não prestarmos atenção poderemos ser levados a crer, por exemplo, que o grupo 2, onde encontramos a maior mediada é formado pelos objetos 1, 2, 10, 5, 6 e 7. No entanto, este conjunto de objetos forma o grupo 1, como veremos a seguir, que tem a menor mediana. A interpretação do dendrograma poder ser facilitada se o número do grupo puder ser visualizado em conjunto. Vamos ao exemplo do tutorial

# carrega a biblioteca e os dados
library(vegan)
data(dune)

# calcula a matriz de distância, as ligações, plota o dendrograma e identifica os grupos
dis <- vegdist(dune)
cluc <- hclust(dis, “complete”)
plot(cluc)
rect.hclust(cluc, 3)

# verifica que objetos foram classificados em cada grupo
grp<-cutree(cluc, 3)
grp

# substitui no dendrograma o nome do objeto pelo número do grupo
plot(cluc, labels = as.character(grp))

# desenha no dendrograma os retângulos de cada grupo e os numera
# agradeço a dica de Elias T. Krainski (lista R-Br)
plot(cluc)
r <- rect.hclust(cluc, 3)
text(cumsum(sapply(r,length)),
     rep(mean(tail(unique(cluc$hei),2)), length(r)),
     paste(unique(grp[cluc$ord])))
Agora fica mais fácil relacionar o dendrograma ao boxplot no tutorial do vegan.

Gráfico de círculos

Elaborei um gráfico para a representação do número relativo de observações por categoria de determinadas variáveis registradas em diferentes pontos de coleta. No exemplo abaixo, eu tenho o número de embarcações observadas por classe de comprimento total nos municípios de São Paulo (dados são fictícios).


Nesta rotina a relativização é feita por ponto de coleta (município).

Dados (fictícios)

Município 0 ˫ 6 6 ˫ 9 9 ˫ 12 12 ˫ 15 15 ˫ 18 ≥ 18
Ubatuba 37 46 7 7 0 0
Caraguatatuba 41 41 15 2 0 0
Ilhabela 50 39 9 0 0 0
São Sebastião 43 40 14 1 0 0
Bertioga 0 52 28 18 0 0
Santos/Guarujá 6 27 16 16 4 28
São Vicente 75 12 12 0 0 0
Praia Grande 60 39 0 0 0 0
Mongaguá 16 83 0 0 0 0
Itanhaém 0 85 14 0 0 0
Peruíbe 31 43 25 0 0 0
Iguape 38 60 0 0 0 0
Ilha Comprida 66 34 0 0 0 0
Cananéia 34 40 10 11 2 0
Total 497 641 150 55 6 28

# importa dados da área de transferência
dat.graf <- t(read.delim(“clipboard”,dec=”,”,row.names=1))
dat.graf

# indica o valor da variáveis que serão utilizadas

NCATY<-nrow(dat.graf)
NCATX<-ncol(dat.graf)
MARX<-10 # margem da abcissa
MARY<-5 # margem da ordenada
CIRC<-13 # tamanho máximo do círculo
COR<-“blue” # cor do círculo

# plota o gráfico

par(mar=c(MARX,MARY,2,2))
plot(c(1:NCATX),rep(0,NCATX),xlab=””,ylab=””,
xaxp=c(1,NCATX,NCATX-1),yaxp=c(1,NCATY+1,NCATY),
ylim=c(0,NCATY+1),xaxt=”n”,yaxt=”n”,type=”n”)
axis(1,at=c(1:NCATX),labels=colnames(dat.graf),las=2,cex.axis=1.5)
axis(2,at=c(1:NCATY),labels=rownames(dat.graf),las=2,cex.axis=1.5)
for (x in 1:NCATX) {
  for(y in 1:NCATY) {
    points(x,y,col=COR,pch=19,cex=dat.graf[y,x]*CIRC/sum(dat.graf[,x]))
  }
}

# caso a última linha da tabela seja uma totalização e deva ficar em destaque.
abline(v=NCATX-0.5,lty=2)















————-
Algumas pessoas tiveram problemas com a visualização, compreensão e inserção do símbolos matemáticos de indicação dos intervalos de classe.
6 ˫ 9, 6 |- 9, [6,9[ ou [6,9) indica um intervalo de classe que inclui o limite inferior (6) e exclui o superior (9)
No Linux Ubuntu a forma correta de indicar o símbolo “|-” (˫) é Shift+Ctrl+U 02EB e o código para “>=” (≥) é Shift+Ctrl+U 2265, , como podemos ver na figura.
Dependendo no navegador e do sistema operacional estes símbolos podem não ser visualizados corretamente no blog.
Caso os símbolos matemáticos e as acentuações não sejam corretamente importados pelo R através área de transferência (clipboard) podemos gravar a tabela de dados e importa-la como comando read.csv.
Se mesmo assim os probelmas continuarem podemos re-escrever os nomes de colunas e linhas com colnames e rownames:
colnames(dat.graf)
colnames(dat.graf)[4]<-“São Sebastião”
colnames(dat.graf)[6]<-“Santos/Guarujá”
rownames(dat.graf)
rownames(dat.graf)<-c(“0 ˫ 6″,”6 ˫ 9″,”9 ˫ 12″,”12 ˫ 15″,”15 ˫ 18″,”≥ 18”)

Gráfico de círculos

Elaborei um gráfico para a representação do número relativo de observações por categoria de determinadas variáveis registradas em diferentes pontos de coleta. No exemplo abaixo, eu tenho o número de embarcações observadas por classe de compri…