Category: portuguese

Média e desvio-padrão de muitas variáveis separado por grupos

Em estatística descritiva é comum a síntese dos dados em medidas de posição e dispersão. As medidas mais frequentemente usadas são a média e o desvio-padrão. Não raramente, existe a necessidade de obter essas medidas separando as observações por alguma variável categórica do conjunto de dados. Nesse post apresento algumas formas de obter isso. Estou […]

Moda de uma amostra: método do histograma vs método kernel

Uma pergunta bem comum nos fóruns de estatística, geralmente associado à alunos de graduação, é de alguma função no R para obter a moda de um conjunto de dados. Bem, como moda se refere ao valor de maior frequência na amostra, a tarefa é simples para dados discretos: basta obter a distribuição de frequência dos […]

Usando o R para fazer downloads de arquivos

Neste link (ce223-2011-01) estão os scripts das minhas aulas de Estatística Computacional, ministradas no primeiro semestre de 2011 para o curso de Estatística da UFPR. Esse curso abordou diversos tópicos, incluindo expressões regulares, manipulação de datas, gráficos da lattice, etc. Aos interessados, é possível fazer o download arquivo por arquivo ou usar o R para […]

Avaliação do direcionamento de pescarias

Em uma pescaria é importante determinar que espécies são alvo e quais podem ser consideradas fauna acompanhante. A análise da variação do direcionamento, ou da importância relativa de uma espécie na composição das capturas, ao longo do tempo pode indicar padrões na dinâmica das frotas pesqueiras ou na abundância do recurso. O trabalho  Biseau, A. 1998. Definition os a directed fishing effort in a mixed-species trawl fishery, and its impacts on stock assessments. Aquat. Living Resour. 11(3):119-136 apresenta um método simples e objetivo para esta avaliação.


Abaixo apresento um script para a aplicação do método a partir de dados de captura total por viagem (Ti) e da captura da espécie por viagem (Tis).

# simulação de dados para rodar o script
Ti <- rnorm(1000,4000,300)
Tis <- Ti*runif(1000,0,1)
dat.biseau<-data.frame(Ti,Tis)
rm(Ti,Tis)
# aplicação do método de Biseau
# Ti é a captura total na vigem e Tis a captura da espécie na viagem

summary(dat.biseau)
dat.biseau$C<-dat.biseau$Tis/dat.biseau$Ti
dat.biseau$j<-as.integer(dat.biseau$C*100)
agg.j<-aggregate(dat.biseau$Tis,list(j=dat.biseau$j),FUN=sum)
names(agg.j)<-c(“j”,”TC”)
dat.direc <- data.frame(0:100,rep(0,101))
names(dat.direc)<-c(“j”,”TC”)
for (i in 0:100) {
ifelse(nrow(subset(agg.j,j==i,TC))==0,
dat.direc$TC[dat.direc$j==i]<-0,
dat.direc$TC[dat.direc$j==i]<-agg.j$TC[agg.j$j==i])
}
dat.direc$P <- cumsum(dat.direc$TC)/sum(dat.direc$TC)*100
dat.direc
plot(dat.direc$P~dat.direc$j,type=”l”,xlab=”proporção da espécie na descarga da viagem (%)”,ylab=”descargas acumuladas (%)”,xlim=c(0,100),ylim=c(0,100))

Usando Sweave para fazer figuras com tikz integrado o GNUplot

Tikz é um pacote LaTeX para fazer figuras. As figuras são feitas por comandos assim como fazemos os gráficos no R. Porém, as opções da tikz vão além de gráficos de exploração gráfica ou de resultados como os do R. É possível fazer figuras bem complexas e de alta qualidade tipográfica com esse pacote. Veja […]

Paralelização de processos

Hoje em dia os computadores estão cada vez mais rápidos e via de regra, nossos processsadores tem mais de um núcleo de processamento. Isso é um “horizonte” grande que nos permite avançar num campo “baixo nível” da informática de gerenciar nossos processos para que eles sejam feitos em paralelo entre os vários núcleos do processador. […]

Procedimento gráfico interativo para densidade com rpanel

Alguns posts atrás eu apresentei procedimentos gráficos para obtenção de valores iniciais em regressão não linear. Dessa vez eu mudei o foco. Vou apresentar os procedimentos gŕaficos interativos disponíveis no pacote rpanel ilustrando o procedimento de estimação kernel de densidade. O pacote rpanel possui funções para alterar componentes do gráfico. Os mais úteis são: deslizadores, […]