Amostrar linhas em um data.frame

This post was kindly contributed by Anotações R Statistical Computing - go there to comment and to read the full post.

Algumas vezes necessitamos obter um subconjunto de um conjunto de dados. Se pudermos estabelecer um critério a partir dos valores deste conjunto de dados podemos utilizar o comando subset. Para obter uma amostra aleatória das linhas pensei na seguinte solução:

# cria um conjuto de dados com duas colunas e 500 linhas
dados <- data.frame(rnorm(500,5,3),rnorm(500,10,6))
dim(dados)
summary(dados)

# faz a amostra de 100 linhas sem reposição
dados.amostra<-dados[sample(1:nrow(dados),100,replace=F),]
dim(dados.amostra)
summary(dados.amostra)


Tags: , , , ,

Comments are closed.