Usando o R para fazer downloads de arquivos

October 31, 2011
By

This post was kindly contributed by Ridículas - go there to comment and to read the full post.

Printscreen do diretório com destaque para a seleção dos detalhes do arquivo. O conteúdo selecionado é importado para o R.

Neste link (ce223-2011-01) estão os scripts das minhas aulas de Estatística Computacional, ministradas no primeiro semestre de 2011 para o curso de Estatística da UFPR. Esse curso abordou diversos tópicos, incluindo expressões regulares, manipulação de datas, gráficos da lattice, etc. Aos interessados, é possível fazer o download arquivo por arquivo ou usar o R para automatizar tal tarefa. Isso eu vou ensinar nesse post: como fazer download de arquivos com o R (no linux).

Abra uma sessão R. Agora abra o link dos arquivos no seu navageador. Com o mouse faça a seleção das linhas contendo o nome dos arquivos. Copie para área de transferência (ctrol+c). No R você vai carregar o conteúdo copiado e armazenar em um data.frame. Isso é porque precisamos do nome dos arquivos. Juntando o nome dos arquivos ao prefixo do link, podemos fazer download usando o comando wget do linux. Faremos o R submeter todos os links para o linux baixar. Veja o CMR abaixo. Até a próxima ridícula.

#-----------------------------------------------------------------------------
# diretório web onde estão os arquivos
dire <- "http://www.leg.ufpr.br/~walmes/ensino/ce223-2011-01/"
browseURL(URLencode(dire)) # abra a página no seu navegador

#-----------------------------------------------------------------------------
# lendo a tabela com nome dos arquivos (via ctrol+c)
tab <- read.table("clipboard", header=FALSE, sep="\t", stringsAsFactors=FALSE)
str(tab)

#-----------------------------------------------------------------------------
# segunda coluna corresponde ao nome dos arquivos
arq <- tab$V2

#-----------------------------------------------------------------------------
# suponha que eu queira apenas os arquivos de extensão *.R, eles são
extR <- grep(".R$", arq, value=TRUE)

#-----------------------------------------------------------------------------
# formar o nome dos links para download, colocar o wget antes pois é o comando
links <- paste("wget ", dire, extR, sep="")
links[1]

#-----------------------------------------------------------------------------
# usar a função system() para fazer download com wget

sapply(links, system)

#-----------------------------------------------------------------------------
# pronto, todos os downloads foram feitos. Agora você pode ir na página desses
# caras sabidões e ter as notas de aulas, arquivos, seminários para poder
# aprender. Visite essas páginas:
# http://www.commanster.eu/
# http://socserv.mcmaster.ca/jfox/
# http://www.stat.wisc.edu/~bates/
# http://www.stat.missouri.edu/~ferreiram/
# http://www.isid.ac.in/~deepayan/
# http://www.math.mcmaster.ca/~bolker/
#-----------------------------------------------------------------------------

Tags: , ,

Comments are closed.