The hardware and bandwidth for this mirror is donated by dogado GmbH, the Webhosting and Full Service-Cloud Provider. Check out our Wordpress Tutorial.
If you wish to report a bug, or if you are interested in having us mirror your free-software or open-source project, please feel free to contact us at mirror[@]dogado.de.
Rodrigo E. S. Borges
O pacote sidra
fornece uma interface simples para
acessar a API de dados do SIDRA (Sistema IBGE de Recuperação
Automática), permitindo que você consulte dados do IBGE diretamente do
R, a partir da api rest tornada disponível em servicodados.ibge.gov.br.
Este documento fornece uma introdução ao pacote e apresenta exemplos básicos para ajudá-lo a começar.
O pacote foi submetido ao CRAN, uma vez aceito pode instalar a versão CRAN com:
install.packages("sidra")
Para instalar o pacote diretamente do GitHub, utilize o código abaixo:
# Instalar remotes, se necessário
# install.packages("remotes")
# Instalar o pacote sidra
::install_github("rodrigoesborges/sidra") remotes
Após a instalação, carregue o pacote com:
library(sidra)
O pacote sidra contém diversas funções para acessar diferentes seções da API SIDRA. Abaixo, uma descrição das funções principais.
Esta é a função principal do pacote, que permite fazer consultas gerais à API SIDRA com diversos parâmetros. Use esta função para acessar dados diretamente especificando a tabela, variáveis, classificadores, períodos e níveis geográficos.
sidra(tabela, classificador = "", filtro_cats = "", nivel = 1, filtro_niveis = "all", periodo = "all", variavel = "allxp", inicio = NULL, fim = NULL)
tabela: Número da tabela desejada.
classificador: Classificador a ser detalhado. O padrão retorna todos os classificadores disponíveis.
filtro_cats: Define subconjunto do classificador.
nivel: Define o nível geográfico, por exemplo, N1 para Brasil, N6 para Município.
filtro_niveis: Define um subconjunto do nível especificado.
periodo: Período dos dados; "all" para todos os períodos disponíveis.
variavel: Variáveis a serem retornadas; "allxp" exclui variáveis calculadas pela SIDRA.
inicio, fim: Início e fim do período desejado.
A função tab_search() permite buscar tabelas, agregados ou variáveis da SIDRA que contenham o termo especificado. Esta função é útil quando você deseja encontrar tabelas ou variáveis específicas sem conhecer o número exato da tabela.
Essa função retorna uma lista de tabelas ou variáveis que possuem o termo especificado na descrição. É útil para encontrar rapidamente as tabelas que contêm os dados que você deseja consultar.
tab_search(termo): Retorna uma lista de agregados ou variáveis que contêm o termo buscado.
termo: Termo de busca em texto. A função pesquisa o termo em descrições de tabelas e variáveis.
A função retorna um data frame com três colunas:
ID do Agregado/Tabela: Número identificador do agregado ou tabela.
Descrição: Descrição do agregado ou variável contendo o termo buscado.
Variável: Indica se o item retornado é uma variável (TRUE) ou uma tabela/agregado (FALSE).
Essa função retorna a fonte dos dados, i.e. a Pesquisa primária fonte, para uma tabela específica, permitindo entender a origem e confiabilidade dos dados.
tab_fonte(tabela): Retorna a fonte de dados para a tabela especificada.
tabela: Número da tabela de interesse.
Essas funções fornecem metadados sobre uma tabela específica, oferecendo informações detalhadas sobre o conteúdo da tabela.
tab_meta(tabela): Retorna metadados para uma tabela específica.
tabela: Número da tabela de interesse.
Aqui estão exemplos de como usar essas funções para consultar dados específicos na API SIDRA.
Aqui está um exemplo de como usar tab_search() para buscar tabelas e variáveis que contêm o termo “produção”.
# Carregar o pacote
library(sidra)
# Buscar tabelas e variáveis que contenham "produção" na descrição
<- tab_search("produção")
resultados print(resultados)
Esse comando retornará uma lista de tabelas e variáveis que contêm “produção” na descrição. Essa funcionalidade é útil para explorar as tabelas disponíveis na SIDRA quando você não conhece o número exato da tabela ou variável que está procurando.
Para acessar os metadados de uma tabela específica, como a tabela 1612:
<- tab_meta(1612)
metadados print(metadados)
Para listar as variáveis disponíveis para uma tabela específica, como a tabela 1612:
<- tab_vars(1612)
variaveis print(variaveis)
A função sidra() permite fazer consultas específicas de dados. Neste exemplo, buscamos dados da tabela 1612, com o classificador 81, no nível geográfico de Estados.
<- sidra(1612, classificador = 81, nivel = 3)
dados head(dados)
Limites de consulta: Algumas consultas podem exceder o limite de 100.000 registros permitido pela API do IBGE. Nesse caso, por definição o pacote busca dividir a consulta em requisições menores a partir de segmentação dos períodos requisitados. Ainda que robusto, pode não funcionar para todos os casos, pelo qual sugerimos faça a segmentação manualmente da requisição se necessário.
Níveis e Classificadores: Ao utilizar filtro_niveis ou filtro_cats, certifique-se de que eles tenham o mesmo tamanho do argumento nivel ou classificador, respectivamente.
O pacote sidra facilita a consulta aos dados do IBGE, possibilitando um fluxo de trabalho mais ágil para análises de dados diretamente no R. Para maiores informações, visite a documentação da API SIDRA e explore as funções adicionais do pacote.
Para maiores detalhes, consulte a vinheta Introdução ao sidra .
These binaries (installable software) and packages are in development.
They may not be fully stable and should be used with caution. We make no claims about them.
Health stats visible at Monitor.