The hardware and bandwidth for this mirror is donated by dogado GmbH, the Webhosting and Full Service-Cloud Provider. Check out our Wordpress Tutorial.
If you wish to report a bug, or if you are interested in having us mirror your free-software or open-source project, please feel free to contact us at mirror[@]dogado.de.
nomesbr é um pacote de R que limpa e simplifica nomes de pessoas para auxiliar no pareamento de banco de dados na ausência de chaves únicas não ambíguas. Detecta e corrige erros tipográficos mais comuns, simplifica opcionalmente termos sujeitos eventualmente a omissão em cadastros, e simplifica .
(R package for tidying and simplifying. Created for aiding in dataset pairing in the absence of unambiguous keys. It detects and corrects common typos, optionally simplifies terms prone to omission in records.)
O pacote nomesbr torna disponíveis funções para
limpar e simplificar nomes. limpar_nomes()
e
simplifica_PARTICULAS_AGNOMES_PATENTES
, principais funções
do pacote, foram criadas para seu uso em sequência nessa ordem.
limpar_nomes()
recebe como parâmetros d,um data.frame, e
s, nome da coluna com os nomes a processar. A função cria uma nova
coluna, com sufixo ’_clean’, e gera novas colunas com informações dos
tipos de limpeza detectados como necessários e realizados.
simplifica_PARTICULAS_AGNOMES_PATENTES()
recebe também,
d e s (por padrão para s, ‘nome_clean’) como parâmetros, e simplifica
partículas repetidas, agnomes e alguma patentes.
A informação (novas colunas) gerada pela função
limpar_nomes()
servem como base para a função
tabular_problemas_em_nomes()
, que retorna uma tabela
resumo dos problemas detectados e ações tomadas no sentido da limpeza de
nomes.
nomesbr é desenvolvido por uma equipe de pesquisadores do Instituto de Pesquisa Econômica Aplicada (Ipea).
These binaries (installable software) and packages are in development.
They may not be fully stable and should be used with caution. We make no claims about them.
Health stats visible at Monitor.