tabular_problemas_em_nomes {nomesbr} | R Documentation |
Tabula Problemas Detectados nos Nomes
Description
Cria uma tabela resumo contabilizando o número de ocorrências para cada tipo de problema detectado pela função 'marcar_problemas_e_limpar_nomes'.
Usage
tabular_problemas_em_nomes(d, s)
tabulate_name_poblems(d, s)
Arguments
d |
O 'data.table' retornado por 'marcar_problemas_e_limpar_nomes'. |
s |
O nome da coluna original (string) que foi processada. |
Value
Um 'data.table' com as colunas:
'condition': O nome da condição/problema verificado.
'N_detected': Número de vezes que a condição foi detectada.
'N_made_NA': Número de detecções que resultaram na limpeza para 'NA'.
'N_replaced': Número de detecções onde o nome foi alterado (não para 'NA').
Examples
DT_limpo <- data.table::data.table(nome = c("JOSEE SILVA",
"RAIMUNDA DA DA SILVA"), nome_clean = c("JOSE SILVA",
"RAIMUNDA DA SILVA"),
falecido = NA, cartorio = NA,
espaco_TilAcentoApostrofe = NA,
nome_P_M_S_N = NA, nada_nao = NA,
nada_nao_consta2 = NA, final_missing = NA, Xartigo = NA, sr_sra = NA,
ignorado = NA, dededada = 1, letra_repetida = 1)
sumario <- tabular_problemas_em_nomes(DT_limpo, "nome")
print(sumario)
[Package nomesbr version 0.0.7 Index]