Bases de dados de países (comparada)

Quem já trabalhou com mais de uma base de dados de países sabe que um dos infernos é que cada base tem um jeito de designar um país. Vietnam do Sul, por exemplo, pode ser: South Vietnam, Sout Viet Nam, Vietnam South, Vietnam (South), Vietnam, South…

Sem falar quando digitam errado (Tinha uma “Venezuala”) numa base que tô usando. Enfim, para juntar as bases, tive que fazer uma lista (na mão) de todas as substituições e aí eu cirei uma função no R que faz as substituições. Obviamente tive que escolher um padrão meu, e é um pena que não haja um padrão internacional na ciência política e economia.

Se alguém tiver o mesmo problema, posso enviar o código da minha função. Ela tá bem feinha, mas funciona pra quase todos os países.

Sobre Manoel Galdino

Corinthiano, Bayesiano e Doutor em ciência Política pela USP.
Esse post foi publicado em Manoel Galdino e marcado , , , . Guardar link permanente.

3 respostas para Bases de dados de países (comparada)

  1. Eduardo Leoni disse:

    Malecki estava tentando fazer algo parecido. Ver embaixo http://malecki.wustl.edu/software.html Quem sabe vocês não juntam esforços?

  2. Gabriel Cepaluni disse:

    Pressuponho que o erro de digitação seja meu. Se for, foi mal. Estou indo na USP diariamente. Podemos marcar um dia lá para falarmos do artigo.

  3. Gabriel, não, o erro não era seu não. Era do Barro, economista. É da base dele de escolaridade.

    Leoni, obrigado pela dica. vou dar uma olhada no site…

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s