O texto de hoje era para ser mais completo, mas achei melhor liberar assim mesmo antes de começar o segundo turno. O Objetivo é simples: analisar o que escrevem os candidatos. Atenção ao detalhe: estamos preocupados aqui com o que eles escrevem, não com o que eles dizem. As fontes de dados são os planos oficiais de governo registrados no TSE. Segue para quem quiser checar a fonte:
A análise foi feita utilizando a ferramenta de mineração de textos R, bastante popular no meio acadêmico para mineração de dados. O procedimento foi simples, mas pode ser enumerado da seguinte forma:
Download dos documentos e conversão dos PDF’s em texto
pdftotext -nopgbrk -layout data/aecio.pdf data/aecio.txt pdftotext -nopgbrk -layout data/dilma.pdf data/dilma.txt
Carga na ferramenta R
library(tm)
library(wordcloud)
install.packages('stringr')
library(stringr)
library(RColorBrewer)
install.packages('SnowballC')
lords
Pré-processamento dos textos
lords
Geração das wordclouds.
wordcloud(lords, scale=c(5,0.5), max.words=100, random.order=FALSE, rot.per=0.35, use.r.layout=FALSE, colors=brewer.pal(8, 'Dark2')) term.matrix
Resultados
As figuras abaixo apresentam os resultados obtidos:


Análise
Não vou me aprofundar muito, até por causa da lei eleitoral. Isso não significa que você não pode olhar a imagem e tirar suas próprias conclusões. Utilize o espaço de comentários à vontade para apresentá-las.
Eleições 2014 e mudança
One Reply to “O que escrevem os candidatos a presidente em 2014”