Introdução à Análise Textual aplicada à Sociologia
Primeira versão em 22 de abril de 2021.
Última atualização em 02 julho de 2022
Objetivos deste manual
Sou Alisson Soares, sociólogo, e comecei no campo das humanidades digitais e ciências sociais computacionais. Achei por bem montar este manual como uma forma de compartilhar o que venho aprendendo. Algumas ferramentas, softwares serão de modo gráfico, mas muitas vezes iremos recorrer à programação. A linguagem aqui será o R, uma linguagem de programação gratuita, livre e de código aberto, bastante utilizada no mundo acadêmico.
O objetivo deste manual é:
- Ser um livro em progresso constante. (Confira a data de atualização para saber se há material novo)
- Ser introdutório, mas também sempre indicar bons materiais para maior aprofundamento dos temas tratados.
- Sempre que possível, oferecer material em português, apesar de nem sempre isto ser possível.
- Oferecer uma introdução às ferramentas computacionais utilizadas em pesquisa das ciências sociais.
- Usar preferencialmente ferramentas gratuitas e de código aberto.
- Sempre que possível, apresentar exemplos de pesquisa e ciência social utilizando estas ferramentas.
- Ao final de cada capítulo sessão apresentamos dicas de links externos. Há também um capítulo dedicado a links de temas correlatos, que podem ajudar a vida dos humanistas digitais.
Caso encontre algum erro ou imprecisão, caso tenha algum elogio ou crítica, meu contato é alissonmsoares@gmail.com e meu contato no Twitter. Agradecimento aos grupos “R Brasil” e “R Humanidades” no Telegram que ajudaram na construção deste manual, com dicas que foram aproveitadas aqui.
Plano do livro
Por se tratar de um livro em elaboração há ainda muitos pontos ainda a serem trabalhaos. Há vários temas a serem incorporados futuramente e já estão em elaboração, como por exemplo:
- obtenção de dados (datasets de pacotes, webscraping básico, APIs)
- diferentes tipos de visualizações, como dendrogramas, pyramid plot, etc.
- Correlação, tipos de distâncias/semelhança
- extração de palavras chave (keyword extraction)
- Introdução à análise de redes
- Inteligência Artificial: clusterização; aprendizado supervisionado e não supervisionado (como topic modeling)
- Análise de sentimentos (+ visualizações)