Introdução

“the best digital theory-building of the past decade stems from social and computational origins. As such, it is increasingly apparent that digital sociologists need to develop a computational as well as a sociological imagination.” (Neil Selwyn)

Social researchers of the future will need to write code, wrangle data, and think computationally as well as sociologically. (EVANS & FOSTER)

O termo “humanidade digitais”

Segundo um estudo do LinkedIn em 15 países, prevendo 150 milhões de vagas nos próximos 5 anos, das áreas de trabalhos digitais em alta e 2021, duas se relacionam a Humanidades Digitais: Big data Analytics (segundo lugar) e “Text, image and voice processing” (6º lugar). Profissionalmente, pode ser interessante entrar nesta área.

Existem diversos termos correlatos a “Humanidades digitais” (“Digital humanities”), como “E-humanities,”Cultural Analytics”, “ciências sociais computacionais”, “sociologia digital”, “história digital”, “etnografia digital”, “etnografia quantitativa”, “Análise cultural quantitativa” (quantitative cultural analysis) “cultural analytics”, “humanities data science”, “humanities data analysis” “humanities computing”, “computational social science”, “distant reading”, “text as data”, “text analytics” etc.

Embora estes termos não sejam todos sinônimos entre si, há diversos pontos de contato. Em quase todos eles há a junção de algo de humanidades e algo de digital, demonstrando seu caráter transdisciplinar. A área possui contribuições de diversas áreas, como das ciências da informação, linguística, ciências da computação, história, sociologia, comunicação, etc. O termo é controverso mesmo entre os participantes, uma vez que é amplo demais. Uma definição ampla define o termo como intersecção entre humanidades e computação. Porém, uma busca no Google por um texto já configura uso de ferramenta digital. Outra definição mais restrita envolveria aprender a pensar como o computador e a partir disto extrair diversas novas possibilidades. Uma introdução aos diferentes significados do termo pode ser vista no artigo “Humanidades digitais” do grupo de pesquisas da USP.

Em termos mais práticos, Humanidades digitais inclui a análise de:

  • sons/música,
  • imagens.
  • textos.
    • Nosso objetivo aqui

Há todo um repertório de ferramentas comuns utilizados tanto por cientistas de dados como por humanistas digitais, com diferentes fins. Nosso foco será aprender diversas destas ferramentas de uso comum, mas focando em seu uso na ciência social computacional.

Em ramos da ciência social como Sociologia, Ciência Política, Comunicação Social, etc. é bem comum o termo “Ciência Social Computacional” (Computational Social Science). Este artigo de Chris Bail, Mapping Computational Social Science de 2019 mostra como este campo está explodindo no número de publicações. Uma outra dica é o artigo Computational social science: Obstacles and opportunities de 2020 na Science, com nomes importantes do campo.

Fluxo de trabalho

O fluxo de trabalho “workflow” básico consiste em:

<!– A[1.Adquirir dados] – >B[2.Pré tratar dados]; –>