[PT-BR] Princípios básicos da Visualização de Dados



A terminologia da área de Visualização é algo que confunde bastante gente que (como eu) está ingressando na área. Por ser um campo relativamente novo é de se esperar que isso ocorra mesmo. Neste texto vamos explorar um pouco dos conceitos básicos e falar sobre algumas ~polêmicas~ da área.

Pra começar, por que a gente quer codificar os dados em elementos visuais? Em outras palavras, pra que a gente cria visualizações? A visão é um sentido bastante desenvolvido em nós seres humanos, o que proporciona o processamento bem rápido de informações codificadas visualmente. Como uma ferramenta de comunicação, uma visualização pode ensinar, promover insights e até gerar uma ação por parte do usuário.

O poder da visualização de dados

Em uma prova você preferiria tirar 72 em uma escala de 0 a 100 ou 96 em uma escala de 0 a 137?

(pausa para pensar na pergunta acima hehe)

Difícil comparar, certo? E se usarmos uma representação visual?

72/100 é ligeiramente melhor do que 96/137 — Fonte: The Trutful Art

A visão é tão importante que muitas vezes a gente só toma algo como verdade depois de visualizar uma evidência que comprove a veracidade da coisa (Cairo, 2013). Isso torna a visualização de dados uma ferramenta bastante poderosa. E como toda ferramenta, ela pode ser usada para o bem ou para mal.

Etapas para criar uma visualização

Em termos práticos, a tarefa de visualizar informação consiste em mapear os dados em elementos visuais.

Como a escrita ou a fala, o principal objetivo de criar uma visualização é comunicar algo. Por isso, antes de sequer pensar em que tipo de gráfico escolher, a pergunta que a gente deve fazer é:

“O que eu quero comunicar? O que a visualização deve deixar as pessoas aptas a fazer? O que eu quero revelar partir dos dados?”

No Information Visualization Manifesto, Manuel Lima define como primeiro princípio a noção de que Form Follows Function:

A forma segue um propósito, e em Visualização da Informação, a forma segue a revelação — Manuel Lima

Com isso a gente entra numa área meio polêmica do negócio: beleza vs. revelação.

Como Manuel cita no Manifesto, críticas como “É só uma visualização desenvolvida para criar uma visualização, e não para revelar algo”, “É só um negócio bonitinho” e “Todas as visualizações se parecem, são todas iguais” são comuns com relação a projetos que prezam mais pela estética do que em comunicar algo.

Porém isso não quer dizer que esses projetos são ruins. Eles “têm seu propósito e fazem parte do crescimento contínuo da disciplina de Visualização de Dados” (Lima, 2013). Podemos destacar pontos do Manifesto que servem bem para diferenciar projetos estéticos vs. projetos com foco em revelar algo. Segundo Manuel Lima os projetos com foco na revelação seguem esses princípios:

E tudo bem se você não seguir esses princípios. O apelo é só para não classificar seu trabalho como Visualização de Dados nesses casos:

[…] estes projetos devem começar a ser categorizados de uma forma diferente. E existem muitas designações que podem servir para isso, como New Media Art, Computer Art, Algorithmic Art, e o meu termo favorito e recomendado: Information Art — Manuel Lima

Agora que a gente passou pela polêmica vamos explorar algumas áreas da pesquisa científica em visualização de dados.

A disciplina da Visualização

A Visualização vem se desenvolvendo em duas áreas diferentes: Information Visualization (InfoVis) e Scientific Visualization (SciVis). O foco da InfoVis é em mapear dados abstratos em representações visuais. Já o foco da SciVis é em representar visualmente os dados que estão presentes no nosso mundo real, como por exemplo a visualização de imagens astronômicas ou a visualização de partículas durante um processo químico. As duas áreas seguem quase os mesmos princípios (Heimer, 2017).

A área de Visual Analytics tem suas raízes em InfoVis e é uma disciplina que estuda as representações para proporcionar informações para através de meios visuais. É uma área realmente bem nova, a primeira ocorrência do termo é em um título de um editorial de 2004 (Heimerl, 2017).

Essa é a minha área de estudo (e consequentemente pra mim a área mais legal) porque combina a área de visualização com várias outras disciplinas, incluindo ciências cognitivas e estatística pra criar uma nova ciência que ajuda o usuário a ver, entender e aprender a partir de um grande conjunto de dados.

Tá, e agora?

Visualizar é mapear os dados em elementos visuais, mas como a gente faz isso? Como a gente cria as visualizações para que o usuário realize uma determinada tarefa? Que elementos a gente utilizar pra criar as visualizações?

A verdade é que eu ainda tou tentando descobrir! Mas quando eu tiver mais pistas volto aqui para escrever mais sobre :)