Capítulo 1 Introdução

Visualização de dados é a arte de transformar medidas em padrões visuais. O objetivo é incrivelmente simples, apresentar evidências de um evento ou causalidade do mundo real. E, como qualquer arte, é fácil de descrever e difícil de executar. Na prática, construir figuras baseadas em dados exige expertise da área de conhecimento, noções de design e conhecimento das ferramentas corretas de programação. O retorno para o autor, porém, é imenso.

Impressões visuais nunca foram tão importantes quanto hoje. A popularidade de sites4 como Instagram, Twitter e Facebook mostram o potencial digital que uma figura pode apresentar. Assim, o seu conteúdo de visualização de dados em um relatório técnico ou trabalho acadêmico pode ser facilmente distribuído, com uma chance de viralizar e lhe promover em sua área de trabalho.

Ao mesmo tempo, como uma faca de dois gumes, gráficos também podem ser utilizados para a manipulação e distorção da realidade. Como um analista de dados, seu trabalho também será identificar tais casos. Ao aprender a criar figuras baseadas em dados, entenderás as escolhas realizadas na produção do gráfico e, inevitavelmente, um possível despreparo ou malícia do autor.

No lado do mercado de trabalho, ser a pessoa que saber montar gráficos é uma maneira direta e factível de se diferenciar como profissional. Muitos sabem criar um gráfico em planilhas eletrônicas, por exemplo, mas poucos conseguem ir além e apresentar ilustrações de dados que geram um real impacto ao olho, com a apresentação de informações visuais que facilitam a entrega de uma mensagem. A especialização nesta arte, com o correto uso das ferramentas de programação, certamente lhe diferenciará.

1.1 O Gráfico do Jeremy Siegel

Para entender o impacto de uma figura baseada em dados, vamos olhar o caso do Jeremy Siegel – professor americano especializado no tópico de investimentos. Em seu livro “Investindo em Ações no Longo Prazo: O Guia Indispensável do Investidor do Mercado Financeiro” (Siegel 2015), Jeremy apresenta nas primeiras páginas uma figura que impactou o mundo dos investimentos. Veja o gráfico em questão na Figura 1.1. Tome alguns bons segundos na análise das informações disponíveis ali. De antemão, perceba que cada configuração do gráfico foi uma decisão do autor.

O gráfico de Jeremy Siegel (Siegel 2015)

Figure 1.1: O gráfico de Jeremy Siegel (Siegel 2015)

Ao longo do livro, o autor defende e justifica o investimento financeiro em empresas como sendo o mais rentável no longo prazo. A principal mensagem do livro, e também da figura, é a superioridade de performance financeira quando uma pessoa investe em empresas no mercado de ações. Em resumo, quando olhamos um investimento no longíssimo prazo, mais de 10 anos, as empresas oferecem o maior retorno financeiro entre as alternativas.

Voltando ao gráfico em si, Figura 1.1, as seguintes classes de investimentos são apresentadas:

Stocks (ações)
investimento em empresas através das ações negociadas em bolsa. Utiliza-se do índice SP500 como referência para investimentos em renda variável. Em outras palavras, o investidor que investe no índice irá receber uma média de desempenho das 500 ações que o compõem. O investimento equivalente para o Brasil seria o índice Ibovespa.
Bonds (renda fixa de longo prazo)
investimento em dívida governamental com prazo maior do que um ano. Traduzindo para o Brasil, seria o equivalente a um investimento no Tesouro Direto, isto é, compra de dívida do governo federal.
Bills (renda fixa de curto prazo)
dívidas governamentais com duração menor do que um ano. Aqui não temos uma tradução direta, mas pode-se entender como equivalente a nossa conta poupança, um veículo para investimentos de curto prazo, com bastante liquidez.
US Dollar (dólares americanos)
Compra de dólares físicos. A equivalência para o Brasil seria a compra de notas físicas de Reais.

O gráfico funciona pois demostra, de forma clara, a mensagem do livro: investir em ações é a alternativa mais lucrativa no longo prazo. Já descontando a inflação, alguém que tivesse investido 1 dólar no índice de ações em 1802, teria observado o seu patrimônio crescer para mais de 704,997 dólares em 2004.

Destrinchando a construção do gráfico, nota-se os seguintes pontos e decisões dos autores:

  1. Todos os diferentes investimentos – dólar, ações, dívida pública americana — começam com um dólar. Esta é uma manipulação simples de dados, com o cálculo do retorno acumulado para cada investimento. A escolha padroniza a análise entre as alternativas, e facilita a interpretação. Para verificar a diferença de performance entre cada possibilidade de investimento, basta observar o valor final obtido. Assim, para alguém simular um investimento inicial diferente, é suficiente multiplicar o valor final do investimento pelo montante investido. Por exemplo, 100 dólares investidos em ações em 1802, se tornariam 704 milhões de dólares em 2004.

  2. O retorno acumulado no investimento em ações é ressaltado no gráfico, com o uso de uma linha com uma cor mais intensa. Claramente é uma estratégia visual para passar a mensagem implícita da dominância de ações sobre os demais investimentos. Na primeira batida de olho no gráfico, a linha de ações chama a atenção e já sugere o resultado da análise. Note que, se fosse o contrário, com a linha de ações menos espessa que as demais, a mensagem não seria tão óbvia. O autor mesclou, portanto, o aspecto financeiro de investimento com um padrão gráfico que suporta o mesmo argumento: “o investimento em ações resulta em algo maior do que as alternativas”.

  3. A escala do eixo vertical é não-linear. Veja que os intervalos entre os pontos não são os mesmos. O primeiro ponto do eixo é 1, depois 10, depois 100, até chegar em 1.000.000. A razão é simples, quando colocado em um espaço de gráfico não-linear, os investimentos em ações se assemelham a uma linha reta. Veja, porém, que a linha reta é um resultado ilusório. Se a escala fosse espacialmente correta, os investimentos em renda fixa e dólar não apareceriam no gráfico devido ao alto valor no resultado para ações. E isso distorceria a análise, pois seria impossível enxergar ambas as linhas no mesmo espaço do gráfico.

  4. O valor final do investimento é apresentado como texto na direita do gráfico. Isso facilita a interpretação para o leitor pois não precisa olhar para o eixo da esquerda para identificar o valor final de cada alternativa.

  5. A tabela no lado esquerdo superior do gráfico mostra o retorno anualizado de cada investimento, isto é, o retorno equivalente em um ano que resulta no desempenho observado no gráfico. Em comparação, as ações dominam os demais investimentos, com 6,6% de retorno real anualizado.

Estes aspectos do gráfico são de total responsabilidade do autor. Podes ter certeza que o mesmo ponderou cada decisão de configuração do gráfico até chegar no estado atual. Diversas versões devem ter sido criadas, e o que funciona foi mantido, e o que não funciona foi eliminado.

Para se ter uma ideia do impacto deste gráfico, o nome do autor é praticamente sinônimo do gráfico. Ao procurar imagens relacionadas a busca “Jeremy Siegel” no Google Images, o resultado mostra esta mesma imagem nas mais diversas páginas da internet. Indo além, ao realizar uma busca reversa, isto é, usando a própria imagem como ponto de partida da busca na internet, o Google retorna 3,720,000,000 resultados, incluindo sites de notícias, blogs, bancos e corretoras de investimentos.

Resumindo, o gráfico do livro do Siegel tomou vida própria e pode ser considerado um dos materiais mais impactantes do autor, talvez até mais que o livro em si! Não tenho dúvida que, mesmo desatualizada – o dados utilizados acabam em 2004 – a imagem continuará sendo utilizada nas próximas décadas como um exemplo da mensagem do livro. O grande sucesso do autor foi compilar uma única figura que transmitisse, de forma simples e direta, a mensagem principal de sua obra.

Meu objetivo principal quando escrevi os capítulos do livro Visualização de Dados com o R é mostrar como atingir o mesmo impacto dentro de sua área de trabalho. Talvez não consiga a capilaridade histórica do gráfico do professor Siegel, mas terás conhecimento para criar visualizações de dados que impressionam e transmitem a informação de forma clara. Assim, nossa primeira etapa é entender o que torna os gráficos visualmente atrativos e impactantes, o que funciona e o que não funciona, assim como as ferramentas para construí-los no seu próprio computador. Para começar, no próximo capítulo vamos primeiro buscar entender os princípios por trás da criação de figuras.