Manual do CTO

Correlação não implica em causalidade

Todos conhecemos alguém, fanático torcedor, que associe o local onde está, com quem está assistindo um jogo, ou até mesmo a roupa íntima que está vestindo com resultados do seu time do coração. Para piorar, muitas vezes, o histórico parece corroborar com esse tipo de crença. Não é mesmo? Evidentemente, para desgosto de alguns, o mais provável é que tudo seja mera coincidência.

Não é raro ignorarmos que correlação não implica em causalidade. Ou seja, não é porque dois eventos aparentemente ocorram sempre juntos que um seja o causador do outro. As vezes, a causa é um terceiro evento, não analisado, ou, ainda, as ocorrências simultâneas podem não ter qualquer causalidade comum, mesmo que indireta.

Nas empresas a confusão entre correlação e causalidade sempre ocorreu. É comum “especialistas”, em suas análises de causa raíz, com utilidade cada vez mais questionável, cometerem esse erro recorrentemente. Além disso, há quem use desse “erro comum” para criar argumentos falaciosos.

Com a proliferação da adoção amadora de algoritmos de análise de dados, sobretudo os que tratam de regressão e correlação, tememos que muitos disparates causados por pura incompetência sejam “travestidos” com racionalidade acadêmica. Isso fica bem indicado nas hilárias correlações identificadas no site Spurious Correlations.

Infelizmente, situações práticas, nada hilárias, tem ficado evidenciadas já “em plena produção”. Além disso,  há potencial para que esse problema se amplifique.

É necessário investir em formação e constante revisão dos métodos de análise adotados na empresa para evitar a propagação de enganos. Estamos na “era dos modelos de negócios exponenciais” habilitados pelo “desprendimento” da informação como fonte de receita. As oportunidades são grandes demais para serem ignoradas ou ameaçadas por simples despreparo.

Em tempos em que se fala tanto em culturas “data-driven”, é papel do CTO garantir que a companhia desenvolva as capacidades e competências para não ser “data-stupid”.

Em Resumo
  • O problema

    O uso ingênuo de análise de dados faz com que, frequentemente, correlações sejam confundidas com causalidades. O problema se amplifica com a cultura "data-driven" e o uso incorreto de algoritmos e gera, além de argumentos falaciosos, prejuízos reais.
  • A recomendação

    É necessário, mais do que nunca, desenvolver competências e capacidades nas companhias para que elas não cometam erros grosseiros de simplificação ao analisar dados, também para que não sejam susceptíveis a argumentos falaciosos.
  • Os benefícios

    O uso correto das informações habilita até mesmo a concepção de modelos de negócios exponenciais. A inteligência "data-driven" é uma excelente ferramenta, mas só quando realmente se sabe o que se está fazendo.

Elemar Júnior

Microsoft Regional Director e Microsoft MVP. Atua, há mais de duas décadas, desenvolvendo software e negócios digitais de classe mundial. Teve o privilégio de ajudar a mudar a forma como o Brasil vende, projeta e produz móveis através de software. Hoje, seus interesses técnicos são arquiteturas escaláveis. bancos de dados e ferramentas de integração. Além disso, é fascinado por estratégia e organizações exponenciais.

Talvez você goste também

Carregando posts…

Mais posts da série Manual do CTO

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *