Análise de Churn em startup de SaaS através de técnicas de Inferência Causal
Introdução
Este trabalho tem como objetivo analisar as causas de churn na Manu Help, utilizando técnicas de inferência causal para identificar relações de causa e efeito entre o uso de funcionalidades da plataforma e a decisão de cancelamento de assinaturas.
Para isso, são construídos modelos causais, representados por Grafos Acíclicos Direcionados (DAGs), e aplicados métodos como o Efeito Médio de Tratamento e técnicas de identificação e estimação de efeitos causais para quantificar o impacto no churn. Com os resultados, visa-se fornecer insights estratégicos para a empresa.
Dados
As informações utilizadas no projeto foram extraídas de tabelas de usuários e condomínios do banco de dados PostgreSQL da empresa e de arquivos CSV contendo registros de churn.
Devido à falta de identificadores comuns, utilizou-se correspondência por similaridade, restringindo a análise a atributos consistentes (tipo de plano, usuário, ticket e tempo). Foram identificados padrões descritivos iniciais, como alta evasão nos planos digitais.
Inferência Causal
A equipe modelou as relações entre Tratamentos (Tipo de Plano e Tipo de Usuário) e o Resultado (Churn) via Grafos Acíclicos Direcionados.
Isso incluiu variáveis confundidoras que afetam tanto a escolha do plano quanto a chance de sair, para isolar o efeito real de cada tratamento. A análise utilizou o critério backdoor da biblioteca DoWhy, com estimativas validadas por testes de refutação para garantir robustez.
Conclusão e Resultados
O trabalho demonstrou que o tipo de usuário (como "Engenharia/Manutenção" ou "Síndico Profissional") não exerce influência causal significativa no churn. O ajuste para variáveis confundidoras (região, complexidade do negócio, etc.) contrariou as sugestões das correlações iniciais.
Em contrapartida, o tipo de plano emergiu como um fator causal robusto. Usuários em planos classificados como de "alto churn" ("Condomínio Digital" e "Digital Mensal") apresentaram probabilidade 23% a 36% maior de cancelamento quando comparados com aqueles em outros planos, mesmo após ajustes para fatores confundidores.
Modelos Causais (DAGs)
DAG: Tipo de Usuário
DAG: Tipo de Plano
Estimativa de Efeito Causal
Tipo de Usuário → Churn
Tipo de Plano → Churn
Análise de Robustez (Refutação)
Refutação: Tipo de Usuário
Refutação: Tipo de Plano