Projeto de Formatura 2025 • PCS - Escola Politécnica da USP

Análise de Churn em startup de SaaS através de técnicas de Inferência Causal

André Yugo Inoue Daniel Jovchelevich Carvalho Murillo Freitas da Silva
Orientador: Prof. Dr. Fabio Gagliardi Cozman

Introdução

Este trabalho tem como objetivo analisar as causas de churn na Manu Help, utilizando técnicas de inferência causal para identificar relações de causa e efeito entre o uso de funcionalidades da plataforma e a decisão de cancelamento de assinaturas.

Para isso, são construídos modelos causais, representados por Grafos Acíclicos Direcionados (DAGs), e aplicados métodos como o Efeito Médio de Tratamento e técnicas de identificação e estimação de efeitos causais para quantificar o impacto no churn. Com os resultados, visa-se fornecer insights estratégicos para a empresa.

Dados

As informações utilizadas no projeto foram extraídas de tabelas de usuários e condomínios do banco de dados PostgreSQL da empresa e de arquivos CSV contendo registros de churn.

Devido à falta de identificadores comuns, utilizou-se correspondência por similaridade, restringindo a análise a atributos consistentes (tipo de plano, usuário, ticket e tempo). Foram identificados padrões descritivos iniciais, como alta evasão nos planos digitais.

Inferência Causal

A equipe modelou as relações entre Tratamentos (Tipo de Plano e Tipo de Usuário) e o Resultado (Churn) via Grafos Acíclicos Direcionados.

Isso incluiu variáveis confundidoras que afetam tanto a escolha do plano quanto a chance de sair, para isolar o efeito real de cada tratamento. A análise utilizou o critério backdoor da biblioteca DoWhy, com estimativas validadas por testes de refutação para garantir robustez.

🖥️
Aplicação Web Interativa: Além da análise, foi desenvolvida uma aplicação web através da qual é possível reproduzir e exibir todo o processo (do pré-processamento aos resultados) em tempo real, facilitando o consumo do estudo e a tomada de decisão por públicos de negócios. A aplicação web não está disponibilizada publicamente devido ao alto custo da execução em nuvem, mas uma captura de tela ilustrativa é apresentada abaixo.
Screenshot da Aplicação Web

Conclusão e Resultados

O trabalho demonstrou que o tipo de usuário (como "Engenharia/Manutenção" ou "Síndico Profissional") não exerce influência causal significativa no churn. O ajuste para variáveis confundidoras (região, complexidade do negócio, etc.) contrariou as sugestões das correlações iniciais.

Em contrapartida, o tipo de plano emergiu como um fator causal robusto. Usuários em planos classificados como de "alto churn" ("Condomínio Digital" e "Digital Mensal") apresentaram probabilidade 23% a 36% maior de cancelamento quando comparados com aqueles em outros planos, mesmo após ajustes para fatores confundidores.

Modelos Causais (DAGs)

DAG: Tipo de Usuário

Grafo Acíclico Direcionado para Tipo de Usuário

DAG: Tipo de Plano

Grafo Acíclico Direcionado para Tipo de Plano

Estimativa de Efeito Causal

Tipo de Usuário → Churn

Gráfico comparando Correlação vs Causalidade para Tipo de Usuário

Tipo de Plano → Churn

Gráfico comparando Correlação vs Causalidade para Tipo de Plano

Análise de Robustez (Refutação)

Refutação: Tipo de Usuário

Gráfico de Refutação para Tipo de Usuário

Refutação: Tipo de Plano

Gráfico de Refutação para Tipo de Plano