Nova descoberta de previsão fornece resultados chocantemente próximos da realidade
Um grupo internacional de matemáticos liderado pelo estatístico da Universidade Lehigh, Taeho Kim, desenvolveu uma nova maneira de gerar previsões que se alinham mais de perto com os resultados do mundo real. O seu método visa melhorar as previsões em muitas áreas da ciência, particularmente na investigação em saúde, biologia e ciências sociais.
Os pesquisadores chamam sua técnica de Preditor Linear de Concordância Máxima, ou MALP. Seu objetivo central é melhorar o quão bem os valores previstos correspondem aos observados. O MALP faz isso maximizando o Coeficiente de Correlação de Concordância, ou CCC. Esta medida estatística avalia como os pares de números caem ao longo da linha de 45 graus em um gráfico de dispersão, refletindo tanto a precisão (quão estreitamente os pontos se agrupam) quanto a exatidão (quão próximos eles estão dessa linha). As abordagens tradicionais, incluindo o método dos mínimos quadrados amplamente utilizado, normalmente tentam reduzir o erro médio. Embora eficazes em muitas situações, estes métodos podem errar o alvo quando o objetivo principal é garantir um forte alinhamento entre as previsões e os valores reais, diz Kim, professor assistente de matemática.
“Às vezes, não queremos apenas que as nossas previsões sejam próximas – queremos que tenham a maior concordância com os valores reais”, explica Kim. “A questão é: como podemos definir a concordância de dois objetos de uma forma cientificamente significativa? Uma forma de conceituar isso é quão próximos os pontos estão alinhados com uma linha de 45 graus em um gráfico de dispersão entre o valor previsto e os valores reais. Portanto, se o gráfico de dispersão destes mostra um forte alinhamento com esta linha de 45 graus, então poderíamos dizer que há um bom nível de concordância entre estes dois.”
Por que o acordo é mais importante do que a simples correlação
De acordo com Kim, muitas vezes as pessoas pensam primeiro no coeficiente de correlação de Pearson quando ouvem a palavra concordância, uma vez que é introduzido cedo na educação estatística e continua a ser uma ferramenta fundamental. O método de Pearson mede a força de uma relação linear entre duas variáveis, mas não verifica especificamente se a relação está alinhada com a linha de 45 graus. Por exemplo, ele pode detectar correlações fortes para linhas que se inclinam em 50 ou 75 graus, desde que os pontos de dados estejam próximos de uma linha reta, diz Kim.
“No nosso caso, estamos especificamente interessados no alinhamento com uma linha de 45 graus. Para isso, usamos uma medida diferente: o coeficiente de correlação de concordância, introduzido por Lin em 1989. Esta métrica concentra-se especificamente em quão bem os dados se alinham com uma linha de 45 graus. O que desenvolvemos é um preditor projetado para maximizar a correlação de concordância entre valores previstos e valores reais. “
Testando MALP com exames oftalmológicos e medições corporais
Para avaliar o desempenho do MALP, a equipe realizou testes usando dados simulados e medições reais, incluindo exames oftalmológicos e avaliações de gordura corporal. Um estudo aplicou o MALP a dados de um projeto de oftalmologia comparando dois tipos de dispositivos de tomografia de coerência óptica (OCT): o antigo Stratus OCT e o mais recente Cirrus OCT. À medida que os centros médicos migram para o sistema Cirrus, os médicos precisam de uma maneira confiável de traduzir as medições para que possam comparar os resultados ao longo do tempo. Usando imagens de alta qualidade de 26 olhos esquerdos e 30 olhos direitos, os pesquisadores examinaram a precisão com que o MALP poderia prever as leituras do Stratus OCT a partir das medições do Cirrus OCT e compararam seu desempenho com o método dos mínimos quadrados. O MALP produziu previsões mais alinhadas com os valores verdadeiros do Stratus, enquanto os mínimos quadrados superaram ligeiramente o MALP na redução do erro médio, destacando uma compensação entre concordância e minimização do erro.
A equipe também analisou um conjunto de dados de gordura corporal de 252 adultos que incluía peso, tamanho do abdômen e outras medidas corporais. Medidas diretas do percentual de gordura corporal, como a pesagem subaquática, são confiáveis, mas caras, portanto, medições mais fáceis são frequentemente substituídas. O MALP foi utilizado para estimar o percentual de gordura corporal e foi avaliado pelo método dos mínimos quadrados. Os resultados foram semelhantes aos do estudo de varredura ocular: o MALP forneceu previsões que correspondiam mais aos valores reais, enquanto os mínimos quadrados novamente tiveram erros médios ligeiramente mais baixos. Este padrão repetido sublinhou o equilíbrio contínuo entre concordância e minimização de erros.
Escolhendo a ferramenta certa para a tarefa certa
Kim e seus colegas observaram que o MALP frequentemente fornecia previsões que correspondiam aos dados reais de forma mais eficaz do que as técnicas padrão. Mesmo assim, observam que os investigadores devem escolher entre o MALP e métodos mais tradicionais com base nas suas prioridades específicas. Embora a redução do erro geral seja o objetivo principal, os métodos estabelecidos ainda funcionam bem. Quando a ênfase está em previsões que se alinhem o mais possível com os resultados reais, o MALP é muitas vezes a opção mais forte.
O impacto potencial deste trabalho atinge muitas áreas científicas. Ferramentas de previsão melhoradas poderiam beneficiar a medicina, a saúde pública, a economia e a engenharia. Para os investigadores que dependem de previsões, o MALP oferece uma alternativa promissora, especialmente quando alcançar uma concordância estreita com os resultados do mundo real é mais importante do que simplesmente reduzir a diferença média entre os valores previstos e observados.
“Precisamos investigar mais”, diz Kim. “Atualmente, nossa configuração está dentro da classe de preditores lineares. Este conjunto é grande o suficiente para ser usado na prática em vários campos, mas ainda é restrito matematicamente falando. Portanto, desejamos estender isso para a classe geral para que nosso objetivo seja remover a parte linear e assim se tornar o Preditor de Concordância Máxima.”
Share this content:



Publicar comentário