Vídeo: Como calcular o coeficiente de correlação no Excel 2024
O coeficiente de correlação de Spearman, r S , foi o teste não paramétrico mais antigo baseado em classificações. Para uma amostra de indivíduos cada medida em duas variáveis no Excel, a idéia é classificar cada pontuação dentro de sua própria variável. Então, para cada indivíduo, subtrair um grau do outro. Se a correlação for perfeita (na direção positiva), todas as diferenças são zero.
A imagem abaixo mostra um exemplo. Um psicólogo industrial avaliou a sociabilidade de 20 funcionários da FarDrate Timepiece Corporation. A escala variou de 1 (menos sociável) a 100 (mais sociável). Cada funcionário da FarDrate também classificou sua satisfação no trabalho em uma escala de 1 (menor satisfação) para 80 (maior satisfação). A hipótese nula é que a sociabilidade não está correlacionada com a satisfação no trabalho. A hipótese alternativa é que essas duas variáveis estão correlacionadas.
Os dados estão nas colunas B e C, e as fileiras estão nas colunas E e F. As diferenças entre cada par de fileiras estão na coluna G.
rS da Spearman.A fórmula é
onde d é uma diferença entre parênteses. Como é o caso do coeficiente de correlação regular, se a hipótese nula for verdadeira, o valor de r S deve ser em torno de zero.
Para calcular as classificações na coluna E, digite
= RANK. AVG (B2, $ B $ 2: $ B $ 21, 1)
em E2 e preenchido automaticamente. Para as classificações na coluna E, digite
= RANK. AVG (C2, $ C $ 2: $ C $ 21, 1)
em F2 e preenchido automaticamente.
Você não precisa digitar uma fórmula Excel complicada na célula J4 para calcular o coeficiente de correlação. Por quê? Como o Excel e as estatísticas matemáticas se juntam para uma surpresa de swell: Tudo o que você precisa fazer é digitar
= CORREL (E2: E21, F2: F21)
em J4. Isso é tudo aí. Usando
CORREL
nas fileiras dá a mesma resposta que a fórmula acima. (Portanto, não é realmente necessário calcular as diferenças inter pares na coluna G.)
Calcular
N é o número de pares e o teste tem N-2 graus da liberdade.
Você pode definir
Number_of_pairs
como o nome do valor na célula I2. Então digite
= J4 * SQRT (Number_of_Pairs-2) / SQRT (1-J4 ^ 2)
em J6 e
= T. DIST. 2T (J6, Number_of_Pairs-2)
para J7. Você pode usar a função de distribuição de duas colas t se você não conhece a direção da correlação com antecedência. E, mais uma vez, o baixo valor p indica que você rejeita a hipótese nula.