Significado de la correlación

      Comentarios desactivados en Significado de la correlación

Correlación significa una semejanza o relación entre dos cosas, personas o ideas. Es una similitud o equivalencia que existe entre dos hipótesis, situaciones u objetos diferentes.

En el campo de la estadística y las matemáticas la correlación se refiere a una medida entre dos o más variables que están relacionadas.

El término correlación es un sustantivo femenino que proviene del latín correlatiōne.

La palabra correlación puede ser sustituida por sinónimos como: relación, ecualización, nexo, correspondencia, analogía y conexión.

Coeficiente de Correlación

En estadística, el coeficiente de correlación de Pearson (r), también llamado coeficiente de correlación de producto, mide la relación que existe entre dos variables dentro de la misma escala métrica.

La función del coeficiente de correlación es determinar la intensidad de la relación que existe entre los conjuntos de datos o información conocidos.

El valor del coeficiente de correlación puede variar entre -1 y 1 y el resultado obtenido define si la correlación es negativa o positiva.

Para interpretar el coeficiente es necesario saber que 1 significa que la correlación entre las variables es perfectamente positiva y -1 significa que es perfectamente negativa. Si el coeficiente es igual a 0 significa que las variables no dependen unas de otras.

En las estadísticas también está el coeficiente de correlación Spearman, que lleva el nombre del estadístico Charles Spearman. La función de este coeficiente es medir la intensidad de la relación entre dos variables, ya sean lineales o no.

La correlación de Spearman sirve para evaluar si la intensidad de la relación entre las dos variables analizadas puede medirse mediante una función monótona (una función matemática que conserva o invierte la relación de orden inicial).

Cálculo del coeficiente de correlación de Pearson

Método 1) Cálculo del coeficiente de correlación de Pearson utilizando la covarianza y la desviación estándar.

Correlação - Coeficiente de Pearson

Donde

SXY es covarianza;

Sx y Sy representan la desviación estándar de las variables x e y, respectivamente.

En este caso, el cálculo encuentra primero la covarianza entre las variables, y la desviación estándar de cada una de ellas. Luego, la covarianza se divide multiplicando las desviaciones estándar.

A menudo, la declaración ya proporciona o bien las desviaciones estándar de las variables, o bien la covarianza entre ellas, simplemente aplicando la fórmula.

Método 2) Cálculo del coeficiente de correlación de Pearson con los datos brutos (sin covarianza ni desviación estándar).

Con este método, la fórmula más directa es la siguiente:

Correlação - Coeficiente de Pearson 2

Por ejemplo, suponiendo que tenemos datos con n=6 observaciones de dos variables: nivel de glucosa(y) y edad (x), el cálculo sigue estos pasos:

Paso 1) Construya la tabla con los datos existentes: i, x, y, y añada columnas en blanco para xy, x² y y²:

tabela - correlação

Paso 2: Multiplica x y y para rellenar la columna “xy”. Por ejemplo, en la línea 1 tendremos: x1y1 = 43 × 99 = 4257.

tabela - correlação 2

Paso 3: Cuadrar los valores en la columna x, y registrar los resultados en la columna x². Por ejemplo, en la primera fila tendremos x12 = 43 × 43 = 1849.

tabela - correlação 3

Paso 4: Haga lo mismo que en el paso 3, ahora usando la columna y y registre el cuadrado de sus valores en la columna y². Por ejemplo, en la primera fila tendremos: y12 = 99 × 99 = 9801.

tabela - correlação 4

Paso 5: Obtener la suma de todos los números de los hablantes y colocar el resultado en la parte inferior del hablante. Por ejemplo, la suma de la columna Edad X es igual a 43+21+25+42+57+59 = 247.

tabela - correlação 5

Paso 6: Usar la fórmula anterior para obtener el coeficiente de correlación:

equação - correlação - etapa 6

Así que lo hacemos:

equação - correlação - etapa 7

Cálculo del coeficiente de correlación de Spearman

El cálculo del coeficiente de correlación de Spearman es un poco diferente. Para ello, necesitamos organizar nuestros datos en la siguiente tabla:

Tabela 1 - Correlação

(1) Habiendo enumerado 2 pares de datos, debemos introducirlos en la tabla. Por ejemplo:

Tabela 2 - Correlação

2. En la columna “Clasificación A” clasificaremos las observaciones que están en el “Datos A” de forma creciente, siendo “1” el valor más bajo de la columna, y n (número total de observaciones) el valor más alto de la columna “Datos A”. En nuestro ejemplo lo es:

Tabela 3 - Correlação

3. Hacemos lo mismo para obtener la columna “Ranking B”, usando ahora los comentarios de la columna “Datos B”:

Tabela 4 - Correlação

4. En la columna “d” ponemos la diferencia entre los dos rangos (A – B). Aquí el signo no importa.

Tabela 5 - Correlação

5. Cuadrar cada uno de los valores de la columna “d” y registrar en la columna d²:

Tabela 6 - Correlação

6. Sume todos los datos de la columna “d²”. Este valor es Σd². En nuestro ejemplo Σd² = 0+1+0+1 = 2

7. Ahora usamos la fórmula de Spearman:

Fórmula de Spearman

En nuestro caso, n es igual a 4, porque miramos la cantidad de filas de datos (que corresponde al número de observaciones).

8. Finalmente, reemplazamos los datos de la fórmula anterior:

Resultado - correlação

Regresión lineal

La regresión lineal es una fórmula que se utiliza para estimar el posible valor de una variable (y) cuando se conocen los valores de otras variables (x). El valor de “x” es la variable independiente o explicativa, y “y” es la variable dependiente o de respuesta.

La regresión lineal se utiliza para comprobar cómo el valor de “y” puede variar dependiendo de la variable “x”. La línea que contiene los valores de la comprobación de la variación se llama línea de regresión lineal.

Si la variable explicativa “x” tiene un valor único, la regresión se llama regresión lineal simple.

Modelo de Regressão Linear Simples