La regresión lineal es un modelo matemático para estimar el efecto de una variable sobre otra, donde una variable se considera como independiente y otra como dependiente. Está asociado con el coeficiente de correlación o coeficiente r de Pearson. La regresión lineal se determina con base en el diagrama de dispersión, el cual permite visualizar gráficamente una correlación.
Como resultado del análisis de regresión lineal, se puede determinar si existe una correlación positiva o negativa muy fuerte entre las variables analizadas o si, por el contrario, ésta es muy débil o inexistente.
La Regresión Lineal, también llamada Regresión Simple, tiene por objetivo crear una nueva variable , la cual se obtiene a través de la ecuación de regresión Y´= A+BX, la cual es una fórmula de predicción, dicha ecuación corresponde a una recta, es por ello que los coeficientes "A" y "B" tienen los significados usuales correspondientes a la ecuación de cualquier recta. Esto es: "A"es la constante dede intersección con el eje de las ordenadas y "B" es la pendiente de la recta, el cual es identificado en la regresión simple como r , y representa la correlación entre las variables X e Y, en este caso es llamado valor beta o peso.
Estos coeficientes "A" y "B" se obtienen a través de las fórmulas que se presentan en el recuadro siguiente:
Para ejemplificar lo expuesto anteriormente, en el cuadro que se presenta a continuación, se expone una gráfica que corresponde a la estimación obtenida a partir de 20 pares de observaciones: X representa la temperatura fijada en un recinto cerrado e Y el ritmo cardíaco de un vertebrado, obsérvese la distribución de los puntos y la recta de regresión cuya ecuación es Y´ = 2,52 + 2,91 X, las variables son: variable independiente X, la cual representa la temperatura en un recinto cerrado y la variable dependiente Y que identifica al ritmo cardiaco medido en pulsos por minuto.
Los puntos están distribuidos desde la parte inferior izquierda hacia la parte superior derecha, lo cual indica que hay una correlación positiva entre las variables, pero ¿qué significa esa correlación positiva entre las variables? Significa que el ritmo cardiaco aumenta a razón de 0,91 a medida que la temperatura aumenta en 1 unidad. Esto se explica debido al modelo matemático que se está usando, es el de una recta creciente cuya pendiente es positiva.
El modelo sirve para predecir, por ejemplo, si se conoce la temperatura se puede predecir el ritmo cardíaco o viceversa, si se conoce el ritmo cardíaco se puede estimar la temperatura. Por ejemplo para una temperatura de 30, el ritmo cardíaco que se quiere predecir viene dado por
Y´ = 2,52 + 0,91. 30= 2,52 + 87,3= 29,82
Recta de Regresión Lineal correspondiente estimación obtenida a partir de 20 pares de observaciones.
Fuente.
Kerlinger, Fred N. y Lee, Howard B. (2002). Investigación del Comportamiento. Métodos de Investigación en Ciencias Sociales. Cuarta Edición. Mc Graw Hill. México D.F.