Modelo de regresion lineal simple
Regresión lineal excel
La regresión lineal se utiliza para modelar la relación entre dos variables y estimar el valor de una respuesta utilizando una línea de mejor ajuste. Esta calculadora está diseñada para la regresión lineal simple, en la que sólo se utiliza una variable de predicción (X) y una respuesta (Y). Utilizar nuestra calculadora es tan sencillo como copiar y pegar los valores correspondientes de X e Y en la tabla (no olvide añadir etiquetas para los nombres de las variables). Debajo de la calculadora incluimos recursos para aprender más sobre los supuestos y la interpretación de la regresión lineal.
La regresión lineal es una de las técnicas de modelización más populares porque, además de explicar la relación entre las variables (como la correlación), también proporciona una ecuación que puede utilizarse para predecir el valor de una variable de respuesta en función de un valor de la variable de predicción.
La fórmula de la regresión lineal simple es Y = mX + b, donde Y es la variable de respuesta (dependiente), X es la variable de predicción (independiente), m es la pendiente estimada y b es la intercepción estimada.
Fórmula de regresión lineal simple
La regresión lineal simple se utiliza para modelar la relación entre dos variables continuas. A menudo, el objetivo es predecir el valor de una variable de salida (o respuesta) en función del valor de una variable de entrada (o predictor).
A menudo nos interesa comprender la relación entre varias variables. Los gráficos de dispersión y las matrices de dispersión pueden utilizarse para explorar las posibles relaciones entre pares de variables. La correlación proporciona una medida de la asociación lineal entre pares de variables, pero no nos habla de relaciones más complejas. Por ejemplo, si la relación es curvilínea, la correlación podría ser casi nula.
Se puede utilizar la regresión para desarrollar una comprensión más formal de las relaciones entre las variables. En la regresión, y en el modelado estadístico en general, queremos modelar la relación entre una variable de salida, o una respuesta, y una o más variables de entrada, o factores.
Dependiendo del contexto, las variables de salida también pueden denominarse variables dependientes, resultados o simplemente variables Y, y las variables de entrada pueden denominarse variables explicativas, efectos, predictores o variables X.
Tipos de regresión lineal
Los modelos de regresión lineal se utilizan para mostrar o predecir la relación entre dos variables o factores. El factor que se predice (el factor que resuelve la ecuación) se llama variable dependiente. Los factores que se utilizan para predecir el valor de la variable dependiente se denominan variables independientes.
En la regresión lineal, cada observación consta de dos valores. Un valor corresponde a la variable dependiente y otro a la variable independiente. En este modelo sencillo, una línea recta aproxima la relación entre la variable dependiente y la variable independiente.
El modelo de regresión lineal contiene un término de error que se representa por ε. El término de error se utiliza para dar cuenta de la variabilidad de y que no puede explicarse por la relación lineal entre x e y. Si ε no estuviera presente, eso significaría que conocer x proporcionaría suficiente información para determinar el valor de y.
En la práctica, sin embargo, los valores de los parámetros generalmente no se conocen, por lo que deben estimarse utilizando datos de una muestra de la población. Los parámetros de la población se estiman utilizando los estadísticos de la muestra. Los estadísticos muestrales están representados por β0 y β1. Cuando los estadísticos de la muestra se sustituyen por los parámetros de la población, se forma la ecuación de regresión estimada.
Regresión lineal simple spss
Consideremos un ejemplo sencillo de cómo la velocidad de un coche afecta a su distancia de frenado, es decir, la distancia que recorre antes de detenerse. Para examinar esta relación, utilizaremos el conjunto de datos de coches, que es un conjunto de datos de R por defecto. Por lo tanto, no necesitamos cargar primero un paquete; está disponible inmediatamente.
Leyendo la documentación nos enteramos de que se trata de datos recogidos durante la década de 1920 sobre la velocidad de los coches y la distancia resultante que tarda el coche en detenerse. La tarea interesante aquí es determinar la distancia que recorre un coche antes de detenerse, cuando viaja a una determinada velocidad. Para ello, primero representaremos la distancia de parada frente a la velocidad.
Usamos \(i\) como índice, simplemente para la notación. Usamos \(x_i\) como variable predictora (explicativa). La variable predictora se utiliza para ayudar a predecir o explicar la variable de respuesta (objetivo, resultado), \(y_i\).
Otros textos pueden utilizar el término variable independiente en lugar de predictor y variable dependiente en lugar de respuesta. Sin embargo, esos apelativos implican características matemáticas que pueden no ser ciertas. Aunque estos otros términos no son incorrectos, la independencia ya es un concepto estrictamente definido en probabilidad. Por ejemplo, al intentar predecir el peso de una persona dada su altura, ¿sería exacto decir que la altura es independiente del peso? Ciertamente no, pero esa es una implicación no intencionada de decir "variable independiente". Preferimos evitar esta nomenclatura.