CIE EXORDIO CERO MAYA LIBRO LIBRE HUATAPERA PROFESOR ESCRITOR
                          












 



 


     

 

 

 

 

 










.

Regresión lineal

 

Retomando el caso de los modelos probabilisticos, una vez que se determina  si existe dependencia para un conjunto de datos, podemos determinar la ecuación de la recta. Consideremos que  para un conjunto de puntos pueden pasar una gran cantidad de puntos, de acuerdo al argumento del primer postulado de Euclides,   por dos puntos pase una línea recta y solo una línea recta,  pero además la situación se vuelve aun mas compleja si consideramos que la líneas rectas a considerar podrían inclusive no tocar ningún punto de toda la información.

 

Finalmente el problema se traduce a encontrar la mejor línea recta del conjunto de posibles líneas rectas que describen el proceso. El método que nos permite obtener la mejor ecuación de un conjunto de posibles ecuaciones se conoce como método de mínimos cuadrados.

 

Suponiendo que un fenómeno sea probabilístico y la ecuación que describe el proceso de ser lineal tendría que ser expresada por la ecuación

 

donde  son la pendiente, la ordenada al origen y una variable aleatoria, respectivamente.

La variable  se considera que puede ser error generado de no considerar las relaciones entre las diferentes variables que intervienen en un proceso.

 

Además, podemos ver que el resultado describe la expresión de una línea recta mas una constante. Este hecho aparece como algo natural, si consideramos que en el tratamiento de datos reales, generalmente, el modelo esperado no empara con el resultado obtenido, las diferencias entre el modelo y la realidad pueden estribar en diversos errores, los cuales van desde el tratamiento mismo de los datos al momento de obtenerlos o al diseño del mismo modelo. Podemos restringir el resultado de tal forma que la esperanza se igual a , por lo que la media de la variable aleatoria es igual a cero, podemos ver además que . Es último punto es muy importante en el método que se aborda a continuación. Se supone que el valor real de un experimento es el valor real obtenido mediante la medición, sin embargo existe otro valor, que como se mencionó, esta asociado con los errores o la realidad. Mientras tanto el resultado difiera de la realidad siempre habrá que comparar el resultado y con el valor esperado E(x) al que en ocasiones se le designa una letra .

 

La linealidad de la que hablaremos es con respecto a las variables , considerando que x es una constante para el modelo. En ocasiones se confunde el concepto de linealidad, generalmente la linealidad en este tipo de modelos se considera con respecto a las variables . Por ejemplo, consideremos las siguientes ecuaciones

 

 

la primera de las ecuaciones representa un polinomio en x de grado n, sin embargo, con respecto a la variable   la ecuación es lineal. Para el caso de la segunda ecuación se observa que es cuadrática para las  y con respecto la variable x. Para el caso de la última expresión se observa una linealidad con respecto a x, no así para  .

Como podemos observar, la linealidad se define con respecto alguna variable y el resto de literales en el proceso se mantienen constantes. De esta forma, se dice que un modelo constituye un modelo de regresión lineal simple, si únicamente  es lineal con respecto algún tipo de literal, para la ecuación

el modelo E(y) es una función lineal de los parámetros .

 

Se define además la existencia de un modelo de regresión múltiple si el modelo puede expresar a  E(y)  como una función  de varias variables de interés  y lineal en , es decir, E(y) se puede expresar de la forma,

 además se considera que las variables son constantes conocidas, sin error en un experimento, para las variables . En términos generales podemos construir la siguiente definición:

 

Definición. El modelo estadístico lineal relaciona una variable aleatoria  con una respuesta y a un conjunto de variables independientes  toma la forma

en donde  son parámetros desconocidos que generan la linealidad y  es una variable, lo que para la relación lineal de las   se considera   variables conocidas. Donde la media para la variable aleatoria es cero, quedando expresada la esperanza como:

 

consideremos a continuación el proceso que se desarrolla mediante el método de mínimos cuadrados en la obtención de la ecuación de la mejor línea recta.

 

 

Obtención de la recta de regresión

Ecuaciones de regresión

Ejemplo

Correlación