Cuestionario

Fecha de Publicación

10 de octubre de 2022

Clases prácticas

El objetivo de las clases prácticas es afianzar los contenidos vistos en la clase de Teoría.
Repasaremos la teoría, pero trabajaremos generalmente con casos y ejercicios con datos.
Por ello, necesitamos usar un programa informático: Gretl.
Aunque no siempre es del todo posible, he agrupado los ejercicios por temas de la Guía Docente.
Hay un tema adicional, el Tema 0 cuyo objetivo es empezar a usar Gretl y recordar algunos conceptos e instrumentos básicos de Estadística.
Muchos de los ejercicios utilizan datos. Puedes descargarte los datos aquí

Tema 0: Gretl y repaso de estadística

¿Qué es Gretl?

En el curso usaremos Gretl. Gretl es un paquete de software para análisis econométrico. Con Gretl se pueden hacer análisis estadísticos y estimar una amplia gama de modelos econométricos.
Gretl es software libre. La página web de Gretl está aquí.
Lo usaremos a través de menús, pero incluye un potente lenguaje de programación: Hansl.

¿Cómo me instalo Gretl?

Gretl es un programa libre y gratuito. Puedes descargarlo aquí.

¿Cómo aprendo a usar Gretl?

Usaremos Gretl a través de menús, por lo que en 2-3 clases os manejaréis bastante bien con Gretl.
Si quieres aprender a usar Gretl en profundidad, entonces sí necesitas un manual.

Manuales de Gretl

El propio Gretl tiene manuales de Gretl, concretamente en la pestaña Ayuda encontrarás varias guías. Los más interesantes son: Guía del usuario, Guía de instrucciones y Hansl primer.
El manual más reciente que conozco está aquí. Son 386 paginas.
Puedes encontrar fácilmente manuales en castellano buscando en internet. Por ejemplo, aquí, aquí o aquí tienes algunos.

Ejercicio 1

Objetivo

Empezar a usar Gretl mientras recordamos algunos instrumentos y conceptos estadísticos básicos.

Datos (los datos siempre están en aula virtual)

Están en el fichero t0_ej_01_interest-rate.gdt
Datos referentes a 2 tipos de interés (i_long e i_short) y un agregado monetario (M2)
Son datos antiguos, pero ilustran muy bien las ideas y conceptos que quiero recordar

Abre en Gretl el fichero de datos t0_ej_01_interest-rate.gdt

Pista

Localiza el fichero t0_ej_01_interest-rate.gdt en tu ordenador. Pincha 2 veces en él con el ratón y se abrirá en Gretl.

Visualiza los datos de las variables i_long e i_short. ¿Qué valores toman las variables en 1990?

Pista

Una vez hayas cargado los datos en Gretl, puedes seguir la siguiente ruta de menús: Datos > Mostrar Valores.

Haz un gráfico temporal de esas 2 variables.

Pista

Puedes seguir la siguiente ruta de menús: Ver > Gráficos > Gráfico de series temporales y se abrirá una interfaz con la que podrás seleccionar las variables a graficar.

Con la variable i_long, haz un histograma, también llamado gráfico de barras o gráfico de distribución de frecuencias. Interpreta el gráfico, ¿qué información proporciona? ¿Se distribuye i_long aproximadamente como una normal?

Pista

En Gretl, selecciona la variable i_long con el ratón. Con i_long seleccionado, pincha con el botón derecho del ratón. Se abrirá un menú contextual. Selecciona la opción Distribución de frecuencias

Estadísticos descriptivos para i_long. Interpreta.
Gráfico de dispersión entre i_long e i_short. Interpreta. ¿Están relacionadas las 2 variables?
Gráfico de dispersión entre i_long y M2. Interpreta.
Matriz de correlaciones entrei_long, i_short y M2. Interpreta.

Ejercicio 2

Objetivo

Recordar, de forma intuitiva, qué es una función de densidad. Nos vendrá bien cuando hagamos contrastes de hipótesis.

Supongamos que la altura de la población española se distribuye como una Normal con media 180 centímetros y desviación típica 10 centímetros.
- Dibuje la distribución de la variable.
- ¿Qué probabilidad hay de que al seleccionar a un español al azar mida más de 2 metros?
Vamos ahora a recordar algunas propiedades de la N(0,1)
- Dibuje a mano una N(0,1)
- Situe en el eje x los valores: +1,96, 0 y -1,96.
- ¿Qué probabilidad hay de que aparezca un valor mayor o gual que +1,96? ¿ Y mayor que 0? ¿Y de que sea mayor que -1,96?
- Haga lo mismo con los valores -1,64 y +1,64

Ejercicio 3

Objetivo

Recordar, de forma intuitiva, una propiedad de los logaritmos (naturales o neperianos). Concretamente que “los cambios en logaritmos aproximan tasas de variación en las variables originales”.
Nos vendrá bien cuando usemos modelos con las variables en logaritmos. Será allá por el tema 5.

Abajo tienes una tabla con la evolución de los salarios de Juan y María. Rellena los huecos de la tabla para saber cuanto se han incrementado sus salarios y, sobre todo, ver cómo podríamos aproximar el crecimiento de una variable (en este caso el salario) si sólo tuviésemos información sobre el logaritmo de la variable.

Solución

Fíjate en 2 cosas:

Los cambios en logaritmos aproximan las tasas de variación de la variable original pero solo si los cambios no son grandes. Fíjate que los logaritmos lo hacen relativamente bien con el salario de Juan que presenta crecimientos moderados, pero no para el salario de María que presenta crecimientos elevados.
la tabla con las soluciones tiene 2 columnas adicionales que muestran como calcular tasas de variación exactas con datos en logaritmos. Generalmente nos bastará con aproximarlas con los incrementos de logaritmos.

Tema 1: Modelos Econométricos y datos económicos

Repaso de teoría (preguntas rápidas)

¿Qué es la Econometría? ¿Qué hace la Econometría?
La ecuación Y = A K^{\alpha} L^{\beta} ¿es lineal? ¿es un modelo econométrico?
¿Qué etapas requiere un estudio econométrico?
¿En qué se diferencian los datos de corte transversal de los de corte temporal?

Tema 2: Regresión lineal simple: geometría

Repaso de teoría (preguntas rápidas)

Escriba un MRLS y nombre sus componentes
¿Cómo se estiman los parámetros del modelo anterior?
¿Cómo se interpretan \beta_1 y \beta_2? ¿Y \hat{\beta_1} y \hat{\beta_2}?
Enuncie las 4 propiedades descriptivas
¿Qué es el R^{2}? Si R^{2} = 0.8 ¿cómo se interpreta?

Ejercicio 1 (estimación a mano)

Objetivo

Recordar y practicar el proceso de estimación por MCO y los elementos del modelo teórico y del modelo estimado (o recta de regresión). Para ello usaremos un conjunto de datos muy simple, con sólo 5 observaciones.

Vamos a estimar “a mano”, bueno, en realidad usaremos Gretl para calcular lo que nos haga falta. También podemos mirar aquí

Datos

En el fichero t2_ej_01_estimar-a-mano.gdt.
Datos simples con solo 5 observaciones para x e y

Los datos pueden verse en la tabla adjunta:

x	y
5	6
7	3
4	9
6	3
3	9

Plantee un modelo de regresión lineal simple donde y sea la variable dependiente y x la variable independiente.
Escriba las expresiones de los estimadores MCO
Obtenga las estimaciones MCO y especifique el modelo estimado

Resultados

\hat{y} = 15 - 1.8 x

Interprete el valor del parámetro asociado a la variable independiente o explicativa (\beta_2)
Interprete el valor del estimador de \beta_2 (!!)
Interprete el valor de la estimación de \beta_2
Calcule los valores ajustados o estimados (\hat{y}) de la variable dependiente o regresando (y)

Resultados

Calcule los residuos (\hat{u}) del modelo
Represente gráficamente las observaciones (diagrama de dispersión o nube de puntos x-y), la recta de regresión ajustada, señalando los valores ajustados y los residuos.

Resultados

Verifique el cumplimiento de las 4 propiedades descriptivas
Descomponga la varianza total de la variable dependiente en varianza explicada por la regresión y varianza residual
Calcule el coeficiente de determinación (R^{2}) por los métodos que conozca (hay 2 métodos de cálculo)
Interprete el valor del coeficiente de determinación
Finalmente, estima el modelo otra vez, pero ahora con Gretl. Los datos están en el fichero t2_ej_01_estimar-a-mano.gdt

Resultados

Ejercicio 2 (zoólogo)

Objetivo

Seguir practicando, ahora de manera menos mecánica, más abierta, la especificación, estimación e interpretación de un MRLS

Enunciado y datos

Un zoólogo piensa que existe una relación aproximadamente lineal entre los pesos y las longitudes de una especie de mamíferos. Para estudiar esta relación dispone de una muestra formada por veinte ejemplares de los que se dispone las siguientes variables: peso y longitud. la variable peso está expresada en kilogramos y la variable longitud en centímetros.
Los datos están en el fichero t2_ej_02_zoologo.gdt.

En la siguiente tabla puedes ver los datos de las 5 primeras observaciones:

EJEMPLAR	peso	longitud
1	2.1	44
2	2.7	49
3	2.5	51
4	1.4	43
5	1.9	39

Plantee un MRLS que relacione el peso y la longitud de los animales
Estime con ordenador el modelo anterior

Resultados de estimación

Interprete el estimador de la pendiente
Interprete la estimación de \beta_2
Interprete el valor del coeficiente de determinación (R^2)
¿Qué peso tendrá un animal de 45 centímetros?
¿Qué peso tendrá un animal de 300 centímetros?
Si un animal es tres centímetros más largo que otro, ¿qué diferencia de peso cabe esperar?
Si un animal es dos centímetros menos largo que otro, ¿qué diferencia de peso cabe esperar?
Interprete el término independiente (\beta_1) y su estimación
Si el peso se expresase en gramos y la longitud en centímetros, ¿qué estimación se obtendría?
Si el peso se expresase en kilogramos pero la longitud en metros, ¿qué estimación se obtendría?

Ejercicio 3 (val_acc-val_con)

Objetivo

Seguir practicando la especificación, estimación e interpretación en un MRLS pero con un caso más realista, en el que aparecen tópicos, que no podemos analizar en profundidad a estas alturas del curso, pero que aparecen más adelante en el curso, como observaciones anómalas, heterocedasticidad y logaritmos. Seguramente pediré este ejercicio para casa.

Datos

Los datos están en el fichero t2_ej_03_valac-valcon.gdt.
Son datos antiguos pero dan mucho juego por la presencia de un valor anómalo.
Este fichero recoge observaciones de 161 empresas españolas sobre las siguientes variables:
- valor_acc = Valor total de las acciones de la empresa
- valor_contable = Valor contable de la empresa

Análisis previo de los datos:
1. ¿qué tipo de datos son?
2. Obtén estadísticos descriptivos de las 2 variables.
3. Representa las 2 variables en un gráfico de dispersión. ¿hay relación entre ellas?
4. ¿Detectas algún valor anómalo?
Plantea y estima por MCO un MRLS que relacione las 2 variables:

Pista

Para decidir que variable es el regresando (y) piensa si un aumento del valor de las acciones tiene (inmediatamente) alguna repercusión en el valor contable de la empresa
1. Escribe la ecuación de la recta o modelo estimado
2. Interpreta el coeficiente estimado para \beta_{2}
3. Interpreta el coeficiente estimado para \beta_{1}
4. Interpreta el valor de R^{2}
5. ¿Qué problema crees que puede originar en la estimación el valor anómalo?
Elimina el valor anómalo y vuelve a estimar el modelo.

Pista

Se trata de estimar el mismo modelo, pero eliminando una observación. La de la empresa Nicolás Corr. Para eliminar esa observación has de pinchar en gretl en una de los 2 variables y seleccionar Editar valores, para después localizar el dato de Nicolás Correa (es más o menos la observación nº 60) y borrar el valor de la variable. Antes de cerrar la ventana donde estás editando los datos has de darle al icono verde de OK para que se guarden los cambios. Sabrás que lo has hecho bien si cuando estimes el modelo por segunda vez, se utilizan 160 observaciones, una menos que antes.
1. Observa cómo cambia el coeficiente estimado.
2. Representa la variable endógena estimada y los residuos.
3. ¿Observas alguna relación entre los residuos y la variable explicativa? Sí, se aprecia que posiblemente haya “heterocedasticidad” (!!!!)
Vamos a estimar otra vez el mismo modelo (otra vez sin Nicolás Correa) pero con las las variables del modelo en logaritmos (!!!)

Pista

Se trata de estimar el mismo modelo, sin Nicolas Correa; es decir, con 160 observaciones, pero con las variables en logaritmos. Para crear las variables en logaritmos has de pinchar en Añadir > Logaritmos de las variables seleccionadas.
1. Estima el modelo en logaritmos (modelo doblemente logarítmico) sin Niscolas Correa, o sea, con 160 observaciones
2. Interpreta el coeficiente estimado para \beta_{2}
3. Visualiza la variable dependiente estimada y los residuos para sacar conclusiones. ¿Hay “heterocedastiocidad”?

Tema 3: Regresión lineal simple: estadística y contraste de hipótesis

Repaso de teoría (preguntas rápidas)

¿Cuales son las h.e.b? ¿Para qué se necesitan?
¿Cómo son los estimadores MCO si se cumplen las h.e.b? ¿Qué significa que los estimadores sean ELIO? ¿Propiedades probabilísticas? ¿De que depende la varianza de los estimadores?
¿Cómo se distribuyen los estimadores MCO? ¿Cómo se estima la desviación típica de los estimadores?
¿Qué es el ratio t? ¿Cómo se hace un contraste con el t-ratio? ¿Diferencias entre contrastes a una cola y a 2 colas? ¿Qué es el p-value?

Ejercicio 1 (contrastes con t-ratio)

Objetivo

Recordar y practicar los contrastes de hipótesis con el t-ratio en MRLS

Datos

Los datos están en el fichero t3_ej_01_contrastes.gdt.
El fichero tiene 3 variables: y, x y z

Estime el modelo y = \beta_1 + \beta_2 x , e interprete la estimación de \beta_2

Resultados de estimación

Obtenga, “a mano” \hat\sigma_{\hat{\beta_{2}}}^{2}, Gretl la llama Desv. típica. Para ello antes ha de obtener \hat\sigma^{2}, Gretl la llama D.T. de la regresión
Contraste la significatividad individual de x
Interprete el resultado del contraste anterior ¿qué significa, que implica el resultado?
Contraste, otra vez, la significatividad individual de x, pero ahora usando el p-value
Construya un intervalo de confianza (IC) al 95% para \beta_2
Un IC al 90% ¿será más amplio, o más estrecho? Calcúlelo

Ejercicio 1b

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez la variable será no significativa

Datos

Usaremos los mismos datos del ejercicio anterior. Están en el fichero t3_ej_01_contrastes.gdt.

Estime el modelo y = \beta_1 + \beta_2 z , e interprete la estimación de \beta_2

Resultados de estimación

Obtenga, “a mano” \hat\sigma_{\hat{\beta_{2}}}^{2}, Gretl la llama Desv. típica. Para ello antes ha de obtener \hat\sigma^{2}, Gretl la llama D.T. de la regresión
Contraste la significatividad individual de z
Interprete el resultado del contraste anterior ¿qué significa, que implica el resultado?
Contraste, otra vez, la significatividad individual de x, pero ahora usando el p-value
Construya un intervalo de confianza (IC) al 95% para \beta_2
Un IC al 90% ¿será más amplio, o más estrecho? Calcúlelo

Ejercicio 2 (más contrastes)

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez sabremos qué son las variables, por lo que podremos hablar de significatividad práctica o económica. También realizaremos contrastes para distintos niveles de significación (\alpha).

Datos

Usaremos los datos del fichero t3_ej_02_salario.gdt.
El fichero tiene 3 variables: salario, educacion, experiencia y antiguedad

Estime el modelo salario = \beta_1 + \beta_2 educacion

Resultados de estimación

Contraste la significatividad individual del regresor educacion al 5%
Contraste la significatividad individual del regresor educacion al 10% y al 1%
Interprete el resultado de los contrastes anterior ¿qué significa, que implican los resultados?
La educacion es una variable estadísticamente significativa, para cualquier nivel de significación, pero ¿es significativa en la práctica?
Repita los contrastes, pero ahora usando el p-value

Ejercicio 2b

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez el regresor no será significativo para todos los niveles de significación.

Datos

Usaremos los datos del fichero t3_ej_02_salario.gdt.
El fichero tiene 3 variables: salario, educacion y experiencia

Estime el modelo salario = \beta_1 + \beta_2 experiencia

Resultados de estimación

Contraste la significatividad individual del regresor experiencia al 5%
Contraste la significatividad individual del regresor experiencia al 10% y al 1%
Interprete el resultado de los contrastes anterior ¿qué significa, que implican los resultados?
La experiencia es una variable estadísticamente significativa, al menos al 5%, pero ¿es significativa en la práctica?
Repita los contrastes, pero ahora usando el p-value
Obtenga un IC para \beta_2 al 95%. Interprete
Obtenga un IC para \beta_2 al 99%. Interprete

Ejercicio 2c

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez el regresor no será significativo al 5%.

Datos

Usaremos los datos del fichero t3_ej_02_salario.gdt.
El fichero tiene 3 variables: salario, educacion y experiencia

Estime el modelo salario = \beta_1 + \beta_2 antiguedad

Resultados de estimación

Contraste la significatividad individual del regresor antiguedad al 5%
Contraste la significatividad individual del regresor antiguedad al 1% y al 10%
Interprete el resultado de los contrastes anterior ¿qué significa, que implican los resultados?
La antiguedad es una variable estadísticamente significativa, aunque solo al 10%, pero ¿es significativa en la práctica?
Repita los contrastes, pero ahora usando el p-value
Obtenga un IC para \beta_2 al 95%. Interprete
Obtenga un IC para \beta_2 al 90%. Interprete

Ejercicio 2d

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez los contrastes no serán contrastes de significatividad individual.

Datos

Usaremos los datos del fichero t3_ej_02_salario.gdt.
El fichero tiene 3 variables: salario, educacion y experiencia

Estime el modelo salario = \beta_1 + \beta_2 educacion

Resultados de estimación

Contraste si \beta_2 > 0.7 ¿Puede hacer este contraste con el p-value que ofrece Gretl?
Contraste si \beta_2 > 1 ¿Puede hacer este contraste con el p-value que ofrece Gretl?
Contraste si \beta_2 < 0 ¿Puede hacer este contraste con el p-value que ofrece Gretl?
Contraste si \beta_2 < 0.5 ¿Puede hacer este contraste con el p-value que ofrece Gretl?
Construya un IC para \beta_2 al 95%. Interprete y relacione con los resultados de los apartados anteriores
Construya un IC para \beta_2 al 99%. Interprete y relacione con los resultados de los apartados anteriores

Ejercicio 3 (Examen)

Objetivo

Ver alguna pregunta, en este caso más de tipo teórico, de examen. ¿Verdad que no es muy complicada? 🙂

(Examen de julio de 2007). Argumente la veracidad o falsedad de las siguientes afirmaciones:

En un modelo de regresión, los residuos son iguales a las perturbaciones aleatorias
En un modelo de regresión, el coeficiente de determinación ( R^{2} ) es igual al coeficiente de determinación corregido ( \overline{R^{2}} )

Tema 4: Generalización: regresión lineal múltiple

Repaso de teoría (preguntas rápidas)

¿En qué se diferencian el MRLS y el MRLM?
¿Cómo se interpretan las estimaciones de un MRLM?
Diferencie entre R^2 y \overline{R^2}
¿Qué es el estadístico F? ¿Para qué sirve?
¿Cómo podemos efectuar predicciones a partir de un modelo estimado?

Ejercicio 1 (Y-X2-X3)

Objetivo

Ver que en un MRLM la mecánica de los contrastes con el t-ratio es igual que en el MRLS; eso sí, en el modelo múltiple podemos plantear contrastes con H_0 compuestas, como por ejemplo, el contraste de significatividad global del modelo.
Hay que diferenciar claramente los contrastes de significatividad individual del contraste de significatividad global.
Para hacer contrastes con H_0 compuestas de más de una restricción, usaremos el estadístico F o compararemos los MG y MR.

Con los resultados mostrados en el siguiente cuadro:

Contraste detalladamente la significatividad conjunta del modelo
Contraste la significatividad de \beta_{2}
Contraste la significatividad de \beta_{3}
¿Es \beta_{2} igual a 4?
¿Es \beta_{3} = -2?
Estime la varianza de las perturbaciones

Ejercicio 2

Objetivo

Seguimos con contrastes, pero esta vez las H_0 no son tan mecánicas o directas.

Con 34 observaciones se ha estimado el siguiente modelo:

donde los valores entre paréntesis son las desviaciones típicas estimadas de los estimadores correspondientes (errores estándar).

Contraste la significatividad de la variable x_4
Contraste si x_4 es igual a 10 frente a la posibilidad de que sea mayor que 10
Contraste si x_4 es igual a 2 frente a la posibilidad de que sea menor que 2
Cuando x_3 aumenta una unidad, ¿la variable Y disminuye 4 unidades?

Ejercicio 3 (sqrt-bdrms)

Objetivo

Ver alguna pregunta de examen, en este caso más de tipo práctico. ¿Verdad que no es muy complicada? 🙂 (!!!)

(Examen de enero de 2007) Con una muestra formada por 88 viviendas de una determinada zona se ha obtenido la siguiente estimación: \hat{P} = 19,3 + 0,128 sqrft + 15,2 bdrms . Donde:

P: precio de la vivienda en miles de dólares USA
sqrft: superficie de la vivienda en pies cuadrados
bdrms: número de dormitorios de la vivienda

Si se mantiene fija la superficie total de la vivienda, ¿cuál será el aumento estimado del precio de una vivienda si se le dota de un dormitorio adicional?
¿Cuál será el aumento estimado del precio de una vivienda si se construye un dormitorio adicional aumentando también la superficie de la vivienda en 100 pies cuadrados?
Una vivienda de 2.500 pies cuadrados y 4 dormitorios se pone a la venta por 270.000 dólares. ¿Qué opina del precio?
Exprese el modelo estimado utilizando como unidad de medida de superficie el metro cuadrado (sqrmts) y expresando el precio en miles de euros (!!!)

NOTAS: 1 pie cuadrado equivale aproximadamente a 0.1 metros cuadrados. Utilice como tipo de cambio 1 euro = 1.28 dólares USA.

Ejercicio 4 (salario-educación)

Objetivo

Practicar, otra vez, interpretación de coeficientes y contrastes de hipótesis en el marco del MRLM. Seguramente este ejercicio lo pediré para casa.

Datos

Usaremos los datos del fichero t4_ej_04_educacion.gdt.
El fichero tiene 4 variables: salario, educacion, experiencia y antiguedad

Estime el modelo salario = \beta_1 + \beta_2 educación + u e interprete la estimación de \beta_2

Resultados de estimación

Ahora estime el modelo

salario = \beta_{1} + \beta_{2} educacion + \beta_{3} experiencia + \beta_{4} antiguedad + u e interprete la estimación de \beta_2

Resultados de estimación

Interprete la estimación de \beta_2 en el segundo modelo. ¿Por qué son diferentes las estimaciones? ¿Son diferentes los estimadores de \beta_2 en los 2 modelos? ¿Son diferentes los \beta_2 en los 2 modelos?
Realice y explique con palabras de forma detallada el contraste la significatividad individual de la variable educación en el segundo modelo.
La estimación puntual de \beta_{2} es 0,598 ¿es la estimación óptima? Explique.
¿Cómo ha calculado Gretl la “Desv. Típica” de \hat\beta_{2} ? Utiliza Gretl para calcularla tú mismo. (!!!!)
Realice y explique con palabras de forma detallada el contraste de significatividad individual de la variable experiencia.
Vuelve a efectuar el contraste de significatividad individual de la variable experiencia, pero ahora al 10%.
Utilice el “valor p” (también llamado p-value o nivel de significación crítico) para contrastar la significatividad individual de la variable antigüedad.
Contraste si el efecto de la educación es menor que 0,8
Contraste si el efecto de la educación es menor que 0,6
Construya un intervalo de confianza al 95% para el efecto de la educación
Contraste si el efecto de la antigüedad es mayor que cero
Contraste si el efecto de la antigüedad es mayor que 0,15
Construya un intervalo de confianza al 95% para el efecto de la experiencia. Interprete
Construya un intervalo de confianza al 90% para el efecto de la experiencia. Interprete
Contraste si el efecto de la educación es igual al efecto de la experiencia. (!!!!)

Pista

Este contraste no se puede hacer con el t-ratio tal y como lo hemos explicado en clase. Hay que usar el estadístico F (que tampoco lo hemos enseñado a hacer a mano) o comparando el MG y MR. Lo podéis hacer de dos maneras:

- comparando el MG y MR
- usando Gretl: en la ventana de estimación del segundo modelo, pincha en la pestaña `Contrastes`. Se abrirá una caja de texto donde tendrás que escribir la $H_0$. Seguramente no sabrás hacerlo, pero hay un cuadro para obtener ayuda.

Ejercicio 5 (MG-MR)

Objetivo

Empezar a realizar contrastes mediante la comparación del MG y del MR

Se plantea el siguiente modelo:

y = \beta_{1} + \beta_{2} x_{2} + \beta_{3} x_{3} + \beta_{4} x_{4}+ u

El modelo se estimó con 34 observaciones y se obtuvo una SCR de 57,29.

Se quiere contrastar la siguiente hipótesis: \beta_{2} = \beta_{3} + \beta_{4}. Obtenga el modelo restringido.
Tras estimar el modelo restringido anterior, su SCR fue de 69,11. Realice el contraste de la hipótesis al 5% y al 1%.
Escriba el modelo restringido necesario para poder estimar la siguiente hipótesis nula: H_{0} =\begin{cases} \beta_{2} = \beta_{3} + \beta_{4}\\ \beta_{3} = \beta_{4}\end{cases}
La SCR del modelo restringido que incorpora las dos restricciones del aparatado anterior fue de 74,35. Realice el contraste para un nivel de significación del 5% y del 1%.

Ejercicio 6

Objetivo

Seguir con contrastes comparando MG y MR. Esta vez en lugar de tener la H_0 tenemos el MR y hemos de recuperar la H_0. (!!!)

Considere el siguiente modelo de regresión lineal:

y_{i} = \beta_{1} + \beta_{2} x_{2i} + \beta_{3} x_{3i} + \beta_{4} x_{4i}+ u_{i}

A partir de una muestra de 26 observaciones se han obtenido por MCO los siguientes 2 modelos estimados:

donde las cifras entre paréntesis representan las desviaciones típicas de los estimadores. Se pide:

¿Qué restricciones lineales incorpora la estimación (2) respecto de la estimación (1)?
Contraste la hipótesis nula especificada en el apartado previo

Ejercicio 7 (sleep)

Objetivo

Con este ejercicio podemos hacer un repaso rápido a las distintas opciones que tenemos para hacer contrastes de hipótesis, además de una forma menos mecánica que en otros ejercicios y que hace evidente que para interpretar los resultados nunca hay que olvidarse de la escala en la que están medidas las variables.

Datos

Usaremos los datos del fichero t4_ej_07_sleep75.gdt.
Los datos provienen del libro Introductory Econometrics de J. M. Wooldridge.
Los datos incluyen, entre otras, las siguientes variables de una muestra de 706 persones adultas:
- SLEEP: Tiempo de sueño cada semana (en minutos)
- EDUC: Años de educación
- TOTWRK: Tiempo de trabajo cada semana (en minutos)
- AGE: Edad en años

Con estos datos estime el siguiente modelo: SLEEP_{i} = \beta_{1} + \beta_{2} TOTWORK_{i} + \beta_{3} EDUC_{i} + \beta_{4} AGE_{i}+ u_{i}

Resultados de estimación

¿Cuánto dormirá diariamente una persona de 20 años de edad, con 14 de educación y que trabaja 40 horas semanales?
Analice la significatividad de cada una de las variables
Analice la significatividad conjunta del Modelo 1
Al trabajar más, ¿se duerme menos?
¿Una hora adicional de trabajo implica quince minutos menos de sueño?
¿Una hora adicional de trabajo implica diez minutos menos de sueño?
¿Influyen la educación y la edad conjuntamente en el tiempo de sueño?

Pista

Para el apartado 7, seguramente te hará falta el siguiente cuadro:

Tema 5: Modelos no lineales y transformación de variables

Repaso de teoría (preguntas rápidas)

¿Qué ocurre si se cambia la escala de un regresor? ¿Y si se cambia la escala del regresando?
¿Por qué algunos modelos se estiman en logaritmos? ¿Cómo se interpretan los \beta en esos parámetros?
¿Qué es el AIC? ¿Para qué sirve? ¿Es similar a R^2? ¿a \overline{R^2}?

Ejercicio 1 (sleep)

Objetivo

Con este ejercicio, que utiliza datos ya conocidos, recordaremos cuales son los efectos de cambios de cambios de escala en regresores y regresando.

Datos

Usaremos los datos del fichero t5_ej_01_sleep75.gdt.
Los datos provienen del libro Introductory Econometrics de J. M. Wooldridge.
Los datos incluyen, entre otras, las siguientes variables de una muestra de 706 persones adultas:
- SLEEP: Tiempo de sueño cada semana (en minutos)
- EDUC: Años de educación
- TOTWRK: Tiempo de trabajo cada semana (en minutos)
- AGE: Edad en años

Con estos datos estime el siguiente modelo: SLEEP_{i} = \beta_{1} + \beta_{2} TOTWORK_{i} + \beta_{3} EDUC_{i} + \beta_{4} AGE_{i}+ u_{i}

Interprete la estimación de \beta_{2}
¿Cómo cambiará la estimación de \beta_{2} si el tiempo de trabajo pasase a medirse en horas por semana?
¿Cómo cambiará la estimación de \beta_{2} si el tiempo de trabajo pasase a medirse en días por semana?
¿Cómo cambiará la estimación de \beta_{2} si el tiempo de sueño pasase a medirse en horas por semana?
¿Cómo cambiará la estimación de \beta_{2} si las dos variables, tanto el tiempo de sueño como el tiempo de trabajo se midiesen en horas por semana?

Ejercicio 2 (logs)

Objetivo

Afianzar la interpretación de parámetros en modelos con variables en logaritmos

Datos

Usaremos los datos del fichero t5_ej_02_alim.gdt.
Los datos incluyen las siguientes variables (y sus logaritmos):
- ALIM: Gasto familiar en alimentos (en euros anuales)
- RDISP: Renta familiar disponible (en euros anuales)

El archivo t5_ej_02_alim.gdt contiene las siguientes variables:

Estima e interpreta la estimación de \beta_{2} en los siguientes modelos:

ALIM_{i} = \beta_{1} + \beta_{2}RDISP_{i}

Resultados de estimación

ln (ALIM_{i}) = \beta_{1} + \beta_{2}RDISP_{i}

Resultados de estimación

ln (ALIM_{i}) = \beta_{1} + \beta_{2} ln(RDISP_{i})

Resultados de estimación

ALIM_{i} = \beta_{1} + \beta_{2} ln(RDISP_{i})

Resultados de estimación

Ejercicio 3 (ex)

Objetivo

Ejercicio de examen sobre interpretación de coeficientes en modelos con variables en logaritmos.

(Examen de julio de 2008) Razona la veracidad o falsedad de las siguientes afirmaciones, en el siguiente modelo:

ln(y_{i} ) = \beta_{1} + \beta_{2} x_{2i} + \beta_{3} ln(x_{3i}) + u_{i}

Cuando la variable x_{2} aumenta una unidad, la variable y experimenta una tasa de variación porcentual igual a \beta_{2}
Cuando la variable x_{3} aumenta una unidad, la variable y aumenta \beta_{3} unidades

Ejercicio 4 (ex)

Objetivo

Otro ejercicio de examen sobre interpretación de coeficientes en modelos con variables en logaritmos.

(Examen de junio de 2012). Argumente la veracidad o falsedad de las siguientes afirmaciones utilizando los siguientes modelos de regresión estimados:

\widehat{ln(y_{i})} = 3 + 0,17 x_{2i} -1,4 ln(x_{3i})

\widehat{y_{i}} = 2 - 9,3 ln(x_{4i}) + 3,5 x_{5i}

Cuando la variable x_{2} aumenta en una unidad, la variable y experimenta una tasa de variación igual al 17%
Cuando x_{4} disminuye en un 9,3%, la variable y disminuye en una unidad

Ejercicio 5 (Cobb)

Objetivo

Además de seguir trabajando en la interpretación de coeficientes en modelos con variables en logaritmos, en este ejercicio se aprecia muy bien la diferencia entre modelo no-lineal en parámetros y modelo lineal en parámetros (aunque con regresores en logaritmos).

Dada la función de producción Cobb-Douglas Q = A L^{\alpha} K^{\beta} e^u, en la que Q designa la producción, L la ocupación y K el capital:

Linealice el modelo anterior
Interprete los parámetros \alpha y \beta

Ejercicio 6 (edad-mates)

Objetivo

El segundo modelo de este ejercicio incluye un término cuadrático. Esto nos sirve para comprender mejor la diferencia entre regresor y variable explicativa; además,volvemos a trabajar la idea de que un modelo puede ser lineal en parámetros aunque no sea “lineal en variables”.

Datos

Se desea analizar la relación existente entre la edad de los maestros y la calificación obtenida en el examen de matemáticas por sus estudiantes.

Usaremos los datos del fichero t5_ej_06_mates.gdt que contiene una muestra formada por 1.000 observaciones de las siguientes variables:

edad : Edad del maestro en años
nota: Puntuación obtenida por el estudiante en una prueba de matemáticas (escala de 0 a 10)
sq_edad : nota^2 (la puntuación al cuadrado, la nota al cuadrado)

Plantee y estime un modelo de regresión que relacione la edad del maestro con la puntuación en el examen de los estudiantes

Pista

Para el apartado 7, seguramente te hará falta el siguiente cuadro:

Interprete el estimador de la pendiente
Introduce en el modelo un nuevo regresor, concretamente la edad del maestro en forma cuadrática; es decir, la variable sq_edad. En este nuevo modelo interpreta la relación entre la edad de los maestros y la puntuación

Pista

Para el apartado 7, seguramente te hará falta el siguiente cuadro:

En el modelo del tercer apartado ¿Cómo se interpreta \beta_2?
¿Cuál sería la edad óptima de los maestros?
¿Qué notas cabe esperar en los alumnos de maestros de 30, 40, 50 y 60 años?
Comente los resultados del ejercicio (no se olvide de comparar los modelos 1 y 2 y decir que modelo le parece más razonable)

Tema 6: Análisis con información cualitativa

Repaso de teoría (preguntas rápidas)

¿Qué son las variable ficticias? ¿Para qué sirven?
¿Qué es la categoría de referencia? ¿Cómo se interpreta el \beta que acompaña a una dummy?
¿La interpretación del coeficiente difiere si la dummy es aditiva o es multiplicativa?
Si tenemos una característica con q grupos ¿Cuantas dummies podemos definir? ¿Cuál será la categoría de referencia?
¿Qué ocurre si queremos introducir en el modelo varias variables cualitativas? ¿Estas dummies pueden interactuar?

Ejercicio 1 (bebes)

Objetivo

Empezar a trabajar con modelos con dummies. Es un ejercicio muy pautado en el que se van introduciendo poco a poco más dummies.

Datos

Usaremos los datos del fichero t6_ej_01_bebes.gdt. Son datos relacionados con nacimientos de bebes.
Entre otras puedes encontrar las siguientes variables cuantitativas:
- peso: peso del bebe en gramos
- semanas: semanas de gestación del bebe
- edad: edad de la madre en años
Las variables cuantitativas también se incluyen en logaritmos
Además contiene variables ficticias para poder introducir en el modelo distintos aspectos cualitativos:
- el genero del bebe (con las variables dummy bebita y bebito)
- el nivel de estudios de la madre (con las dummies primarios, secundarios y superiores)
- si el parto se ralizó con cesarea (con las dummies cesarea y vaginal)

Con estos datos se analizará la influencia de distintas variables sobre el peso con el que finalmente nacen los bebes. Para ello estime e interprete los siguientes modelos:

Aditivas

peso = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + u

Resultados de estimación

log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + u

Resultados de estimación

peso = \beta_{1} + \beta_{2}semanas + \beta_{3}secundarios + \beta_{4}superiores + u

Resultados de estimación

log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}secundarios + \beta_{4}superiores + u

Resultados de estimación

peso = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + \beta_{3}cesarea + u

Resultados de estimación

Multiplicativas

peso = \beta_{1} + \beta_{2}semanas + \beta_{3}(semanas * bebito) + u

Resultados de estimación

log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}(semanas * bebito) + u

Resultados de estimación

log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}(log(semanas) * bebito) + u

Resultados de estimación

Aditivas y multiplicativas

peso = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + \beta_{4}(semanas * bebito) + u

Resultados de estimación

log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + \beta_{4}(semanas * bebito) + u

Resultados de estimación

log(peso) = \beta_{1} + \beta_{2}log(semanas) + \beta_{3}bebito + \beta_{4}(log(semanas) * bebito) + u

Resultados de estimación

Ejercicio 2 (trampa)

Objetivo

Trabajar en comprender la situación conocida como trampa de las ficticias.

Indique y explique detalladamente en cuales de los siguientes modelos se incurre en la trampa de las ficticias:

peso = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + \beta_{3}bebita + u
peso = \beta_{1} + \beta_{2}semanas + \beta_{3}(semanas * bebito) + \beta_{4} bebito + u
peso = \beta_{1} + \beta_{2}semanas + \beta_{3}(semanas * bebito) + \beta_{4} bebita + u
peso = \beta_{1} + \beta_{2}(semanas*primarios) + \beta_{3}secundarios + \beta_{4}superiores + u

Ejercicio 3 (salario)

Objetivo

Seguir trabajando con dummies, ahora con preguntas más abiertas.

Datos

Usaremos los datos del fichero t6_ej_03_salario.gdt. Tiene información de las siguientes variables:

SALARI: Salario del trabajador en euros brutos anuales.
EXPLAB: Experiencia laboral del trabajador en años.
GENERE: Variable ficticia que toma el valor 1 para los hombres y 0 para las mujeres

Estime el siguiente modelo SALARI_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} GENERE_{i} + u_{i}

Resultados de estimación

¿Cuál es el género de referencia?
Interprete los parámetros \beta_{2} y \beta_{3} , y sus estimaciones
¿Influye la experiencia laboral en el salario?
¿Cuánto puede esperarse que aumente el salario si aumenta su experiencia laboral en un año?
Considerando las estimaciones, ¿hay discriminación laboral por género?
Según el modelo estimado, ¿qué proporción de las variaciones salariales son explicadas por los factores género y experiencia?
Supón ahora que el valor 1 de la variable GENERE corresponde a las mujeres y el 0 a los hombres. ¿Cómo se interpretará ahora el parámetro que acompaña a esta variable?
Suponga que definimos las siguientes variables ficticias: HOME (con valor 1 para los hombres y 0 para las mujeres) y DONA (con valor 1 para las mujeres y 0 para los hombres). ¿Qué ocurrirá al estimar lo siguientes 3 modelos?

SALARI_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} GENERE_{i} + \beta_{4} HOME_{i} + u_{i}

SALARI_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} GENERE_{i} + \beta_{4} DONA_{i} + u_{i}

SALARI_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} HOME_{i} + \beta_{4} DONA_{i} + u_{i}

Estima ahora un modelo que permita analizar si la experiencia laboral se retribuye de igual manera para hombres y mujeres. Analice los resultados

Resultados de estimación

Por ejemplo, se podría estimar el siguiente modelo:

Ejercicio 4 (pescado)

Objetivo

Seguir trabajando con dummies, ahora con preguntas más abiertas.

Datos

Usaremos los datos del fichero t6_ej_04_pescado.gdt

Contiene datos referentes a gastos en diferentes categorías de alimento, entre otras las siguientes variables:

PESCADO: Gasto anual en pescado en miles de pesetas per cápita
RDISP: Renta anual disponible en miles de pesetas per cápita
ESTMED: Variable ficticia que toma el valor 1 si el máximo nivel de estudios obtenido por el sustentador principal ha sido el de estudios medios y 0 en caso contrario
ESTSUP: Variable ficticia que toma el valor 1 si el máximo nivel de estudios obtenido por el sustentador principal ha sido el de estudios superiores y 0 en caso contrario

Con estos datos se estimaron los siguientes modelos:

PESCADO_{i} = \beta{1} + \beta{2} \; RDISP_{i} + \beta{3} \; ESTMED_{i} + \beta{4} \; ESTSUP_{i} + ui_{i}

Resultados de estimación

¿Cuál es el nivel de estudios de referencia? Interprete las estimaciones de \beta_{3} y \beta_{4}
Contraste si el gasto en pescado es igual para las familias con con estudios básicos y con estudios superiores
Contraste si el gasto en pescado es igual con estudios medios y con estudios superiores

Resultados

Indique las consecuencias de introducir una nueva variable ficticia que tome el valor 1 si el máximo nivel de estudios obtenido por el sustentador principal ha sido el de estudios básicos y 0 en caso contrario

Ejercicio 5 (ex)

Objetivo

Ver un ejemplo de pregunta de examen con dummies.

(Examen febrero 2006) Con una muestra formada por 25 trabajadores se han obtenido las siguientes estimaciones:

donde:

SALARI: Salario bruto anual del trabajador en miles de euros
EXPELAB: Experiencia laboral del trabajador en años
GÈNERE: Variable ficticia que toma el valor 1 si el trabajador es un hombre y 0 en caso contrario
ALEMANY: Variable ficticia que toma el valor 1 si el trabajador sabe alemán y 0 en caso contrario
FRANCÈS: Variable ficticia que toma el valor 1 si el trabajador sabe francés y 0 en caso contrario

y los valores entre paréntesis son los errores estándar.

¿Influye la experiencia laboral en el salario? (Tome como referencia el Modelo A)
¿Influye el conocimiento de los dos idiomas extranjeros en el salario de un trabajador?
¿Qué diferencia salarial cabe esperar entre un hombre sin conocimientos de francés y una mujer con conocimientos de francés?
Plantee un modelo de regresión que permita analizar si la diferencia salarial entre hombres y mujeres aumenta con la experiencia laboral e indique cómo realizaría el contraste pertinente. (Tome como referencia el Modelo B)

Ejercicio 6 (estacionalidad)

Objetivo

Ejercicio que muestra que las dummies sirven para incorporar en nuestros modelos una amplia cantidad de fenómenos, como por ejemplo la estacionalidad. Además, como los resultados de estimación no se han efectuado con Gretl si no con otro programa, Eviews, sirve para ver que somos capaces de leer resultados de cualquier software econométrico.

Con datos trimestrales comprendidos entre el primer trimestre de 1981 y el cuarto trimestre de 2008 se ha obtenido la siguiente estimación:

donde CONSUM es el consumo en miles de euros, RENDA es la renta en miles de euros, y T2, T3 y T4 son variables ficticias que toman el valor 1 en el segundo, tercer y cuarto trimestre, respectivamente, y 0 en los respectivos casos contrarios.

¿Difiere el consumo en el primer y segundo trimestre?
¿Es el consumo menor en el segundo trimestre que en el primero?
¿Qué contraste plantearía para analizar si existe estacionalidad o diferencias entre los trimestres?
Se introduce una nueva ficticia, T1, que toma el valor 1 en el primer trimestre y 0 en los otros trimestres. ¿Qué ocurrirá?

Ejercicio 7

Objetivo

Ejercicio muy abierto con dummies (3 categorías)

Datos

Usaremos los datos del fichero t6_ej_03_ocio.gdt

Contiene información de las siguientes variables:

OCI: Gasto en ocio en euros anuales
RENDA: Renta disponible en euros anuales
PRIM: Variable ficticia que toma el valor 1 si el máximo nivel de estudios conseguidos es el nivel primario y 0 en caso contrario
SEC: Variable ficticia que toma el valor 1 si el máximo nivel de estudios conseguidos es el nivel secundario y 0 en caso contrario
UNI: Variable ficticia que toma el valor 1 si el máximo nivel de estudios conseguidos son estudios universitarios y 0 en caso contrario

Plantee un modelo teórico sin interacciones entre variables explicativas que permita explicar el gasto en ocio a partir de la renta disponible y el nivel de estudios. ¿Cuál es el nivel de estudios de referencia?
Interprete los parámetros del modelo anterior
Estime el modelo planteado

Resultados de estimación

Considerando el modelo estimado en el apartado 3, ¿existen diferencias significativas en el gasto en ocio entre las personas con estudios secundarios y las personas con estudios primarios?
Considerando el modelo estimado en el apartado 3, ¿existen diferencias significativas en el gasto en ocio entre las personas con estudios universitarios y las personas con estudios primarios?
Considerando el modelo estimado en el apartado 3, ¿existen diferencias significativas en el gasto en ocio entre las personas con estudios secundarios y las personas con estudios universitarios?

Resultados

En el modelo del apartado 3 no lo podemos resolver directamente. tenemos 3 opciones:

Plantear el contraste directamente con el estadístico F

Reformular el modelo para que, por ejemplo, la categoría de referencia sean los estudios universitarios

Con MG y MR

En el modelo estimado en el apartado 3 ¿Hay diferencias en el gasto en ocio asociadas al nivel educativo?

Pistas

Se puede responder de 2 formas:

Usando el estadístico F

Comparando el MG (apartado 3) con el siguiente modelo (MR)

Especifique ahora un modelo que incluya interacciones entre la renta y el nivel de estudios
Interprete los parámetros del modelo anterior
Estime el modelo planteado

Resultados de estimación

Considerando el modelo estimado en el apartado 10, ¿existen diferencias significativas en el gasto en ocio entre las personas con estudios secundarios y las personas con estudios universitarios?

Pistas

Se puede responder de 2 formas:

Usando el estadístico F

Comparando el MG (apartado 3) con el siguiente modelo (MR)

Considerando el modelo estimado en el apartado 10, construya una tabla de doble entrada que muestre el gasto en ocio imputable a las personas con rentas iguales a 10.000, 20.000 y 30.000 euros y con diferentes niveles de estudios

Ejercicio 8

Objetivo

Mostrar otra pregunta de examen focalizada en las variables ficticias.

(Examen de enero de 2012). Para analizar las retribuciones salariales de determinados profesionales sanitarios, se plantea el siguiente modelo:

SAL_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} GENERE_{i} + \beta_{4} NACIO_{i} + \beta_{5} (GENERE_{i} \times NACIO_{i}) + u_{i}

SAL : Salario en euros anuales
EXPLAB: Experiencia laboral en años
GENERE: Variable ficticia que toma el valor 1 si el profesional es hombre y 0 en caso contrario
NACIO: Variable ficticia que toma el valor 1 si el profesional tiene nacionalidad española y 0 en caso contrario

¿Qué salario cabe esperar para cada una de las posibles combinaciones de género y nacionalidad?
Interprete el significado de \beta_{5}

Ejercicio 9 (absentismo)

Objetivo

Un caso completamente abierto. Se trata de ver si sois capaces de utilizar lo visto en clase para sacar información sobre un fenómeno a partir de un conjunto de datos

Datos

Usaremos los datos del fichero t6_ej_09_absentismo.gdt.
La descripción de las variables puedes encontrarla en el mismo fichero de datos

¿Qué variables pueden explicar el comportamiento del absentismo laboral en esa empresa?

Tema 7: Incumplimiento de las hipótesis básicas

Repaso de teoría (preguntas rápidas)

¿Qué significa que se incumpla alguna h.e.b? ¿Qué consecuencias tiene?
¿Qué es multicolinealidad? ¿Qué consecuencias tiene? ¿Cómo se detecta? ¿Soluciones?
¿Qué significa la h.e.b de Normalidad? ¿Qué consecuencias tiene? ¿Cómo se detecta? ¿Soluciones?
¿Qué significa la existencia de heterocedasticidad? ¿En que fenómenos suele ocurrir? ¿Qué consecuencias tiene? ¿Cómo se detecta su presencia? ¿Soluciones?
¿Qué significa la presencia de autocorrelación? ¿Cuando suele ocurrir? ¿Qué consecuencias tiene? ¿Cómo se detecta su presencia? ¿Soluciones?

Ejercicio 1 (bebes)

Objetivo

Recordar las principales ideas y contrastes del tema 7: normalidad, colinealidad, heterocedasticidad, …

Datos

Usaremos los datos del fichero t6_ej_01_bebes.gdt.

Son datos que ya hemos usado, concretamente en el ejercicio 1 del tema 6. Son datos relacionados con nacimientos de bebes.

Estime el siguiente modelo:

peso = \beta_{1} + \beta_{2}semanas + \beta_{3}edad + \beta_{4}bebito +u

Resultados de estimación

¿cree que el modelo tiene problemas serios de colinealidad entre los regresores? Explique

Resultados

Suponga que sí que hubiese un problema importante de colinealidad ¿cuales serían las consecuencias?
Contraste la normalidad de las perturbaciones. Explique el resultado y las consecuencias del contraste

Resultados

Efectúe el test RESET de Ramsey y explique los resultados (!!!!)
Efectúe el test de White para contrastar la homocedasticidad de las perturbaciones. Explique el contraste y las consecuencias del resultado obtenido

Resultados

Ejercicio 2 (ROA)

Objetivo

Otro ejercicio para recordar las principales ideas y contrastes del tema 7: normalidad, heterocedasticidad, …

Datos

Usaremos los datos del fichero t7_ej_02_ROA.gdt.

Se quiere conocer los determinantes de la rentabilidad sobre activos (ROA) de una muestra de 5.375 entidades financieras europeas. Para ello se ha estimado el siguiente modelo:

ROA = \beta_{1} + \beta_{2}E\_TA + \beta_{3}LACTIVO + \beta_{4}LACTIVO^2 +u

donde E\_TA es una medida de la solvencia de la entidad (Recursos propios / Activo total), LACTIVO mide el tamaño de la entidad (logaritmo del activo total), LACTIVO^2 es el cuadrado de esta variable.

Resultados de estimación

Contraste la normalidad de las perturbaciones

Resultados

¿Presenta heterocedasticidad el modelo estimado?

Resultados

La variable RESABS = |\hat{u}| ; es decir es igual a los residuos del modelo estimado en valor absoluto.

Vuelva a estimar el modelo pero con “errores típicos robustos a la heterocedasticidad”

Resultados

Señale las diferencias que hay en las 2 estimaciones del modelo

Resultados (modelo 1)