Cuestionario (Econometría, GADE)

Fecha de publicación

7 de julio de 2023


Clases prácticas
  • El objetivo de las clases prácticas es afianzar los contenidos vistos en la clase de Teoría.

  • Repasaremos la teoría, pero trabajaremos generalmente con casos y ejercicios con datos.

  • Por ello, necesitamos usar un programa informático: Gretl.

  • Aunque no siempre es del todo posible, he agrupado los ejercicios por temas de la Guía Docente.

  • Hay un tema adicional, el Tema 0 cuyo objetivo es empezar a usar Gretl y recordar algunos conceptos e instrumentos básicos de Estadística.

  • Muchos de los ejercicios utilizan datos. Puedes descargarte los datos aquí




Tema 0: Gretl y repaso de estadística

¿Qué es Gretl?

  • En el curso usaremos Gretl. Gretl es un paquete de software para análisis econométrico. Con Gretl se pueden hacer análisis estadísticos y estimar una amplia gama de modelos econométricos.

  • Gretl es software libre. La página web de Gretl está aquí.

  • Lo usaremos a través de menús, pero incluye un potente lenguaje de programación: Hansl.

¿Cómo me instalo Gretl?

  • Gretl es un programa libre y gratuito. Puedes descargarlo aquí.

¿Cómo aprendo a usar Gretl?

  • Usaremos Gretl a través de menús, por lo que en 2-3 clases os manejaréis bastante bien con Gretl.

  • Si quieres aprender a usar Gretl en profundidad, entonces sí necesitas un manual.

Manuales de Gretl

  • El propio Gretl tiene manuales de Gretl, concretamente en la pestaña Ayuda encontrarás varias guías. Los más interesantes son: Guía del usuario, Guía de instrucciones y Hansl primer.

  • El manual más reciente que conozco está aquí. Son 386 paginas.

  • Puedes encontrar fácilmente manuales en castellano buscando en internet. Por ejemplo, aquí, aquí o aquí tienes algunos.




Ejercicio 1

Objetivo

Empezar a usar Gretl mientras recordamos algunos instrumentos y conceptos estadísticos básicos.

Datos (los datos siempre están en aula virtual)
  • Están en el fichero t0_ej_01_interest-rate.gdt

  • Datos referentes a 2 tipos de interés (i_long e i_short) y un agregado monetario (M2)

  • Son datos antiguos, pero ilustran muy bien las ideas y conceptos que quiero recordar

  1. Abre en Gretl el fichero de datos t0_ej_01_interest-rate.gdt

Localiza el fichero t0_ej_01_interest-rate.gdt en tu ordenador. Pincha 2 veces en él con el ratón y se abrirá en Gretl.

  1. Visualiza los datos de las variables i_long e i_short. ¿Qué valores toman las variables en 1990?

Una vez hayas cargado los datos en Gretl, puedes seguir la siguiente ruta de menús: Datos > Mostrar Valores.

  1. Haz un gráfico temporal de esas 2 variables.

Puedes seguir la siguiente ruta de menús: Ver > Gráficos > Gráfico de series temporales y se abrirá una interfaz con la que podrás seleccionar las variables a graficar.

  1. Con la variable i_long, haz un histograma, también llamado gráfico de barras o gráfico de distribución de frecuencias. Interpreta el gráfico, ¿qué información proporciona? ¿Se distribuye i_long aproximadamente como una normal?

En Gretl, selecciona la variable i_long con el ratón. Con i_long seleccionado, pincha con el botón derecho del ratón. Se abrirá un menú contextual. Selecciona la opción Distribución de frecuencias

  1. Estadísticos descriptivos para i_long. Interpreta.

  2. Gráfico de dispersión entre i_long e i_short. Interpreta. ¿Están relacionadas las 2 variables?

  3. Gráfico de dispersión entre i_long y M2. Interpreta.

  4. Matriz de correlaciones entrei_long, i_short y M2. Interpreta.




Ejercicio 2

Objetivo

Recordar, de forma intuitiva, qué es una función de densidad. Nos vendrá bien cuando hagamos contrastes de hipótesis.

  1. Supongamos que la altura de la población española se distribuye como una Normal con media 180 centímetros y desviación típica 10 centímetros.

    • Dibuje la distribución de la variable.

    • ¿Qué probabilidad hay de que al seleccionar a un español al azar mida más de 2 metros?

  2. Vamos ahora a recordar algunas propiedades de la N(0,1)

    • Dibuje a mano una N(0,1)

    • Situe en el eje x los valores:   +1,96,   0   y   -1,96.

    • ¿Qué probabilidad hay de que aparezca un valor mayor o gual que +1,96? ¿ Y mayor que 0? ¿Y de que sea mayor que -1,96?

    • Haga lo mismo con los valores   -1,64   y   +1,64




Ejercicio 3

Objetivo
  • Recordar, de forma intuitiva, una propiedad de los logaritmos (naturales o neperianos). Concretamente que “los cambios en logaritmos aproximan tasas de variación en las variables originales”.

  • Nos vendrá bien cuando usemos modelos con las variables en logaritmos. Será allá por el tema 5.

Abajo tienes una tabla con la evolución de los salarios de Juan y María. Rellena los huecos de la tabla para saber cuanto se han incrementado sus salarios y, sobre todo, ver cómo podríamos aproximar el crecimiento de una variable (en este caso el salario) si sólo tuviésemos información sobre el logaritmo de la variable.

Fíjate en 2 cosas:

  • Los cambios en logaritmos aproximan las tasas de variación de la variable original pero solo si los cambios no son grandes. Fíjate que los logaritmos lo hacen relativamente bien con el salario de Juan que presenta crecimientos moderados, pero no para el salario de María que presenta crecimientos elevados.

  • la tabla con las soluciones tiene 2 columnas adicionales que muestran como calcular tasas de variación exactas con datos en logaritmos. Generalmente nos bastará con aproximarlas con los incrementos de logaritmos.




Tema 1: Modelos Econométricos y datos económicos

Repaso de teoría (preguntas rápidas)
  1. ¿Qué es la Econometría? ¿Qué hace la Econometría?
  2. La ecuación Y = A K^{\alpha} L^{\beta} ¿es lineal? ¿es un modelo econométrico?
  3. ¿Qué etapas requiere un estudio econométrico?
  4. ¿En qué se diferencian los datos de corte transversal de los de corte temporal?




Tema 2: Regresión lineal simple: geometría

Repaso de teoría (preguntas rápidas)
  1. Escriba un MRLS y nombre sus componentes
  2. ¿Cómo se estiman los parámetros del modelo anterior?
  3. ¿Cómo se interpretan \beta_1 y \beta_2? ¿Y \hat{\beta_1} y \hat{\beta_2}?
  4. Enuncie las 4 propiedades descriptivas
  5. ¿Qué es el R^{2}? Si R^{2} = 0.8 ¿cómo se interpreta?




Ejercicio 1 (estimación a mano)

Objetivo

Recordar y practicar el proceso de estimación por MCO y los elementos del modelo teórico y del modelo estimado (o recta de regresión). Para ello usaremos un conjunto de datos muy simple, con sólo 5 observaciones.

Vamos a estimar “a mano”, bueno, en realidad usaremos Gretl para calcular lo que nos haga falta. También podemos mirar aquí

Datos
  • En el fichero t2_ej_01_estimar-a-mano.gdt.

  • Datos simples con solo 5 observaciones para x e y

Los datos pueden verse en la tabla adjunta:

x y
5 6
7 3
4 9
6 3
3 9
  1. Plantee un modelo de regresión lineal simple donde y sea la variable dependiente y x la variable independiente.

  2. Escriba las expresiones de los estimadores MCO

  3. Obtenga las estimaciones MCO y especifique el modelo estimado

\hat{y} = 15 - 1.8 x

  1. Interprete el valor del parámetro asociado a la variable independiente o explicativa (\beta_2)

  2. Interprete el valor del estimador de \beta_2 (!!)

  3. Interprete el valor de la estimación de \beta_2

  4. Calcule los valores ajustados o estimados (\hat{y}) de la variable dependiente o regresando (y)

  1. Calcule los residuos (\hat{u}) del modelo

  2. Represente gráficamente las observaciones (diagrama de dispersión o nube de puntos x-y), la recta de regresión ajustada, señalando los valores ajustados y los residuos.

  1. Verifique el cumplimiento de las 4 propiedades descriptivas

  2. Descomponga la varianza total de la variable dependiente en varianza explicada por la regresión y varianza residual

  3. Calcule el coeficiente de determinación (R^{2}) por los métodos que conozca (hay 2 métodos de cálculo)

  4. Interprete el valor del coeficiente de determinación

  5. Finalmente, estima el modelo otra vez, pero ahora con Gretl. Los datos están en el fichero t2_ej_01_estimar-a-mano.gdt




Ejercicio 3 (val_acc-val_con)

Objetivo

Seguir practicando la especificación, estimación e interpretación en un MRLS pero con un caso más realista, en el que aparecen tópicos, que no podemos analizar en profundidad a estas alturas del curso, pero que aparecen más adelante en el curso, como observaciones anómalas, heterocedasticidad y logaritmos. Seguramente pediré este ejercicio para casa.

Datos
  • Los datos están en el fichero t2_ej_03_valac-valcon.gdt.

  • Son datos antiguos pero dan mucho juego por la presencia de un valor anómalo.

  • Este fichero recoge observaciones de 161 empresas españolas sobre las siguientes variables:

    • valor_acc = Valor total de las acciones de la empresa
    • valor_contable = Valor contable de la empresa
  1. Análisis previo de los datos:

    1. ¿qué tipo de datos son?
    2. Obtén estadísticos descriptivos de las 2 variables.
    3. Representa las 2 variables en un gráfico de dispersión. ¿hay relación entre ellas?
    4. ¿Detectas algún valor anómalo?
  2. Plantea y estima por MCO un MRLS que relacione las 2 variables:

    Para decidir que variable es el regresando (y) piensa si un aumento del valor de las acciones tiene (inmediatamente) alguna repercusión en el valor contable de la empresa

    1. Escribe la ecuación de la recta o modelo estimado
    2. Interpreta el coeficiente estimado para \beta_{2}
    3. Interpreta el coeficiente estimado para \beta_{1}
    4. Interpreta el valor de R^{2}
    5. ¿Qué problema crees que puede originar en la estimación el valor anómalo?
  3. Elimina el valor anómalo y vuelve a estimar el modelo.

    Se trata de estimar el mismo modelo, pero eliminando una observación. La de la empresa Nicolás Corr. Para eliminar esa observación has de pinchar en gretl en una de los 2 variables y seleccionar Editar valores, para después localizar el dato de Nicolás Correa (es más o menos la observación nº 60) y borrar el valor de la variable. Antes de cerrar la ventana donde estás editando los datos has de darle al icono verde de OK para que se guarden los cambios. Sabrás que lo has hecho bien si cuando estimes el modelo por segunda vez, se utilizan 160 observaciones, una menos que antes.

    1. Observa cómo cambia el coeficiente estimado.
    2. Representa la variable endógena estimada y los residuos.
    3. ¿Observas alguna relación entre los residuos y la variable explicativa? Sí, se aprecia que posiblemente haya “heterocedasticidad” (!!!!)
  4. Vamos a estimar otra vez el mismo modelo (otra vez sin Nicolás Correa) pero con las las variables del modelo en logaritmos (!!!)

    Se trata de estimar el mismo modelo, sin Nicolas Correa; es decir, con 160 observaciones, pero con las variables en logaritmos. Para crear las variables en logaritmos has de pinchar en Añadir > Logaritmos de las variables seleccionadas.

    1. Estima el modelo en logaritmos (modelo doblemente logarítmico) sin Niscolas Correa, o sea, con 160 observaciones
    2. Interpreta el coeficiente estimado para \beta_{2}
    3. Visualiza la variable dependiente estimada y los residuos para sacar conclusiones. ¿Hay “heterocedastiocidad”?




Tema 3: Regresión lineal simple: estadística y contraste de hipótesis

Repaso de teoría (preguntas rápidas)
  1. ¿Cuales son las h.e.b? ¿Para qué se necesitan?

  2. ¿Cómo son los estimadores MCO si se cumplen las h.e.b? ¿Qué significa que los estimadores sean ELIO? ¿Propiedades probabilísticas? ¿De que depende la varianza de los estimadores?

  3. ¿Cómo se distribuyen los estimadores MCO? ¿Cómo se estima la desviación típica de los estimadores?

  4. ¿Qué es el ratio t? ¿Cómo se hace un contraste con el t-ratio? ¿Diferencias entre contrastes a una cola y a 2 colas? ¿Qué es el p-value?




Ejercicio 1 (contrastes con t-ratio)

Objetivo

Recordar y practicar los contrastes de hipótesis con el t-ratio en MRLS

Datos
  • Los datos están en el fichero t3_ej_01_contrastes.gdt.

  • El fichero tiene 3 variables: y, x y z

  1. Estime el modelo y = \beta_1 + \beta_2 x , e interprete la estimación de \beta_2

  1. Obtenga, “a mano” \hat\sigma_{\hat{\beta_{2}}}^{2}, Gretl la llama Desv. típica. Para ello antes ha de obtener \hat\sigma^{2}, Gretl la llama D.T. de la regresión

  2. Contraste la significatividad individual de x

  3. Interprete el resultado del contraste anterior ¿qué significa, que implica el resultado?

  4. Contraste, otra vez, la significatividad individual de x, pero ahora usando el p-value

  5. Construya un intervalo de confianza (IC) al 95% para \beta_2

  6. Un IC al 90% ¿será más amplio, o más estrecho? Calcúlelo




Ejercicio 1b

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez la variable será no significativa

Datos
  • Usaremos los mismos datos del ejercicio anterior. Están en el fichero t3_ej_01_contrastes.gdt.
  1. Estime el modelo y = \beta_1 + \beta_2 z , e interprete la estimación de \beta_2

  1. Obtenga, “a mano” \hat\sigma_{\hat{\beta_{2}}}^{2}, Gretl la llama Desv. típica. Para ello antes ha de obtener \hat\sigma^{2}, Gretl la llama D.T. de la regresión

  2. Contraste la significatividad individual de z

  3. Interprete el resultado del contraste anterior ¿qué significa, que implica el resultado?

  4. Contraste, otra vez, la significatividad individual de z, pero ahora usando el p-value

  5. Construya un intervalo de confianza (IC) al 95% para \beta_2

  6. Un IC al 90% ¿será más amplio, o más estrecho? Calcúlelo




Ejercicio 2 (más contrastes)

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez sabremos qué son las variables, por lo que podremos hablar de significatividad práctica o económica. También realizaremos contrastes para distintos niveles de significación (\alpha).

Datos
  • Usaremos los datos del fichero t3_ej_02_salario.gdt.

  • El fichero tiene 3 variables: salario, educacion, experiencia y antiguedad

  1. Estime el modelo salario = \beta_1 + \beta_2 educacion

  1. Contraste la significatividad individual del regresor educacion al 5%

  2. Contraste la significatividad individual del regresor educacion al 10% y al 1%

  3. Interprete el resultado de los contrastes anterior ¿qué significa, que implican los resultados?

  4. La educacion es una variable estadísticamente significativa, para cualquier nivel de significación, pero ¿es significativa en la práctica?

  5. Repita los contrastes, pero ahora usando el p-value




Ejercicio 2b

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez el regresor no será significativo para todos los niveles de significación.

Datos
  • Usaremos los datos del fichero t3_ej_02_salario.gdt.

  • El fichero tiene 3 variables: salario, educacion y experiencia

  1. Estime el modelo salario = \beta_1 + \beta_2 experiencia

  1. Contraste la significatividad individual del regresor experiencia al 5%

  2. Contraste la significatividad individual del regresor experiencia al 10% y al 1%

  3. Interprete el resultado de los contrastes anterior ¿qué significa, que implican los resultados?

  4. La experiencia es una variable estadísticamente significativa, al menos al 5%, pero ¿es significativa en la práctica?

  5. Repita los contrastes, pero ahora usando el p-value

  6. Obtenga un IC para \beta_2 al 95%. Interprete

  7. Obtenga un IC para \beta_2 al 99%. Interprete




Ejercicio 2c

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez el regresor no será significativo al 5%.

Datos
  • Usaremos los datos del fichero t3_ej_02_salario.gdt.

  • El fichero tiene 3 variables: salario, educacion y experiencia

  1. Estime el modelo salario = \beta_1 + \beta_2 antiguedad

  1. Contraste la significatividad individual del regresor antiguedad al 5%

  2. Contraste la significatividad individual del regresor antiguedad al 1% y al 10%

  3. Interprete el resultado de los contrastes anterior ¿qué significa, que implican los resultados?

  4. La antiguedad es una variable estadísticamente significativa, aunque solo al 10%, pero ¿es significativa en la práctica?

  5. Repita los contrastes, pero ahora usando el p-value

  6. Obtenga un IC para \beta_2 al 95%. Interprete

  7. Obtenga un IC para \beta_2 al 90%. Interprete




Ejercicio 2d

Objetivo

Seguir practicando los contrastes de hipótesis con el t-ratio en MRLS. Está vez los contrastes no serán contrastes de significatividad individual.

Datos
  • Usaremos los datos del fichero t3_ej_02_salario.gdt.

  • El fichero tiene 3 variables: salario, educacion y experiencia

  1. Estime el modelo salario = \beta_1 + \beta_2 educacion

  1. Contraste si \beta_2 > 0.7 ¿Puede hacer este contraste con el p-value que ofrece Gretl?

  2. Contraste si \beta_2 > 1 ¿Puede hacer este contraste con el p-value que ofrece Gretl?

  3. Contraste si \beta_2 < 0 ¿Puede hacer este contraste con el p-value que ofrece Gretl?

  4. Contraste si \beta_2 < 0.5 ¿Puede hacer este contraste con el p-value que ofrece Gretl?

  5. Construya un IC para \beta_2 al 95%. Interprete y relacione con los resultados de los apartados anteriores

  6. Construya un IC para \beta_2 al 99%. Interprete y relacione con los resultados de los apartados anteriores




Ejercicio 3 (Examen)

Objetivo

Ver alguna pregunta, en este caso más de tipo teórico, de examen. ¿Verdad que no es muy complicada? 🙂

(Examen de julio de 2007). Argumente la veracidad o falsedad de las siguientes afirmaciones:

  1. En un modelo de regresión, los residuos son iguales a las perturbaciones aleatorias
  2. En un modelo de regresión, el coeficiente de determinación ( R^{2} ) es igual al coeficiente de determinación corregido ( \overline{R^{2}} )




Tema 4: Generalización: regresión lineal múltiple

Repaso de teoría (preguntas rápidas)
  1. ¿En qué se diferencian el MRLS y el MRLM?
  2. ¿Cómo se interpretan las estimaciones de un MRLM?
  3. Diferencie entre R^2 y \overline{R^2}
  4. ¿Qué es el estadístico F? ¿Para qué sirve?
  5. ¿Cómo podemos efectuar predicciones a partir de un modelo estimado?




Ejercicio 1 (Y-X2-X3)

Objetivo

Ver que en un MRLM la mecánica de los contrastes con el t-ratio es igual que en el MRLS; eso sí, en el modelo múltiple podemos plantear contrastes con H_0 compuestas, como por ejemplo, el contraste de significatividad global del modelo.
Hay que diferenciar claramente los contrastes de significatividad individual del contraste de significatividad global.
Para hacer contrastes con H_0 compuestas de más de una restricción, usaremos el estadístico F o compararemos los MG y MR.

Con los resultados mostrados en el siguiente cuadro:

  1. Contraste detalladamente la significatividad conjunta del modelo
  2. Contraste la significatividad de \beta_{2}
  3. Contraste la significatividad de \beta_{3}
  4. ¿Es \beta_{2} igual a 4?
  5. ¿Es \beta_{3} = -2?
  6. Estime la varianza de las perturbaciones




Ejercicio 2

Objetivo

Seguimos con contrastes, pero esta vez las H_0 no son tan mecánicas o directas.

Con 34 observaciones se ha estimado el siguiente modelo:


donde los valores entre paréntesis son las desviaciones típicas estimadas de los estimadores correspondientes (errores estándar).

  1. Contraste la significatividad de la variable x_4
  2. Contraste si x_4 es igual a 10 frente a la posibilidad de que sea mayor que 10
  3. Contraste si x_4 es igual a 2 frente a la posibilidad de que sea menor que 2
  4. Cuando x_3 aumenta una unidad, ¿la variable Y disminuye 4 unidades?




Ejercicio 3 (sqrt-bdrms)

Objetivo

Ver alguna pregunta de examen, en este caso más de tipo práctico. ¿Verdad que no es muy complicada? 🙂 (!!!)

(Examen de enero de 2007) Con una muestra formada por 88 viviendas de una determinada zona se ha obtenido la siguiente estimación: \hat{P} = 19,3 + 0,128 sqrft + 15,2 bdrms . Donde:

  • P: precio de la vivienda en miles de dólares USA
  • sqrft: superficie de la vivienda en pies cuadrados
  • bdrms: número de dormitorios de la vivienda


  1. Si se mantiene fija la superficie total de la vivienda, ¿cuál será el aumento estimado del precio de una vivienda si se le dota de un dormitorio adicional?

  2. ¿Cuál será el aumento estimado del precio de una vivienda si se construye un dormitorio adicional aumentando también la superficie de la vivienda en 100 pies cuadrados?

  3. Una vivienda de 2.500 pies cuadrados y 4 dormitorios se pone a la venta por 270.000 dólares. ¿Qué opina del precio?

  4. Exprese el modelo estimado utilizando como unidad de medida de superficie el metro cuadrado (sqrmts) y expresando el precio en miles de euros (!!!)

NOTAS: 1 pie cuadrado equivale aproximadamente a 0.1 metros cuadrados. Utilice como tipo de cambio 1 euro = 1.28 dólares USA.




Ejercicio 4 (salario-educación)

Objetivo

Practicar, otra vez, interpretación de coeficientes y contrastes de hipótesis en el marco del MRLM. Seguramente este ejercicio lo pediré para casa.

Datos
  • Usaremos los datos del fichero t4_ej_04_educacion.gdt.

  • El fichero tiene 4 variables: salario, educacion, experiencia y antiguedad

  1. Estime el modelo salario = \beta_1 + \beta_2 educación + u e interprete la estimación de \beta_2

  1. Ahora estime el modelo

salario = \beta_{1} + \beta_{2} educacion + \beta_{3} experiencia + \beta_{4} antiguedad + u e interprete la estimación de \beta_2

  1. Interprete la estimación de \beta_2 en el segundo modelo. ¿Por qué son diferentes las estimaciones? ¿Son diferentes los estimadores de \beta_2 en los 2 modelos? ¿Son diferentes los \beta_2 en los 2 modelos?

  2. Realice y explique con palabras de forma detallada el contraste la significatividad individual de la variable educación en el segundo modelo.

  3. La estimación puntual de \beta_{2} es 0,598 ¿es la estimación óptima? Explique.

  4. ¿Cómo ha calculado Gretl la “Desv. Típica” de \hat\beta_{2} ? Utiliza Gretl para calcularla tú mismo. (!!!!)

  5. Realice y explique con palabras de forma detallada el contraste de significatividad individual de la variable experiencia.

  6. Vuelve a efectuar el contraste de significatividad individual de la variable experiencia, pero ahora al 10%.

  7. Utilice el “valor p” (también llamado p-value o nivel de significación crítico) para contrastar la significatividad individual de la variable antigüedad.

  8. Contraste si el efecto de la educación es menor que 0,8

  9. Contraste si el efecto de la educación es menor que 0,6

  10. Construya un intervalo de confianza al 95% para el efecto de la educación

  11. Contraste si el efecto de la antigüedad es mayor que cero

  12. Contraste si el efecto de la antigüedad es mayor que 0,15

  13. Construya un intervalo de confianza al 95% para el efecto de la experiencia. Interprete

  14. Construya un intervalo de confianza al 90% para el efecto de la experiencia. Interprete

  15. Contraste si el efecto de la educación es igual al efecto de la experiencia. (!!!!)

Este contraste no se puede hacer con el t-ratio tal y como lo hemos explicado en clase. Hay que usar el estadístico F (que tampoco lo hemos enseñado a hacer a mano) o comparando el MG y MR. Lo podéis hacer de dos maneras:

- comparando el MG y MR
- usando Gretl: en la ventana de estimación del segundo modelo, pincha en la pestaña `Contrastes`. Se abrirá una caja de texto donde tendrás que escribir la $H_0$. Seguramente no sabrás hacerlo, pero hay un cuadro para obtener ayuda.




Ejercicio 5 (MG-MR)

Objetivo

Empezar a realizar contrastes mediante la comparación del MG y del MR

Se plantea el siguiente modelo:

y = \beta_{1} + \beta_{2} x_{2} + \beta_{3} x_{3} + \beta_{4} x_{4}+ u

El modelo se estimó con 34 observaciones y se obtuvo una SCR de 57,29.


  1. Se quiere contrastar la siguiente hipótesis: \beta_{2} = \beta_{3} + \beta_{4}. Obtenga el modelo restringido.

  2. Tras estimar el modelo restringido anterior, su SCR fue de 69,11. Realice el contraste de la hipótesis al 5% y al 1%.

  3. Escriba el modelo restringido necesario para poder estimar la siguiente hipótesis nula: H_{0} =\begin{cases} \beta_{2} = \beta_{3} + \beta_{4}\\ \beta_{3} = \beta_{4}\end{cases}

  4. La SCR del modelo restringido que incorpora las dos restricciones del aparatado anterior fue de 74,35. Realice el contraste para un nivel de significación del 5% y del 1%.




Ejercicio 6

Objetivo

Seguir con contrastes comparando MG y MR. Esta vez en lugar de tener la H_0 tenemos el MR y hemos de recuperar la H_0. (!!!)

Considere el siguiente modelo de regresión lineal:

y_{i} = \beta_{1} + \beta_{2} x_{2i} + \beta_{3} x_{3i} + u_{i}


A partir de una muestra de 26 observaciones se han obtenido por MCO los siguientes 2 modelos estimados:


donde las cifras entre paréntesis representan las desviaciones típicas de los estimadores. Se pide:

  1. ¿Qué restricciones lineales incorpora el segundo modelo respecto al primero?

  2. Contraste la hipótesis nula especificada en el apartado previo (!!)







Ejercicio 7 (sleep)

Objetivo

Con este ejercicio podemos hacer un repaso rápido a las distintas opciones que tenemos para hacer contrastes de hipótesis, además de una forma menos mecánica que en otros ejercicios y que hace evidente que para interpretar los resultados nunca hay que olvidarse de la escala en la que están medidas las variables.

Datos
  • Usaremos los datos del fichero t4_ej_07_sleep75.gdt.

  • Los datos provienen del libro Introductory Econometrics de J. M. Wooldridge.

  • Los datos incluyen, entre otras, las siguientes variables de una muestra de 706 persones adultas:

    • SLEEP: Tiempo de sueño cada semana (en minutos)

    • EDUC: Años de educación

    • TOTWRK: Tiempo de trabajo cada semana (en minutos)

    • AGE: Edad en años

Con estos datos estime el siguiente modelo: SLEEP_{i} = \beta_{1} + \beta_{2} TOTWORK_{i} + \beta_{3} EDUC_{i} + \beta_{4} AGE_{i}+ u_{i}

  1. ¿Cuánto dormirá diariamente una persona de 20 años de edad, con 14 de educación y que trabaja 40 horas semanales?

  2. Analice la significatividad de cada una de las variables

  3. Analice la significatividad conjunta del Modelo 1

  4. Al trabajar más, ¿se duerme menos?

  5. ¿Una hora adicional de trabajo implica quince minutos menos de sueño?

  6. ¿Una hora adicional de trabajo implica diez minutos menos de sueño?

  7. ¿Influyen la educación y la edad conjuntamente en el tiempo de sueño?

Para el apartado 7, seguramente te hará falta el siguiente cuadro:




Tema 5: Modelos no lineales y transformación de variables

Repaso de teoría (preguntas rápidas)
  1. ¿Qué ocurre si se cambia la escala de un regresor? ¿Y si se cambia la escala del regresando?

  2. ¿Por qué algunos modelos se estiman en logaritmos? ¿Cómo se interpretan los \beta en esos parámetros?

  3. ¿Qué es el AIC? ¿Para qué sirve? ¿Es similar a R^2? ¿a \overline{R^2}?




Ejercicio 1 (sleep)

Objetivo

Con este ejercicio, que utiliza datos ya conocidos, recordaremos cuales son los efectos de cambios de cambios de escala en regresores y regresando.

Datos
  • Usaremos los datos del fichero t5_ej_01_sleep75.gdt.

  • Los datos provienen del libro Introductory Econometrics de J. M. Wooldridge.

  • Los datos incluyen, entre otras, las siguientes variables de una muestra de 706 persones adultas:

    • SLEEP: Tiempo de sueño cada semana (en minutos)

    • EDUC: Años de educación

    • TOTWRK: Tiempo de trabajo cada semana (en minutos)

    • AGE: Edad en años

Con estos datos estime el siguiente modelo: SLEEP_{i} = \beta_{1} + \beta_{2} TOTWORK_{i} + \beta_{3} EDUC_{i} + \beta_{4} AGE_{i}+ u_{i}

  1. Interprete la estimación de \beta_{2}
  2. ¿Cómo cambiará la estimación de \beta_{2} si el tiempo de trabajo pasase a medirse en horas por semana?
  3. ¿Cómo cambiará la estimación de \beta_{2} si el tiempo de trabajo pasase a medirse en días por semana?
  4. ¿Cómo cambiará la estimación de \beta_{2} si el tiempo de sueño pasase a medirse en horas por semana?
  5. ¿Cómo cambiará la estimación de \beta_{2} si las dos variables, tanto el tiempo de sueño como el tiempo de trabajo se midiesen en horas por semana?







Ejercicio 2 (logs)

Objetivo

Afianzar la interpretación de parámetros en modelos con variables en logaritmos

Datos
  • Usaremos los datos del fichero t5_ej_02_alim.gdt.

  • Los datos incluyen las siguientes variables (y sus logaritmos):

    • ALIM: Gasto familiar en alimentos (en euros anuales)
    • RDISP: Renta familiar disponible (en euros anuales)

El archivo t5_ej_02_alim.gdt contiene las siguientes variables:

Estima e interpreta la estimación de \beta_{2} en los siguientes modelos:

  1. ALIM_{i} = \beta_{1} + \beta_{2}RDISP_{i}

  1. ln (ALIM_{i}) = \beta_{1} + \beta_{2}RDISP_{i}

  1. ln (ALIM_{i}) = \beta_{1} + \beta_{2} ln(RDISP_{i})

  1. ALIM_{i} = \beta_{1} + \beta_{2} ln(RDISP_{i})




Ejercicio 3 (ex)

Objetivo

Ejercicio de examen sobre interpretación de coeficientes en modelos con variables en logaritmos.

(Examen de julio de 2008) Razona la veracidad o falsedad de las siguientes afirmaciones, en el siguiente modelo:

ln(y_{i} ) = \beta_{1} + \beta_{2} x_{2i} + \beta_{3} ln(x_{3i}) + u_{i}

  1. Cuando la variable x_{2} aumenta una unidad, la variable y experimenta una tasa de variación porcentual igual a \beta_{2}

  2. Cuando la variable x_{3} aumenta una unidad, la variable y aumenta \beta_{3} unidades




Ejercicio 4 (ex)

Objetivo

Otro ejercicio de examen sobre interpretación de coeficientes en modelos con variables en logaritmos.

(Examen de junio de 2012). Argumente la veracidad o falsedad de las siguientes afirmaciones utilizando los siguientes modelos de regresión estimados:

\widehat{ln(y_{i})} = 3 + 0,17 x_{2i} -1,4 ln(x_{3i})

\widehat{y_{i}} = 2 - 9,3 ln(x_{4i}) + 3,5 x_{5i}

  1. Cuando la variable x_{2} aumenta en una unidad, la variable y experimenta una tasa de variación igual al 17%
  2. Cuando x_{4} disminuye en un 9,3%, la variable y disminuye en una unidad




Ejercicio 5 (Cobb)

Objetivo

Además de seguir trabajando en la interpretación de coeficientes en modelos con variables en logaritmos, en este ejercicio se aprecia muy bien la diferencia entre modelo no-lineal en parámetros y modelo lineal en parámetros (aunque con regresores en logaritmos).

Dada la función de producción Cobb-Douglas Q = A L^{\alpha} K^{\beta} e^u, en la que Q designa la producción, L la ocupación y K el capital:

  1. Linealice el modelo anterior
  2. Interprete los parámetros \alpha y \beta




Ejercicio 6 (edad-mates)

Objetivo

El segundo modelo de este ejercicio incluye un término cuadrático. Esto nos sirve para comprender mejor la diferencia entre regresor y variable explicativa; además,volvemos a trabajar la idea de que un modelo puede ser lineal en parámetros aunque no sea “lineal en variables”.

Datos

Se desea analizar la relación existente entre la edad de los maestros y la calificación obtenida en el examen de matemáticas por sus estudiantes.

Usaremos los datos del fichero t5_ej_06_mates.gdt que contiene una muestra formada por 1.000 observaciones de las siguientes variables:

  • edad : Edad del maestro en años

  • nota: Puntuación obtenida por el estudiante en una prueba de matemáticas (escala de 0 a 10)

  • sq_edad : nota^2 (la puntuación al cuadrado, la nota al cuadrado)

  1. Plantee y estime un modelo de regresión que relacione la edad del maestro con la puntuación en el examen de los estudiantes

Para el apartado 7, seguramente te hará falta el siguiente cuadro:

  1. Interprete el estimador de la pendiente

  2. Introduce en el modelo un nuevo regresor, concretamente la edad del maestro en forma cuadrática; es decir, la variable sq_edad. En este nuevo modelo interpreta la relación entre la edad de los maestros y la puntuación

Para el apartado 7, seguramente te hará falta el siguiente cuadro:

  1. En el modelo del tercer apartado ¿Cómo se interpreta \beta_2?

  2. ¿Cuál sería la edad óptima de los maestros?

  3. ¿Qué notas cabe esperar en los alumnos de maestros de 30, 40, 50 y 60 años?

  4. Comente los resultados del ejercicio (no se olvide de comparar los modelos 1 y 2 y decir que modelo le parece más razonable)




Tema 6: Análisis con información cualitativa

Repaso de teoría (preguntas rápidas)
  1. ¿Qué son las variable ficticias? ¿Para qué sirven?

  2. ¿Qué es la categoría de referencia? ¿Cómo se interpreta el \beta que acompaña a una dummy?

  3. ¿La interpretación del coeficiente difiere si la dummy es aditiva o es multiplicativa?

  4. Si tenemos una característica con q grupos ¿Cuantas dummies podemos definir? ¿Cuál será la categoría de referencia?

  5. ¿Qué ocurre si queremos introducir en el modelo varias variables cualitativas? ¿Estas dummies pueden interactuar?




Ejercicio 1 (bebes)

Objetivo

Empezar a trabajar con modelos con dummies. Es un ejercicio muy pautado en el que se van introduciendo poco a poco más dummies.

Datos
  • Usaremos los datos del fichero t6_ej_01_bebes.gdt. Son datos relacionados con nacimientos de bebes.

  • Entre otras puedes encontrar las siguientes variables cuantitativas:

    • peso: peso del bebe en gramos

    • semanas: semanas de gestación del bebe

    • edad: edad de la madre en años

  • Las variables cuantitativas también se incluyen en logaritmos

  • Además contiene variables ficticias para poder introducir en el modelo distintos aspectos cualitativos:

    • el genero del bebe (con las variables dummy bebita y bebito)

    • el nivel de estudios de la madre (con las dummies primarios, secundarios y superiores)

    • si el parto se ralizó con cesarea (con las dummies cesarea y vaginal)

Con estos datos se analizará la influencia de distintas variables sobre el peso con el que finalmente nacen los bebes. Para ello estime e interprete los siguientes modelos:

Aditivas

  1. peso = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + u

  1. log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + u

  1. peso = \beta_{1} + \beta_{2}semanas + \beta_{3}secundarios + \beta_{4}superiores + u

  1. log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}secundarios + \beta_{4}superiores + u

  1. peso = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + \beta_{3}cesarea + u


Multiplicativas

  1. peso = \beta_{1} + \beta_{2}semanas + \beta_{3}(semanas * bebito) + u

  1. log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}(semanas * bebito) + u


Aditivas y multiplicativas

  1. peso = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + \beta_{4}(semanas * bebito) + u

  1. log(peso) = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + \beta_{4}(semanas * bebito) + u

  1. log(peso) = \beta_{1} + \beta_{2}log(semanas) + \beta_{3}bebito + \beta_{4}(log(semanas) * bebito) + u




Ejercicio 2 (trampa)

Objetivo

Trabajar en comprender la situación conocida como trampa de las ficticias.

Indique y explique detalladamente en cuales de los siguientes modelos se incurre en la trampa de las ficticias:

  1. peso = \beta_{1} + \beta_{2}semanas + \beta_{3}bebito + \beta_{3}bebita + u

  2. peso = \beta_{1} + \beta_{2}semanas + \beta_{3}(semanas * bebito) + \beta_{4} bebito + u

  3. peso = \beta_{1} + \beta_{2}semanas + \beta_{3}(semanas * bebito) + \beta_{4} bebita + u

  4. peso = \beta_{1} + \beta_{2}(semanas*primarios) + \beta_{3}secundarios + \beta_{4}superiores + u




Ejercicio 3 (salario)

Objetivo

Seguir trabajando con dummies, ahora con preguntas más abiertas.

Datos

Usaremos los datos del fichero t6_ej_03_salario.gdt. Tiene información de las siguientes variables:

  • SALARI: Salario del trabajador en euros brutos anuales.
  • EXPLAB: Experiencia laboral del trabajador en años.
  • GENERE: Variable ficticia que toma el valor 1 para los hombres y 0 para las mujeres
  1. Estime el siguiente modelo SALARI_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} GENERE_{i} + u_{i}

  1. ¿Cuál es el género de referencia?

  2. Interprete los parámetros \beta_{2} y \beta_{3} , y sus estimaciones

  3. ¿Influye la experiencia laboral en el salario?

  4. ¿Cuánto puede esperarse que aumente el salario si aumenta su experiencia laboral en un año?

  5. Considerando las estimaciones, ¿hay discriminación laboral por género?

  6. Según el modelo estimado, ¿qué proporción de las variaciones salariales son explicadas por los factores género y experiencia?

  7. Supón ahora que el valor 1 de la variable GENERE corresponde a las mujeres y el 0 a los hombres. ¿Cómo se interpretará ahora el parámetro que acompaña a esta variable?

  8. Suponga que definimos las siguientes variables ficticias: HOME (con valor 1 para los hombres y 0 para las mujeres) y DONA (con valor 1 para las mujeres y 0 para los hombres). ¿Qué ocurrirá al estimar lo siguientes 3 modelos?

SALARI_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} GENERE_{i} + \beta_{4} HOME_{i} + u_{i}

SALARI_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} GENERE_{i} + \beta_{4} DONA_{i} + u_{i}

SALARI_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} HOME_{i} + \beta_{4} DONA_{i} + u_{i}

  1. Plantee/especifique/escriba ahora un modelo que permita analizar si la experiencia laboral se retribuye de igual manera para hombres y mujeres.

  2. Utilice el cuadro siguiente para contrastar si el genero influye en la determinación de los salarios




Ejercicio 4 (pescado)

Objetivo

Seguir trabajando con dummies, ahora con preguntas más abiertas.

Datos

Usaremos los datos del fichero t6_ej_04_pescado.gdt

Contiene datos referentes a gastos en diferentes categorías de alimento, entre otras las siguientes variables:

  • PESCADO: Gasto anual en pescado en miles de pesetas per cápita

  • RDISP: Renta anual disponible en miles de pesetas per cápita

  • ESTMED: Variable ficticia que toma el valor 1 si el máximo nivel de estudios obtenido por el sustentador principal ha sido el de estudios medios y 0 en caso contrario

  • ESTSUP: Variable ficticia que toma el valor 1 si el máximo nivel de estudios obtenido por el sustentador principal ha sido el de estudios superiores y 0 en caso contrario

Con estos datos se estimaron los siguientes modelos:

PESCADO_{i} = \beta{1} + \beta{2} \; RDISP_{i} + \beta{3} \; ESTMED_{i} + \beta{4} \; ESTSUP_{i} + ui_{i}

  1. ¿Cuál es el nivel de estudios de referencia? Interprete las estimaciones de \beta_{3} y \beta_{4}

  2. Contraste si el gasto en pescado es igual para las familias con con estudios básicos y con estudios superiores

  3. Contraste si el gasto en pescado es igual con estudios medios y con estudios superiores

  1. Indique las consecuencias de introducir una nueva variable ficticia que tome el valor 1 si el máximo nivel de estudios obtenido por el sustentador principal ha sido el de estudios básicos y 0 en caso contrario




Ejercicio 5 (ex)

Objetivo

Ver un ejemplo de pregunta de examen con dummies.

(Examen febrero 2006) Con una muestra formada por 25 trabajadores se han obtenido las siguientes estimaciones:

donde:

  • SALARI: Salario bruto anual del trabajador en miles de euros
  • EXPELAB: Experiencia laboral del trabajador en años
  • GÈNERE: Variable ficticia que toma el valor 1 si el trabajador es un hombre y 0 en caso contrario
  • ALEMANY: Variable ficticia que toma el valor 1 si el trabajador sabe alemán y 0 en caso contrario
  • FRANCÈS: Variable ficticia que toma el valor 1 si el trabajador sabe francés y 0 en caso contrario

y los valores entre paréntesis son los errores estándar.

  1. ¿Influye la experiencia laboral en el salario? (Tome como referencia el Modelo A)
  2. ¿Influye el conocimiento de los dos idiomas extranjeros en el salario de un trabajador?
  3. ¿Qué diferencia salarial cabe esperar entre un hombre sin conocimientos de francés y una mujer con conocimientos de francés?
  4. Plantee un modelo de regresión que permita analizar si la diferencia salarial entre hombres y mujeres aumenta con la experiencia laboral e indique cómo realizaría el contraste pertinente. (Tome como referencia el Modelo B)




Ejercicio 6 (estacionalidad)

Objetivo

Ejercicio que muestra que las dummies sirven para incorporar en nuestros modelos una amplia cantidad de fenómenos, como por ejemplo la estacionalidad. Además, como los resultados de estimación no se han efectuado con Gretl si no con otro programa, Eviews, sirve para ver que somos capaces de leer resultados de cualquier software econométrico.

Con datos trimestrales comprendidos entre el primer trimestre de 1981 y el cuarto trimestre de 2008 se ha obtenido la siguiente estimación:

donde CONSUM es el consumo en miles de euros, RENDA es la renta en miles de euros, y T2, T3 y T4 son variables ficticias que toman el valor 1 en el segundo, tercer y cuarto trimestre, respectivamente, y 0 en los respectivos casos contrarios.

  1. ¿Difiere el consumo en el primer y segundo trimestre?

  2. ¿Es el consumo menor en el segundo trimestre que en el primero?

  3. ¿Qué contraste plantearía para analizar si existe estacionalidad o diferencias entre los trimestres?

  4. Se introduce una nueva ficticia, T1, que toma el valor 1 en el primer trimestre y 0 en los otros trimestres. ¿Qué ocurrirá?




Ejercicio 7

Objetivo

Ejercicio muy abierto con dummies (3 categorías)

Datos

Usaremos los datos del fichero t6_ej_03_ocio.gdt

Contiene información de las siguientes variables:

  • OCI: Gasto en ocio en euros anuales
  • RENDA: Renta disponible en euros anuales
  • PRIM: Variable ficticia que toma el valor 1 si el máximo nivel de estudios conseguidos es el nivel primario y 0 en caso contrario
  • SEC: Variable ficticia que toma el valor 1 si el máximo nivel de estudios conseguidos es el nivel secundario y 0 en caso contrario
  • UNI: Variable ficticia que toma el valor 1 si el máximo nivel de estudios conseguidos son estudios universitarios y 0 en caso contrario
  1. Plantee un modelo teórico sin interacciones entre variables explicativas que permita explicar el gasto en ocio a partir de la renta disponible y el nivel de estudios. ¿Cuál es el nivel de estudios de referencia?
  2. Interprete los parámetros del modelo anterior
  3. Estime el modelo planteado

  1. Considerando el modelo estimado en el apartado 3, ¿existen diferencias significativas en el gasto en ocio entre las personas con estudios secundarios y las personas con estudios primarios?

  2. Considerando el modelo estimado en el apartado 3, ¿existen diferencias significativas en el gasto en ocio entre las personas con estudios universitarios y las personas con estudios primarios?

  3. Considerando el modelo estimado en el apartado 3, ¿existen diferencias significativas en el gasto en ocio entre las personas con estudios secundarios y las personas con estudios universitarios?

En el modelo del apartado 3 no lo podemos resolver directamente. tenemos 3 opciones:

  1. Plantear el contraste directamente con el estadístico F

  1. Reformular el modelo para que, por ejemplo, la categoría de referencia sean los estudios universitarios

  1. Con MG y MR
  1. En el modelo estimado en el apartado 3 ¿Hay diferencias en el gasto en ocio asociadas al nivel educativo?

Se puede responder de 2 formas:

  1. Usando el estadístico F

  1. Comparando el MG (apartado 3) con el siguiente modelo (MR)

  1. Especifique ahora un modelo que incluya interacciones entre la renta y el nivel de estudios
  2. Interprete los parámetros del modelo anterior
  3. Estime el modelo planteado

  1. Considerando el modelo estimado en el apartado 10, ¿existen diferencias significativas en el gasto en ocio entre las personas con estudios secundarios y las personas con estudios universitarios?

Se puede responder de 2 formas:

  1. Usando el estadístico F

  1. Comparando el MG (apartado 3) con el siguiente modelo (MR)

  1. Considerando el modelo estimado en el apartado 10, construya una tabla de doble entrada que muestre el gasto en ocio imputable a las personas con rentas iguales a 10.000, 20.000 y 30.000 euros y con diferentes niveles de estudios




Ejercicio 8

Objetivo

Mostrar otra pregunta de examen focalizada en las variables ficticias.

(Examen de enero de 2012). Para analizar las retribuciones salariales de determinados profesionales sanitarios, se plantea el siguiente modelo:

SAL_{i} = \beta_{1} + \beta_{2} EXPLAB_{i} + \beta_{3} GENERE_{i} + \beta_{4} NACIO_{i} + \beta_{5} (GENERE_{i} \times NACIO_{i}) + u_{i}

  • SAL : Salario en euros anuales

  • EXPLAB: Experiencia laboral en años

  • GENERE: Variable ficticia que toma el valor 1 si el profesional es hombre y 0 en caso contrario

  • NACIO: Variable ficticia que toma el valor 1 si el profesional tiene nacionalidad española y 0 en caso contrario


  1. ¿Qué salario cabe esperar para cada una de las posibles combinaciones de género y nacionalidad?

  2. Interprete el significado de \beta_{5}




Ejercicio 9 (absentismo)

Objetivo

Un caso completamente abierto. Se trata de ver si sois capaces de utilizar lo visto en clase para sacar información sobre un fenómeno a partir de un conjunto de datos

Datos
  • Usaremos los datos del fichero t6_ej_09_absentismo.gdt.

  • La descripción de las variables puedes encontrarla en el mismo fichero de datos

¿Qué variables pueden explicar el comportamiento del absentismo laboral en esa empresa?




Tema 7: Incumplimiento de las hipótesis básicas

Repaso de teoría (preguntas rápidas)
  1. ¿Qué significa que se incumpla alguna h.e.b? ¿Qué consecuencias tiene?

  2. ¿Qué es multicolinealidad? ¿Qué consecuencias tiene? ¿Cómo se detecta? ¿Soluciones?

  3. ¿Qué significa la h.e.b de Normalidad? ¿Qué consecuencias tiene? ¿Cómo se detecta? ¿Soluciones?

  4. ¿Qué significa la existencia de heterocedasticidad? ¿En que fenómenos suele ocurrir? ¿Qué consecuencias tiene? ¿Cómo se detecta su presencia? ¿Soluciones?

  5. ¿Qué significa la presencia de autocorrelación? ¿Cuando suele ocurrir? ¿Qué consecuencias tiene? ¿Cómo se detecta su presencia? ¿Soluciones?




Ejercicio 1 (bebes)

Objetivo

Recordar las principales ideas y contrastes del tema 7: normalidad, colinealidad, heterocedasticidad, …

Datos

Usaremos los datos del fichero t6_ej_01_bebes.gdt.

Son datos que ya hemos usado, concretamente en el ejercicio 1 del tema 6. Son datos relacionados con nacimientos de bebes.

Estime el siguiente modelo:

peso = \beta_{1} + \beta_{2}semanas + \beta_{3}edad + \beta_{4}bebito +u

  1. ¿cree que el modelo tiene problemas serios de colinealidad entre los regresores? Explique

  1. Suponga que sí que hubiese un problema importante de colinealidad ¿cuales serían las consecuencias?

  2. Contraste la normalidad de las perturbaciones. Explique el resultado y las consecuencias del contraste

  1. Efectúe el test RESET de Ramsey y explique los resultados (!!!!)

  2. Efectúe el test de White para contrastar la homocedasticidad de las perturbaciones. Explique el contraste y las consecuencias del resultado obtenido




Ejercicio 2 (ROA)

Objetivo

Otro ejercicio para recordar las principales ideas y contrastes del tema 7: normalidad, heterocedasticidad, …

Datos

Usaremos los datos del fichero t7_ej_02_ROA.gdt.

Se quiere conocer los determinantes de la rentabilidad sobre activos (ROA) de una muestra de 5.375 entidades financieras europeas. Para ello se ha estimado el siguiente modelo:

ROA = \beta_{1} + \beta_{2}E\_TA + \beta_{3}LACTIVO + \beta_{4}LACTIVO^2 +u

donde E\_TA es una medida de la solvencia de la entidad (Recursos propios / Activo total), LACTIVO mide el tamaño de la entidad (logaritmo del activo total), LACTIVO^2 es el cuadrado de esta variable.

  1. Contraste la normalidad de las perturbaciones

  1. ¿Presenta heterocedasticidad el modelo estimado?
  • La variable RESABS = |\hat{u}| ; es decir es igual a los residuos del modelo estimado en valor absoluto.

  1. Vuelva a estimar el modelo pero con “errores típicos robustos a la heterocedasticidad”

  1. Señale las diferencias que hay en las 2 estimaciones del modelo