Septiembre, 2023

Bienvenidos al curso!!


1. Tenemos que conocernos

(al menos un poquet)


¿Quién es el profesor?

  • Pedro J. Pérez (pedro.j.perez@uv.es)

  • Este curso doy solo otra asignatura: Econometría.

  • Entusiasta de R.

  • Mis objetivos en el curso.

Vosotros

En realidad, ya me habéis contestado a estas preguntas en el cuestionario previo, pero …

  • Me gustaría saber un poco de vuestras motivaciones a la hora de apuntaros al curso. ¿Por qué TE has apuntado?
  • ¿Tienes una idea clara de cuales son los contenidos/objetivos del curso? ¿Has consultado la guía docente?
  • ¿Cuales son tus objetivos en el curso?
  • ¿Conoces algún lenguaje de programación? ¿Conoces algo de R? ¿sabes qué es la Ciencia de Datos? …..

2. Objetivo y contenidos del curso

¿De qué va el curso?


Ideas generales

  • Asignatura optativa. Cuarto curso del Grado de Economía.
  • El título del curso es “Programación y Manejo de datos en la era del Big Data”, pero … debería llamarse Introducción a la Ciencia de datos con R”.
  • Objetivo general: iniciaros en la Ciencia de Datos.
  • Para ello se presentarán una panorámica de tópicos y os introduciréis, quizá por primera vez en la carrera, en el mundo de la programación y en una rama de la estadística que está emergiendo con fuerza como es el Machine Learning.
  • En el curso se dará mucha importancia a las habilidades prácticas necesarias para “manejar” y analizar conjuntos de datos, dándole las instrucciones por escrito al ordenador; es decir, programando con R.
  • Se pretende que al final del curso seáis capaces de “manejar” datos con R. Que seáis capaces de hacer análisis de datos con R
  • Para ello tenemos que aprender a importar, limpiar, transformar, realizar visualizaciones, plantear y estimar modelos y presentar un informe con los resultados. Todo ello con un software profesional como R.

Relación de temas

  • Tema 1: Ciencia de datos y la era del Big Data .

  • Tema 2: Una introducción a R para Ciencia de datos.

  • Tema 3: Manejo y análisis exploratorio de datos tabulares.

  • Tema 4: Introducción al Machine Learning.

  • Tema 5: Otros tipos de datos.

Detalles del curso

  • Clases: martes (15:30-17:30, aula 300) y miércoles (15:30-17:30, aula 401).

  • Teoría vs. Práctica.

  • Importancia del trabajo con ordenador.

  • Mandaré tareas para la semana siguiente!!

  • Tutorías/Ayuda (pedro.j.perez@uv.es), pero dudas puntuales sobre las tareas, mejor en el Foro

  • Es necesario tener un ordenador con R y RStudio instalados, tanto en casa con en el aula.

Bibliografía (oficial)

Materiales

Evaluación

  • Evaluación continua (40%):

    • en el aula

    • tareas para casa

    • 1 proyecto individual

    • 1 proyecto en grupo (3 personas)


  • Examen final (60%): si es posible, en el aula con el ordenador.


Los detalles podéis verlos en Aula Virtual

Resumiendo …


Resumiendo ….

  • El curso es una introducción a diversos tópicos sobre DS.

  • El énfasis se pondrá, en desarrollar competencias/conocimientos prácticos para “manejar” datos.

  • Para ello hace falta “programar”.

  • Utilizaremos R.

  • Al final, se trata de que mejoréis vuestras habilidades prácticas para hacer análisis de datos.

  • Para “aprender” estas habilidades se han de practicar.

  • El trabajo en clase y fuera de clase es muy importante!!

  • Espero que aprendáis y que os guste … en realidad, espero que NOS divirtamos!!

Para comenzar el curso, hoy haremos:


Para comenzar el curso, hoy haremos:

  • Introducir las principales ideas del Tema 1: Big Data, Ciencia de datos, Machine Learning, Investigación reproducible, Software Libre, R …
  • Presentaros a R y RStudio y comprobar que habéis hecho la instalación correctamente
  • Practicar con RStudio.
  • Hacer varios ejemplos para que os hagáis una idea más clara de lo que haremos durante buena parte del curso.
  • Hablar de la forma de trabajar con R (ó workflow): scripts, Rprojects, .Rmd … y los nuevos .qmd

Pues vamos a comenzar el curso!!!


¿Algún comentario, pregunta … ?