Ciencia de Datos con Python
De Estadística Descriptiva a Redes Neuronales
Acerca de este curso
Este curso tiene como meta introducir a los estudiantes de la Facultad de Psicología al mundo de la ciencia de datos utilizando Python. A lo largo del curso se abordarán temas como la programación en Python, la estadística descriptiva e inferencial, el análisis y visualización de datos, y la creación de redes neuronales.
El curso no supone ningún conocimiento previo de programación, pero se espera que los estudiantes tengan una actitud proactiva y estén dispuestos a aprender y a poner en práctica los conceptos que se presenten en clase.
Aunque se repasarán de manera breve conceptos de estadística y probabilidad, es recomendable tener un conocimiento básico de estos temas para poder aprovechar al máximo el curso. Otro requisito importante es tener una computadora personal con acceso a internet y disponibilidad de llevar al salón, ya que la mayor parte de las actividades requerirán de una computadora personal.
Una parte importante del curso es crear un ambiente de aprendizaje colaborativo, por lo que se espera que los estudiantes participen activamente en las clases, realicen las tareas y actividades que se les asignen, y que estén dispuestos a ayudar a sus compañeros en caso de que lo necesiten. Además se crearán equipos permanentes de trabajo, por lo que es importante que los estudiantes se comprometan a trabajar en equipo dado que todas las actividades se realizarán en equipo fomentando un método de trabajo llamado “pair programming”.
Objetivos del curso
- Aprender y poner en práctica los conceptos básicos de la programación en Python.
- Comprender los conceptos básicos de la estadística descriptiva e inferencial a través de ejemplos prácticos en Python.
- Aprender a utilizar las librerías más populares de Python para el análisis y la visualización de datos.
- Comprender los conceptos básicos de las redes neuronales y aprender a crear redes neuronales utilizando Python.
- Aprender a presentar y comunicar los resultados de un análisis de datos de manera efectiva y con código reproducible.
Instructor
- Christian Francisco Badillo Hernández
- Lab 25, Facultad de Psicología, UNAM
- cris.badillo1408@gmail.com
Detalles del curso
- Lunes - Viernes
- 10 de junio - 28 de junio de 2024
- 13:30 - 15:30 hrs
- A209
- Classroom
Temario
- Introducción a Python y la Ciencia de Datos.
- Tipos, variables y operaciones matemáticas básicas.
- Strings (cadenas de texto).
- Integer (Números enteros).
- Floats (Décimales)
- Booleanos
- Expresiones y declaraciones.
- Operaciones.
- Definición de funciones.
- Definición de funciones en python
- Uso de funciones.
- Funciones lambda
- Flujos de control.
- Flujo de control If, else, elif
- Flujo de control while
- Flujo de control for
- Keywords de flujos de control: pass, continue, break
- Estructuras de datos.
- Set.
- Tuplas.
- Diccionarios.
- Listas.
- Matrices.
- Ndarrays.
- Data Frames.
- Módulos y paquetes.
- Definición de módulos y paquetes.
- Tipos, variables y operaciones matemáticas básicas.
- Limpieza, manejo y creación de bases de datos con pandas.
- Tipos de bases de datos.
- Bases de datos relacionales.
- Base de datos no relacionales.
- Introducción al manejo de bases de datos con pandas.
- Carga de bases de datos locales o de la nube.
- Búsqueda de datos faltantes.
- Descripción de bases de datos.
- Modificación de bases de datos.
- Creación de bases de datos.
- Tipos de bases de datos.
- Análisis descriptivo y visualización de datos.
- Visualización de datos con Matplotlib y Seaborn.
- Introducción a la visualización de datos.
- Matriz de correlación.
- Visualizaciones básicas (histogramas, cajas de bigotes, etc.).
- Visualizaciones en 3D y combinaciones de gráficos.
- Visualización de datos con Matplotlib y Seaborn.
- Estadística Inferencial con Python.
- Paqueterías de Análisis estadístico.
- Statsmodels.
- Scikit-learn.
- Paqueterías bayesianas (PyMC3, PyJAGS, PySTAN).
- Regresión lineal.
- Regresión múltiple.
- Modelos lineales generalizados (regresión logística, ANOVA, T-Student, etc).
- Estimación Bayesiana (Uso de algoritmos MCMC).
- Paqueterías de Análisis estadístico.
- Introducción a Machine learning: Redes Neuronales.
- Conceptos básicos de Inteligencia artificial y redes neuronales.
- Paqueterías para redes neuronales.
- Tensorflow.
- Scikit-learn.
- Keras.
- Programación del perceptrón multicapa.
- Analizando datos con un red neuronal multicapa.
Puedes descargar el temario completo en el siguiente enlace: