DATOS BÁSICOS
FINALIDAD
Este curso ayuda a los participantes a comprender lo que hacen los data scientists, los problemas que resuelven y las herramientas y técnicas que utilizan. <br/><br/>A través de simulaciones en clase, los participantes aplican los métodos de data science a los retos del mundo real en diferentes industrias y, en última instancia, se preparan para las funciones de data scientist en el campo.<br/><br/>Al finalizar la formación, el participante conocerá:<br/><br/>· Apache Spark 2 para Data Science y machine learning en flujos de trabajo a escala<br/><br/>· Spark SQL y Dataframes para trabajar con datos estructurados<br/><br/>· MLlib, la librería de Spark para machine learning<br/><br/>· PySpark, la API de Python para Spark<br/><br/>· Sparklyr, una interfaz de R compatible con dplyr para Spark<br/><br/>· El Cloudera Data Science Workbench (CDSW)<br/><br/>· Otros componentes del ecosistema Hadoop: HDFS, Hive, Impala y Hue
PROGRAMA
- Descripción general de la data science y el aprendizaje automático a escala
- Descripción general del ecosistema Hadoop
- Trabajando con datos HDFS y tablas Hive usando Hue
- Introducción a Cloudera Data Science Workbench
- Descripción general de Apache Spark 2
- Leer y escribir datos
- Inspeccionar la calidad de los datos
- Limpieza y transformación de datos.
- Resumen y agrupación de datos
- Combinar, dividir y remodelar datos
- Explorando datos
- Configuración, monitoreo y solución de problemas de aplicaciones Spark
- Descripción general del aprendizaje automático en Spark MLlib
- Extraer, transformar y seleccionar características
- Construyendo y evaluando modelos de regresión
- Construyendo y evaluando modelos de clasificación
- Construyendo y evaluando modelos de agrupamiento
- Modelos de validación cruzada e hiperparámetros de ajuste
- Construcción de tuberías de aprendizaje automático
- Implementación de modelos de aprendizaje automático
RESPONSABLE DEL CURSO
TU COMUNIDAD
Foros de discusión
- Dudas sobre el curso de Amazon Web Services1 hilos
- Fotografía1 hilos
- Dudas sobre el curso de CSS2 hilos