CIENTÍFICO DE DATOS BIG DATA CLOUDERA

Inscripción finalizada
Image

DATOS BÁSICOS

Fecha fin inscripcion
Fecha prueba selección
Fecha inicio y fin del curso
Del 19/09/2022 al 06/10/2022
Duración
48 horas
Número expediente
22/0999.045

FINALIDAD

Este curso ayuda a los participantes a comprender lo que hacen los data scientists, los problemas que resuelven y las herramientas y técnicas que utilizan. <br/><br/>A través de simulaciones en clase, los participantes aplican los métodos de data science a los retos del mundo real en diferentes industrias y, en última instancia, se preparan para las funciones de data scientist en el campo.<br/><br/>Al finalizar la formación, el participante conocerá:<br/><br/>· Apache Spark 2 para Data Science y machine learning en flujos de trabajo a escala<br/><br/>· Spark SQL y Dataframes para trabajar con datos estructurados<br/><br/>· MLlib, la librería de Spark para machine learning<br/><br/>· PySpark, la API de Python para Spark<br/><br/>· Sparklyr, una interfaz de R compatible con dplyr para Spark<br/><br/>· El Cloudera Data Science Workbench (CDSW)<br/><br/>· Otros componentes del ecosistema Hadoop: HDFS, Hive, Impala y Hue

PROGRAMA



- Descripción general de la data science y el aprendizaje automático a escala

- Descripción general del ecosistema Hadoop

- Trabajando con datos HDFS y tablas Hive usando Hue

- Introducción a Cloudera Data Science Workbench

- Descripción general de Apache Spark 2

- Leer y escribir datos

- Inspeccionar la calidad de los datos

- Limpieza y transformación de datos.

- Resumen y agrupación de datos

- Combinar, dividir y remodelar datos

- Explorando datos

- Configuración, monitoreo y solución de problemas de aplicaciones Spark

- Descripción general del aprendizaje automático en Spark MLlib

- Extraer, transformar y seleccionar características

- Construyendo y evaluando modelos de regresión

- Construyendo y evaluando modelos de clasificación

- Construyendo y evaluando modelos de agrupamiento

- Modelos de validación cruzada e hiperparámetros de ajuste

- Construcción de tuberías de aprendizaje automático

- Implementación de modelos de aprendizaje automático

RESPONSABLE DEL CURSO

José Antonio Barrabés

TU COMUNIDAD

Foros de discusión
  • Dudas sobre el curso de Amazon Web Services

    1 hilos
  • Fotografía

    1 hilos
  • Dudas sobre el curso de CSS

    2 hilos