DATOS BÁSICOS
Virtual horario obligatorio de 17:00-21:00 horas.
REQUISITOS
Trabajadores ocupados o desempleados en la Comunidad Autónoma de Aragón, de manera específica destinado para administradores de sistemas y gerentes IT que tengan experiencia básica en Linux.
Requisitos previos:
Se requiere experiencia básica en Linux. No se requieren conocimientos previos de Apache Hadoop.
FINALIDAD
Este curso enseña a los participantes las siguientes habilidades:<br/>· Topología de un clúster de Cloudera típico y el papel que juegan los componentes principales en el clúster<br/>· Cómo instalar Cloudera Manager y CDP<br/>· Cómo utilizar Cloudera Manager para crear, configurar, implementar y monitorear un clúster<br/>· Qué herramientas proporciona Cloudera para ingerir datos de fuentes externas en un clúster<br/>· Cómo configurar los componentes del clúster para un rendimiento óptimo<br/>· Qué tareas rutinarias son necesarias para mantener un clúster, incluida la actualización a una nueva versión de CDP<br/>· Acerca de la detección, resolución de problemas y reparación de problemas<br/>· Funciones de seguridad clave de Cloudera<br/><br/>Examen de certificación incluido: CDP Administrator - Private Cloud Base
PROGRAMA
· Tendencias de la industria para Big Data
· El desafío de estar basado en datos
· La nube de datos empresariales
· CDP
· Factores de forma de CDP
· Ejercicio práctico: configurar la red de ejercicios
Módulo 2: Instalación de la base de nube privada de CDP
· Cloudera Manager
· Ejercicio práctico: instalación de Cloudera Manager Server
· Descripción general del tiempo de ejecución de CDP
· Demostración dirigida por un instructor: Cloudera Manager
· Ejercicio práctico: instalación en clúster
Módulo 3: Configuración de clúster
· Ajustes de configuración
· Modificación de configuraciones de servicio
· Archivos de configuración
· Administrar instancias de roles
· Agregar nuevos servicios
· Agregar y quitar hosts
· Ejercicio práctico: configuración de un clúster de Hadoop
Módulo 4: Almacenamiento de datos
· HDFS
· Rendimiento de HDFS y tolerancia a fallos
· Descripción general de seguridad de HDFS y Hadoop
· Trabajar con la interfaz de usuario de Namenode
· Demostración dirigida por un instructor: interfaz de usuario de Namenode
· Trabajando con HDFS
· Ejercicio práctico: trabajar con HDFS
· HBase
· Kudu
· Almacenamiento en la nube
· Ejercicio práctico: almacenamiento de datos en Amazon S3
Módulo 5: Ingesta de datos
· Formatos de archivo
· Ingesta de datos mediante transferencia de archivos o interfaces REST
· Importación de datos de bases de datos relacionales con Apache Sqoop
· Ejercicio práctico: importación de datos con Sqoop
· Ingesta de datos con NiFi
· Demostración dirigida por un instructor: interfaz de usuario de NiFi
· Prácticas recomendadas para importar datos
· Ejercicio práctico: verificación de NiFi
Módulo 6: Flujo de datos
· Cloudera Flow Management y NiFi
· Arquitectura NiFi
· Gestión de flujo de Cloudera Edge y MiNiFi
· Uso de NiFi
· Descripción general de Apache Kafka
· Arquitectura de clúster de Apache Kafka
· Herramientas de línea de comandos de Apache Kafka
· Ejercicio práctico: trabajar con Kafka
Módulo 7: Acceso y descubrimiento de datos
· Apache Hive
· Apache Impala
· Ajuste de Apache Impala
· Ejercicio práctico: instalar Impala y Hue
· Hue
· Administrar y configurar Hue
· Autenticación y autorización de Hue
· Descripción general de CDSW
· Ejercicio práctico: uso de Hue, Hive e Impala
Módulo 8: Computación de datos
· Descripción general de YARN
· Ejecución de aplicaciones en YARN
· Visualización de aplicaciones de YARN
· Registros de aplicaciones de YARN
· Aplicaciones MapReduce
· Configuración de CPU y memoria YARN
· Ejercicio práctico: ejecución de aplicaciones YARN
· Descripción general de Tez
· ACID para Hive
· Descripción general de Spark
· Cómo se ejecutan las aplicaciones Spark en YARN
· Supervisión de aplicaciones Spark
· Ejercicio práctico: ejecución de aplicaciones Spark
Módulo 9: Gestión de recursos
· Etiquetas de nodo
· Configuración de cgroups
· El programador de capacidad
· Administrar colas
· Programación de consultas de Impala
· Ejercicio práctico: uso del programador de capacidad
Módulo 10: Planificación de su clúster
· Elegir el hardware adecuado
· Consideraciones de red
· Consideraciones sobre la nube privada de CDP
· Configurar nodos
Módulo 11: Configuración avanzada de clústeres
· Configuración de puertos de servicio
· Ajuste de HDFS y MapReduce
· Gestionar el crecimiento del clúster
· Codificación de borrado
· Habilitación de alta disponibilidad para HDFS y YARN
· Ejercicio práctico: configuración de HDFS para alta disponibilidad
Módulo 12: Mantenimiento de clústeres
· Comprobación del estado de HDFS
· Copiar datos entre clústeres
· Reequilibrio de datos en HDFS
· Instantáneas del directorio HDFS
· Ejercicio práctico: creación y uso de una instantánea
· Mantenimiento de host
· Actualizar un clúster
· Ejercicio práctico: actualizar el clúster
Módulo 13: Monitoreo de clústeres
· Funciones de supervisión de Cloudera Manager
· Pruebas de salud
· Ejercicio práctico: Romper el grupo
· Eventos y alertas
· Gráficos e informes
· Recomendaciones de seguimiento
· Ejercicio práctico: confirmación de la reparación del clúster y configuración de alertas por correo electrónico
Módulo 14: Solución de problemas del clúster
· Herramientas de resolución de problemas
· Ejemplos de configuración incorrecta
· Ejercicio práctico: resolución de problemas de un clúster
Módulo 15: Seguridad
· Gobierno de datos con SDX
· Conceptos de seguridad de Hadoop
· Autenticación de Hadoop mediante Kerberos
· Autorización de Hadoop
· Cifrado Hadoop
· Asegurar un clúster de Hadoop
· Apache Ranger
· Atlas de Apache
· Copia de seguridad y recuperación
Módulo 16: Nube privada / Nube pública
· Descripción general de CDP
· Capacidades de nube
· ¿Qué es Kubernetes?
· Workload XM
· Escalado automático
Módulo 17: Conclusión
Módulo 18: Apéndice: API de Cloudera Manager
Módulo 19: Apéndice: Descripción general de Ozone
RESPONSABLE DEL CURSO
TU COMUNIDAD
Foros de discusión
- Dudas sobre el curso de Amazon Web Services1 hilos
- Fotografía1 hilos
- Dudas sobre el curso de CSS2 hilos