En este curso, aprenderá a crear soluciones de análisis de datos por lotes con Amazon EMR, una solución de nivel empresarial. Servicio gestionado Apache Spark y Apache Hadoop. Aprenderá cómo Amazon EMR se integra con proyectos de código abierto como Apache Hive, Hue y HBase, y con servicios de AWS como AWS Glue y Formación del lago AWS. El curso aborda la recopilación, ingesta, catalogación, almacenamiento y procesamiento de datos componentes en el contexto de Spark y Hadoop. Aprenderá a usar EMR Notebooks para admitir ambos Cargas de trabajo de análisis y aprendizaje automático. También aprenderá a aplicar la seguridad, el rendimiento y el costo. mejores prácticas de gestión para el funcionamiento de Amazon EMR.
Propuesta de Valor: AWS (AMAZON WEB SERVICES)
Duración: 8 Horas
1.1. USO DE AMAZON EMR EN SOLUCIONES DE ANÁLISIS
1.2. ARQUITECTURA DE CLÚSTER DE AMAZON EMR
1.3. LANZAMIENTO DE UN CLÚSTER DE AMAZON EMR
1.4. ESTRATEGIAS DE GESTIÓN DE COSTOS
2.1. OPTIMIZACIÓN DEL ALMACENAMIENTO CON AMAZON EMR
2.2. TÉCNICAS DE INGESTIÓN DE DATOS
3.1. CASOS DE USO DE APACHE SPARK EN AMAZON EMR
3.2. POR QUÉ APACHE SPARK EN AMAZON EMR
3.3. CONCEPTOS DE CHISPA
3.4. CONÉCTESE A UN CLÚSTER DE EMR Y EJECUTE COMANDOS DE SCALA USANDO EL CÁSCARA DE CHISPA
3.5. TRANSFORMACIÓN, PROCESAMIENTO Y ANÁLISIS
3.6. USO DE PORTÁTILES CON AMAZON EMR
3.7. PRÁCTICA DE LABORATORIO 1: ANÁLISIS DE DATOS DE BAJA LATENCIA CON APACHE SPARK EN AMAZON EMR
4.1. USO DE AMAZON EMR CON HIVE PARA PROCESAR DATOS POR LOTES
4.2. TRANSFORMACIÓN, PROCESAMIENTO Y ANÁLISIS
4.3. PRÁCTICA DE LABORATORIO 2: PROCESAMIENTO DE DATOS POR LOTES CON AMAZON EMR CON HIVE
4.4. INTRODUCCIÓN A APACHE HBASE EN AMAZON EMR
5.1. PROCESAMIENTO, TRANSFORMACIÓN Y ANÁLISIS DE DATOS SIN SERVIDOR
5.2. USO DE AWS GLUE CON CARGAS DE TRABAJO DE AMAZON EMR
5.3. PRÁCTICA DE LABORATORIO 3: ORQUESTE EL PROCESAMIENTO DE DATOS EN SPARK CON AWS STEP FUNCTIONS
6.1. PROTECCIÓN DE CLÚSTERES DE EMR
6.2. DEMOSTRACIÓN INTERACTIVA 3: CIFRADO DEL LADO DEL CLIENTE CON EMRFS
6.3. SUPERVISIÓN Y SOLUCIÓN DE PROBLEMAS DE CLÚSTERES DE AMAZON EMR
6.4. REVISIÓN DEL HISTORIAL DEL CLÚSTER DE APACHE SPARK
7.1. CASOS DE USO DE ANÁLISIS DE DATOS POR LOTES
7.2. DISEÑO DE UN FLUJO DE TRABAJO DE ANÁLISIS DE DATOS POR LOTES
La inversión incluye: Material de estudio, certificados e impuestos de ley.