El objetivo de este curso es ofrecer una capacitación intermedia sobre los principales métodos, tecnologías y herramientas utilizados actualmente para analizar conjuntos complejos de datos, denominados Big Data. Se define como big data aquellos conjuntos de datos cuyo procesamiento no se puede abordar mediante técnicas de computación o análisis convencionales, precisándose métodos más avanzados. Para ello, se describirán los fundamentos teóricos para el tratamiento y procesamiento de big data, incluyendo aspectos tanto de infraestructura computacional (ingeniería de datos), como de administración de datos (bases de datos no convencionales) así como métodos avanzados de análisis. Nuestro programa está orientado a la capacitación de personas interesadas en trabajar en análisis de datos, y en particular de análisis que involucran la evaluación de volúmenes muy grandes de datos en empresas y organizaciones. Se hará especial hincapié en el uso de aplicaciones basadas en lenguajes analíticos como R y Python. Los cursos también introducirán paradigmas de almacenamiento y procesamiento de datos como MapReduce o noSQL, y sus implementaciones (Hadoop, Storm, Spark, etc.), así como metodologías de almacenamiento en la nube y computación. Este conocimiento los preparará para manejar grandes conjuntos de datos y realizar análisis estadísticos y computacionales complejos de estos datos, para obtener resultados en la identificación, predicción, previsión, simulación u optimización
Duración: 45 Horas
Personal de Análisis en Banca, Seguros, estudiantes universitarios, público en general. Licenciados en Física, Estadística, Matemáticas, Ciencias Económicas y Financieras, e Ingenierías.
Certificación emitida por COGNOS.
1.1. DATOS ESTRUCTURADOS, SEMI-ESTRUCTURADOS Y NO ESTRUCTURADOS
1.2. COMPUTACION PARALELA Y DISTRIBUIDA. MAPREDUCE
1.3. TECNOLOGIAS CLOUD COMPUTING Y ALMACENAMIENTO DE ALTO RENDIMIENTO
1.4. METODOS Y ARQUITECTURAS DE PROCESAMIENTO DE DATOS
2.1. ANALISIS DE BIG DATA EN R Y PYTHON
2.2. ECOSISTEMA APACHE HADOOP
3.1. METODOLOGIAS NOSQL
4.1. PROCESAMIENTO DE DATOS EN MEMORIA
4.2. TECNOLOGIAS AVANZADAS DE PROCESAMIENTO DISTRIBUIDO DE DATOS
5.1. ANALISIS DE UN CASO DE LA PLATAFORMA WWW.KAGGLE.COM
Al finalizar el curso los participantes tendrán los conocimientos y comprensión de base suficientes para desarrollar y aplicar ideas originales en contextos diversos.
La inversión incluye: Material de estudio, certificados e impuestos de ley.