CURSO DATA ENGINEERING ON GOOGLE CLOUD PLATFORM (DEGCP)
Esta clase Data Engineering On Google Cloud Platform (Degcp) de cuatro días dirigida por un instructor brinda a los participantes una introducción práctica al diseño y la construcción de sistemas de procesamiento de datos en Google Cloud Platform. A través de una combinación de presentaciones, demostraciones y laboratorios prácticos, los participantes aprenderán a diseñar sistemas de procesamiento de datos, crear canales de datos de extremo a extremo, analizar datos y llevar a cabo el aprendizaje automático. El curso cubre datos estructurados, no estructurados y de transmisión.
Duración:
4 días
Próximo curso:
Modalidades:
- En Línea con instructor en vivo
Preparación para la certificación
• Examen GCP-DE
• Certificación Lograda: Google Cloud Certified Professional Data Engineer
Beneficios
Diploma Oficial Google Cloud Platform
Manual Digital Google Cloud Platform
Laboratorios Oficiales Google Cloud Platform
Garantía ExecuTrain
Curso dirigido a:
Esta clase está dirigida a desarrolladores experimentados que son responsables de administrar las transformaciones de big data, que incluyen:
- Extraer, cargar, transformar, limpiar y validar datos
- Diseño de tuberías y arquitecturas para el procesamiento de datos.
- Creación y mantenimiento de modelos estadísticos y de aprendizaje automático
- Consultar conjuntos de datos, visualizar resultados de consultas y crear informe
Requisitos previos:
Para aprovechar al máximo este curso, los participantes deben tener:
- Completó el curso Google Cloud Fundamentals: Big Data and Machine Learning (GCF-BDM) O tenga experiencia equivalente
- Competencia básica con el lenguaje de consulta común como SQL
- Experiencia con actividades de modelado, extracción, transformación y carga de datos.Desarrollo de aplicaciones utilizando un lenguaje de programación común como Python.
- Familiaridad con el aprendizaje automático y / o las estadísticas.
C E R T I F I C A C I Ó N
Google Cloud Certified
Professional Data Engineer
¿Qué es Google Cloud Certified Professional Data Engineer ?
La certificación Google Cloud Certified Professional Data Engineer es una credencial avanzada que valida la capacidad de un profesional para diseñar, construir, operar, asegurar y monitorear sistemas de procesamiento de datos en Google Cloud Platform (GCP). Esta certificación está orientada a aquellos que desean demostrar su competencia en el manejo de grandes volúmenes de datos y en la implementación de soluciones de análisis de datos avanzadas en la nube.
La certificación Google Cloud Certified Professional Data Engineer es una valiosa credencial para los profesionales que buscan demostrar y validar sus habilidades en la ingeniería de datos utilizando Google Cloud, ofreciendo numerosos beneficios tanto a nivel personal como organizacional.
¿Qué se evalua para obtener esta certificación?
-
Diseño de Soluciones de Procesamiento de Datos
- Identificación de Requisitos: Analizar y traducir los requisitos empresariales en especificaciones técnicas para soluciones de datos.
- Arquitecturas de Datos: Diseñar arquitecturas robustas y escalables que puedan manejar grandes volúmenes de datos de manera eficiente.
- Selección de Tecnologías: Elegir las tecnologías y servicios de GCP adecuados para las diferentes etapas del procesamiento de datos.
-
Construcción y Mantenimiento de Pipelines de Datos
- Ingesta y Almacenamiento de Datos: Crear pipelines que puedan ingerir, transformar y almacenar datos de manera eficiente usando herramientas como Dataflow, Pub/Sub, y Cloud Storage.
- Transformación de Datos: Implementar transformaciones y procesos de limpieza de datos utilizando servicios como Dataprep y Dataproc.
-
Análisis de Datos y Machine Learning
- BigQuery: Utilizar BigQuery para realizar análisis rápidos y eficientes de grandes conjuntos de datos mediante SQL.
- Machine Learning: Implementar modelos de Machine Learning utilizando AI Platform, TensorFlow, y AutoML para resolver problemas específicos del negocio.
-
Seguridad y Gestión de Datos
- Protección de Datos: Implementar medidas de seguridad para proteger los datos sensibles, incluyendo cifrado en tránsito y en reposo.
- Gestión de Accesos: Configurar políticas y permisos adecuados para asegurar que solo las personas autorizadas tengan acceso a los datos.
-
Monitoreo y Optimización
- Monitoreo de Sistemas: Configurar y utilizar herramientas de monitoreo como Stackdriver para supervisar el rendimiento y la salud de las soluciones de datos.
- Optimización de Recursos: Optimizar el uso de recursos y costos operativos mediante la implementación de prácticas eficientes y ajustes en la configuración.
¿QUÉ APRENDERAS?
En el curso “Data Engineering on Google Cloud Platform”, los participantes aprenderán una variedad de habilidades y conceptos esenciales para diseñar, construir y gestionar soluciones de datos en Google Cloud.
Introducción a Google Cloud Platform para Ingeniería de Datos
- Descripción General de GCP: Comprender los fundamentos de Google Cloud Platform y cómo soporta la ingeniería de datos.
- Servicios Clave de GCP: Familiarizarse con los servicios de datos y análisis disponibles en GCP, como BigQuery, Cloud Storage, y Pub/Sub.
Ingesta de Datos y Almacenamiento
- Ingesta de Datos: Aprender a ingerir datos de diversas fuentes utilizando servicios como Cloud Pub/Sub para transmisión de datos en tiempo real y Dataflow para procesamiento por lotes.
- Almacenamiento de Datos: Explorar las opciones de almacenamiento de datos en GCP, incluyendo Cloud Storage para datos no estructurados y BigQuery para datos estructurados.
Procesamiento de Datos
- Dataflow y Dataproc: Usar Dataflow para procesamiento en tiempo real y por lotes, y Dataproc para ejecutar trabajos de Hadoop y Spark en la nube.
- Transformación de Datos: Implementar transformaciones de datos utilizando herramientas como Dataflow, que permite definir pipelines de datos escalables y eficientes.
Análisis de Datos
- BigQuery: Aprender a ejecutar consultas SQL en grandes conjuntos de datos utilizando BigQuery, incluyendo técnicas de optimización de consultas y modelado de datos.
- Data Studio: Utilizar Google Data Studio para crear informes y dashboards interactivos que visualicen los resultados del análisis de datos.
Machine Learning en GCP
- AI Platform y TensorFlow: Implementar y entrenar modelos de Machine Learning utilizando AI Platform y TensorFlow.
- AutoML: Usar AutoML para crear modelos de Machine Learning personalizados sin necesidad de un conocimiento profundo en Machine Learning.
- APIs de ML: Integrar APIs preentrenadas de Google Cloud, como la API de Visión y la API de Lenguaje Natural, en aplicaciones y soluciones.
Arquitectura de Soluciones de Datos
- Diseño de Arquitecturas de Datos: Aprender a diseñar arquitecturas de datos robustas y escalables que soporten grandes volúmenes de datos y diversos casos de uso.
- Pipelines de Datos: Crear y gestionar pipelines de datos que incluyan ingesta, transformación, almacenamiento y análisis de datos.
- Casos de Uso y Patrones de Diseño: Explorar casos de uso comunes y patrones de diseño para la ingeniería de datos en GCP.
Seguridad y Gestión de Datos
- Protección de Datos: Implementar medidas de seguridad para proteger datos sensibles, incluyendo cifrado y políticas de acceso.
- Gestión de Permisos y Roles: Configurar permisos y roles adecuados para asegurar que solo las personas autorizadas tengan acceso a los datos y recursos.
Monitoreo y Optimización
- Monitoreo de Recursos: Utilizar herramientas como Stackdriver para monitorear el rendimiento de los sistemas y detectar problemas potenciales.
- Optimización de Costos y Rendimiento: Implementar prácticas para optimizar el uso de recursos y reducir costos operativos sin comprometer el rendimiento.
METODOLOGÍA DE ESTUDIO EFECTIVA
Modalidad en linea con instructor en vivo.
Interacción Personalizada:
- Enfoque Personalizado: Reciben atención personalizada y haz preguntas al instructor.
- Retroalimentación Instantánea: Tu profesor en vivo te proporcionará retroalimentación inmediata, lo que facilita la comprensión de conceptos y la corrección de errores.
Flexibilidad y Accesibilidad:
- Aprendizaje Remoto: Accede al curso desde cualquier lugar, eliminando la necesidad de desplazamientos y permitiendo una mayor flexibilidad en horarios.
- Grabaciones Disponibles: Las sesiones en vivo pueden ser grabadas, asi podrás revisar el material en cualquier momento.
Motivación y Compromiso:
- Participación Activa: La interacción en tiempo real fomenta la participación activa y el compromiso, creando una mayor conexion con el instructor y otros estudiantes.
- Sesiones Dinámicas: Discusiones en vivo, ejercicios prácticos y demostraciones mantienen tu interés a lo largo del curso.
Resolución Inmediata de Problemas:
- Asistencia Inmediata: Resuelve dudas y problemas de manera inmediata, evitando la espera entre la formulación de preguntas y la obtención de respuestas.
Módulos
Módulo 1: Descripción General de Google Cloud Dataproc
- Creación y gestión de clústeres.
- Aprovechamiento de tipos de máquinas personalizadas y nodos de trabajo preemtivos.
- Escalado y eliminación de clústeres.
- Laboratorio: Creación de clústeres Hadoop con Google Cloud Dataproc.
Módulo 2: Ejecución de Trabajos en Dataproc
- Ejecución de trabajos Pig y Hive.
- Separación de almacenamiento y computación.
- Laboratorio: Ejecución de trabajos Hadoop y Spark con Dataproc.
- Laboratorio: Enviar y monitorizar trabajos.
Módulo 3: Integración de Dataproc con Google Cloud Platform
- Personalización de clústeres con acciones de inicialización.
- Soporte de BigQuery.
- Laboratorio: Aprovechamiento de los servicios de Google Cloud Platform.
Módulo 4: Interpretación de Datos No Estructurados con las APIs de Machine Learning de Google
- APIs de Machine Learning de Google.
- Casos de uso comunes de Machine Learning.
- Invocación de APIs de Machine Learning.
- Laboratorio: Añadir capacidades de Machine Learning al análisis de Big Data.
Módulo 5: Análisis de Datos sin Servidor con BigQuery
- ¿Qué es BigQuery?.
- Consultas y funciones.
- Laboratorio: Escribir consultas en BigQuery.
- Carga de datos en BigQuery.
- Exportación de datos desde BigQuery.
- Laboratorio: Carga y exportación de datos.
- Campos anidados y repetidos.
- Consulta de múltiples tablas.
- Laboratorio: Consultas complejas.
- Rendimiento y precios.
Módulo 6: Pipelines de Datos sin Servidor y Autoescalables con Dataflow
- Modelo de programación Beam.
- Pipelines de datos en Beam Python.
- Pipelines de datos en Beam Java.
- Laboratorio: Escribir un pipeline de Dataflow.
- Procesamiento escalable de Big Data usando Beam.
- Laboratorio: MapReduce en Dataflow.
- Incorporación de datos adicionales.
- Laboratorio: Entradas adicionales.
- Manejo de datos de transmisión.
- Arquitectura de referencia de GCP.
Módulo 7: Comenzando con Machine Learning
- ¿Qué es Machine Learning (ML)?.
- ML efectivo: conceptos, tipos.
- Conjuntos de datos de ML: generalización.
- Laboratorio: Explorar y crear conjuntos de datos de ML.
Módulo 8: Construcción de Modelos de ML con TensorFlow
- Comenzando con TensorFlow.
- Laboratorio: Usando tf.learn.
- Gráficos y bucles de TensorFlow + laboratorio.
- Laboratorio: Usando TensorFlow de bajo nivel + parada temprana.
- Monitorización del entrenamiento de ML.
- Laboratorio: Gráficos y gráficos del entrenamiento de TensorFlow
Módulo 9: Escalado de Modelos de ML con CloudML
- ¿Por qué Cloud ML?.
- Empaquetado de un modelo de TensorFlow.
- Entrenamiento de extremo a extremo.
- Laboratorio: Ejecutar un modelo de ML localmente y en la nube.
Módulo 10: Ingeniería de Características
- Creación de buenas características.
- Transformación de entradas.
- Características sintéticas.
- Preprocesamiento con Cloud ML.
- Laboratorio: Ingeniería de características.
Módulo 11: Arquitectura de Pipelines de Análisis de Streaming
- Procesamiento de datos de transmisión: Desafíos.
- Manejo de volúmenes de datos variables.
- Manejo de datos desordenados/tardíos.
- Laboratorio: Diseño de un pipeline de streaming.
Módulo 12: Ingesta de Volúmenes Variables
- ¿Qué es Cloud Pub/Sub?.
- Cómo funciona: Temas y suscripciones.
- Laboratorio: Simulador.
Módulo 13: Implementación de Pipelines de Streaming
- Desafíos en el procesamiento de transmisión.
- Manejo de datos tardíos: marcas de agua, desencadenantes, acumulación.
- Laboratorio: Pipeline de procesamiento de datos de transmisión para datos de tráfico en vivo.
Módulo 14: Análisis y Dashboards de Streaming
- Análisis de streaming: de datos a decisiones.
- Consulta de datos de transmisión con BigQuery.
- ¿Qué es Google Data Studio?.
- Laboratorio: Construir un dashboard en tiempo real para visualizar datos procesados.
Módulo 15: Alto Rendimiento y Baja Latencia con Bigtable
- ¿Qué es Cloud Spanner?.
- Diseño de esquema de Bigtable.
- Ingesta en Bigtable.
- Laboratorio: Ingesta de streaming en Bigtable.
T e s t i m o n i o s
¿Qué opinan nuestros alumnos de este curso?
¡Prepárate para ser inspirado por historias reales de éxito y crecimiento profesional!
Explora el impactante primer contacto que nuestros alumnos experimentan al unirse a nuestra comunidad educativa. Descubrirás por qué Executrain es tan apreciado por aquellos que buscan dominar las habilidades informáticas de vanguardia.
Invierte en tu FUTURO
¿Por qué aprender Data Engineering on Google Cloud Platform?
Aprender “Data Engineering on Google Cloud Platform” ofrece numerosos beneficios tanto a nivel profesional como organizacional.
1. Adquirir Habilidades Esenciales en Ingeniería de Datos
- Fundamentos de Big Data: Aprenderás los conceptos clave del Big Data, incluyendo la ingesta, el almacenamiento, la transformación y el análisis de grandes volúmenes de datos.
- Técnicas Avanzadas de Procesamiento de Datos: Desarrollarás habilidades en el uso de herramientas y servicios avanzados de Google Cloud, como Dataproc, Dataflow y BigQuery.
2. Dominar Herramientas de Google Cloud Platform (GCP)
- Servicios de GCP: El curso cubre una amplia gama de servicios de GCP, incluyendo BigQuery, Cloud Storage, Pub/Sub, y TensorFlow, entre otros. Esto te permitirá aprovechar al máximo las capacidades de la plataforma para la ingeniería de datos.
- Integración de Herramientas: Aprenderás a integrar diferentes herramientas y servicios para crear soluciones de datos completas y eficientes.
3. Experiencia Práctica y Aplicable
- Laboratorios Prácticos: El curso incluye numerosos laboratorios prácticos que simulan escenarios del mundo real, proporcionando experiencia directa en el uso de herramientas y servicios de GCP.
- Proyectos Reales: La experiencia práctica adquirida te permitirá aplicar lo aprendido en proyectos reales, mejorando tu capacidad para resolver problemas complejos en el ámbito laboral.
¿Deseas conocer más acerca de nuestros servicios?
En Executrain contamos con las mejores opciones para tu crecimiento profesional.
Aprende Data Engineering on Google Cloud Platform y prepárate para el futuro
¡Inscríbete ahora y haz que tu carrera despegue con nosotros!
V E R C U R S O S R E L A C I O N A D O S
Google Cloud Fundamentals: Core Infrastructure (GCF-CI)
Esta clase Google Cloud Fundamentals: Core Infrastructure (GCF-CI) de un día dirigida por un instructor proporciona una descripción general de los productos y servicios de Google Cloud Platform.
Architecting with Google Cloud Platform: Design and Process (AGCP-DP)
Esta clase Architecting With Google Cloud Platform: Design And Process (Agcp-Dp) de capacitación de dos días dirigida por un instructor prepara a los estudiantes para crear soluciones altamente confiables y eficientes en Google.
Architecting with Google Compute Engine (AGCE)
Esta clase Architecting With Google Compute Engine (Agce) de tres días dirigida por un instructor presenta a los participantes la infraestructura completa y flexible y los servicios de plataforma proporcionados por Google Cloud Platform
Networking in Google Cloud Platform (NGCP)
Este curso Networking in Google Cloud Platform (NGCP) de 2 días dirigido por un instructor brinda a los participantes un estudio amplio de las opciones de redes en Google Cloud Platform.