Executrain-logo
Executrain-logo

CURSO DATA ENGINEERING ON GOOGLE CLOUD PLATFORM (DEGCP)

 

Esta clase Data Engineering On Google Cloud Platform (Degcp) de cuatro días dirigida por un instructor brinda a los participantes una introducción práctica al diseño y la construcción de sistemas de procesamiento de datos en Google Cloud Platform. A través de una combinación de presentaciones, demostraciones y laboratorios prácticos, los participantes aprenderán a diseñar sistemas de procesamiento de datos, crear canales de datos de extremo a extremo, analizar datos y llevar a cabo el aprendizaje automático. El curso cubre datos estructurados, no estructurados y de transmisión.

 

 

Duración:

4 días

Próximo curso:
Modalidades:
  • En Línea con instructor en vivo

Preparación para la certificación

• Examen GCP-DE
• Certificación Lograda: Google Cloud Certified Professional Data Engineer

Beneficios

Diploma Oficial Google Cloud Platform

Manual Digital Google Cloud Platform

Laboratorios Oficiales Google Cloud Platform

Garantía ExecuTrain

\

Curso dirigido a:

Esta clase está dirigida a desarrolladores experimentados que son responsables de administrar las transformaciones de big data, que incluyen:

  • Extraer, cargar, transformar, limpiar y validar datos
  • Diseño de tuberías y arquitecturas para el procesamiento de datos.
  • Creación y mantenimiento de modelos estadísticos y de aprendizaje automático
  • Consultar conjuntos de datos, visualizar resultados de consultas y crear informe

Requisitos previos:

Para aprovechar al máximo este curso, los participantes deben tener:

  • Completó el curso Google Cloud Fundamentals: Big Data and Machine Learning (GCF-BDM) O tenga experiencia equivalente
  • Competencia básica con el lenguaje de consulta común como SQL
  • Experiencia con actividades de modelado, extracción, transformación y carga de datos.Desarrollo de aplicaciones utilizando un lenguaje de programación común como Python.
  • Familiaridad con el aprendizaje automático y / o las estadísticas.
C E R T I F I C A C I Ó N

Google Cloud Certified

Professional Data Engineer

¿Qué es Google Cloud Certified Professional Data Engineer ?

La certificación Google Cloud Certified Professional Data Engineer es una credencial avanzada que valida la capacidad de un profesional para diseñar, construir, operar, asegurar y monitorear sistemas de procesamiento de datos en Google Cloud Platform (GCP). Esta certificación está orientada a aquellos que desean demostrar su competencia en el manejo de grandes volúmenes de datos y en la implementación de soluciones de análisis de datos avanzadas en la nube.

La certificación Google Cloud Certified Professional Data Engineer es una valiosa credencial para los profesionales que buscan demostrar y validar sus habilidades en la ingeniería de datos utilizando Google Cloud, ofreciendo numerosos beneficios tanto a nivel personal como organizacional.

¿Qué se evalua para obtener esta certificación?

  • Diseño de Soluciones de Procesamiento de Datos

    • Identificación de Requisitos: Analizar y traducir los requisitos empresariales en especificaciones técnicas para soluciones de datos.
    • Arquitecturas de Datos: Diseñar arquitecturas robustas y escalables que puedan manejar grandes volúmenes de datos de manera eficiente.
    • Selección de Tecnologías: Elegir las tecnologías y servicios de GCP adecuados para las diferentes etapas del procesamiento de datos.
  • Construcción y Mantenimiento de Pipelines de Datos

    • Ingesta y Almacenamiento de Datos: Crear pipelines que puedan ingerir, transformar y almacenar datos de manera eficiente usando herramientas como Dataflow, Pub/Sub, y Cloud Storage.
    • Transformación de Datos: Implementar transformaciones y procesos de limpieza de datos utilizando servicios como Dataprep y Dataproc.
  • Análisis de Datos y Machine Learning

    • BigQuery: Utilizar BigQuery para realizar análisis rápidos y eficientes de grandes conjuntos de datos mediante SQL.
    • Machine Learning: Implementar modelos de Machine Learning utilizando AI Platform, TensorFlow, y AutoML para resolver problemas específicos del negocio.
  • Seguridad y Gestión de Datos

    • Protección de Datos: Implementar medidas de seguridad para proteger los datos sensibles, incluyendo cifrado en tránsito y en reposo.
    • Gestión de Accesos: Configurar políticas y permisos adecuados para asegurar que solo las personas autorizadas tengan acceso a los datos.
  • Monitoreo y Optimización

    • Monitoreo de Sistemas: Configurar y utilizar herramientas de monitoreo como Stackdriver para supervisar el rendimiento y la salud de las soluciones de datos.
    • Optimización de Recursos: Optimizar el uso de recursos y costos operativos mediante la implementación de prácticas eficientes y ajustes en la configuración.

¿QUÉ APRENDERAS?

En el curso “Data Engineering on Google Cloud Platform”, los participantes aprenderán una variedad de habilidades y conceptos esenciales para diseñar, construir y gestionar soluciones de datos en Google Cloud.

N

Introducción a Google Cloud Platform para Ingeniería de Datos

  • Descripción General de GCP: Comprender los fundamentos de Google Cloud Platform y cómo soporta la ingeniería de datos.
  • Servicios Clave de GCP: Familiarizarse con los servicios de datos y análisis disponibles en GCP, como BigQuery, Cloud Storage, y Pub/Sub.
N

Ingesta de Datos y Almacenamiento

  • Ingesta de Datos: Aprender a ingerir datos de diversas fuentes utilizando servicios como Cloud Pub/Sub para transmisión de datos en tiempo real y Dataflow para procesamiento por lotes.
  • Almacenamiento de Datos: Explorar las opciones de almacenamiento de datos en GCP, incluyendo Cloud Storage para datos no estructurados y BigQuery para datos estructurados.
N

Procesamiento de Datos

  • Dataflow y Dataproc: Usar Dataflow para procesamiento en tiempo real y por lotes, y Dataproc para ejecutar trabajos de Hadoop y Spark en la nube.
  • Transformación de Datos: Implementar transformaciones de datos utilizando herramientas como Dataflow, que permite definir pipelines de datos escalables y eficientes.
N

Análisis de Datos

  • BigQuery: Aprender a ejecutar consultas SQL en grandes conjuntos de datos utilizando BigQuery, incluyendo técnicas de optimización de consultas y modelado de datos.
  • Data Studio: Utilizar Google Data Studio para crear informes y dashboards interactivos que visualicen los resultados del análisis de datos.
N

Machine Learning en GCP

  • AI Platform y TensorFlow: Implementar y entrenar modelos de Machine Learning utilizando AI Platform y TensorFlow.
  • AutoML: Usar AutoML para crear modelos de Machine Learning personalizados sin necesidad de un conocimiento profundo en Machine Learning.
  • APIs de ML: Integrar APIs preentrenadas de Google Cloud, como la API de Visión y la API de Lenguaje Natural, en aplicaciones y soluciones.
N

Arquitectura de Soluciones de Datos

  • Diseño de Arquitecturas de Datos: Aprender a diseñar arquitecturas de datos robustas y escalables que soporten grandes volúmenes de datos y diversos casos de uso.
  • Pipelines de Datos: Crear y gestionar pipelines de datos que incluyan ingesta, transformación, almacenamiento y análisis de datos.
  • Casos de Uso y Patrones de Diseño: Explorar casos de uso comunes y patrones de diseño para la ingeniería de datos en GCP.
N

Seguridad y Gestión de Datos

  • Protección de Datos: Implementar medidas de seguridad para proteger datos sensibles, incluyendo cifrado y políticas de acceso.
  • Gestión de Permisos y Roles: Configurar permisos y roles adecuados para asegurar que solo las personas autorizadas tengan acceso a los datos y recursos.
N

Monitoreo y Optimización

  • Monitoreo de Recursos: Utilizar herramientas como Stackdriver para monitorear el rendimiento de los sistemas y detectar problemas potenciales.
  • Optimización de Costos y Rendimiento: Implementar prácticas para optimizar el uso de recursos y reducir costos operativos sin comprometer el rendimiento.

METODOLOGÍA DE ESTUDIO EFECTIVA

Modalidad en linea con instructor en vivo.

Interacción Personalizada:
  • Enfoque Personalizado: Reciben atención personalizada y haz preguntas al instructor.
  • Retroalimentación Instantánea: Tu profesor en vivo te proporcionará  retroalimentación inmediata, lo que facilita la comprensión de conceptos y la corrección de errores.
Flexibilidad y Accesibilidad:
  • Aprendizaje Remoto: Accede al curso desde cualquier lugar, eliminando la necesidad de desplazamientos y permitiendo una mayor flexibilidad en horarios.
  • Grabaciones Disponibles: Las sesiones en vivo pueden ser grabadas, asi podrás revisar el material en cualquier momento.
Motivación y Compromiso:
  • Participación Activa: La interacción en tiempo real fomenta la participación activa y el compromiso, creando una mayor conexion con el instructor y otros estudiantes.
  • Sesiones Dinámicas: Discusiones en vivo, ejercicios prácticos y demostraciones mantienen tu interés a lo largo del curso.
Resolución Inmediata de Problemas:
  • Asistencia Inmediata: Resuelve  dudas y problemas de manera inmediata, evitando la espera entre la formulación de preguntas y la obtención de respuestas.

Módulos

Módulo 1: Descripción General de Google Cloud Dataproc
  • Creación y gestión de clústeres.
  • Aprovechamiento de tipos de máquinas personalizadas y nodos de trabajo preemtivos.
  • Escalado y eliminación de clústeres.
  • Laboratorio: Creación de clústeres Hadoop con Google Cloud Dataproc.
Módulo 2: Ejecución de Trabajos en Dataproc
  • Ejecución de trabajos Pig y Hive.
  • Separación de almacenamiento y computación.
  • Laboratorio: Ejecución de trabajos Hadoop y Spark con Dataproc.
  • Laboratorio: Enviar y monitorizar trabajos.
Módulo 3: Integración de Dataproc con Google Cloud Platform
  • Personalización de clústeres con acciones de inicialización.
  • Soporte de BigQuery.
  • Laboratorio: Aprovechamiento de los servicios de Google Cloud Platform.
Módulo 4: Interpretación de Datos No Estructurados con las APIs de Machine Learning de Google
  • APIs de Machine Learning de Google.
  • Casos de uso comunes de Machine Learning.
  • Invocación de APIs de Machine Learning.
  • Laboratorio: Añadir capacidades de Machine Learning al análisis de Big Data.
Módulo 5: Análisis de Datos sin Servidor con BigQuery
  • ¿Qué es BigQuery?.
  • Consultas y funciones.
  • Laboratorio: Escribir consultas en BigQuery.
  • Carga de datos en BigQuery.
  • Exportación de datos desde BigQuery.
  • Laboratorio: Carga y exportación de datos.
  • Campos anidados y repetidos.
  • Consulta de múltiples tablas.
  • Laboratorio: Consultas complejas.
  • Rendimiento y precios.
Módulo 6: Pipelines de Datos sin Servidor y Autoescalables con Dataflow
  • Modelo de programación Beam.
  • Pipelines de datos en Beam Python.
  • Pipelines de datos en Beam Java.
  • Laboratorio: Escribir un pipeline de Dataflow.
  • Procesamiento escalable de Big Data usando Beam.
  • Laboratorio: MapReduce en Dataflow.
  • Incorporación de datos adicionales.
  • Laboratorio: Entradas adicionales.
  • Manejo de datos de transmisión.
  • Arquitectura de referencia de GCP.
Módulo 7: Comenzando con Machine Learning
  • ¿Qué es Machine Learning (ML)?.
  • ML efectivo: conceptos, tipos.
  • Conjuntos de datos de ML: generalización.
  • Laboratorio: Explorar y crear conjuntos de datos de ML.
Módulo 8: Construcción de Modelos de ML con TensorFlow
  • Comenzando con TensorFlow.
  • Laboratorio: Usando tf.learn.
  • Gráficos y bucles de TensorFlow + laboratorio.
  • Laboratorio: Usando TensorFlow de bajo nivel + parada temprana.
  • Monitorización del entrenamiento de ML.
  • Laboratorio: Gráficos y gráficos del entrenamiento de TensorFlow
Módulo 9: Escalado de Modelos de ML con CloudML
  • ¿Por qué Cloud ML?.
  • Empaquetado de un modelo de TensorFlow.
  • Entrenamiento de extremo a extremo.
  • Laboratorio: Ejecutar un modelo de ML localmente y en la nube.
Módulo 10: Ingeniería de Características
  • Creación de buenas características.
  • Transformación de entradas.
  • Características sintéticas.
  • Preprocesamiento con Cloud ML.
  • Laboratorio: Ingeniería de características.
Módulo 11: Arquitectura de Pipelines de Análisis de Streaming
  • Procesamiento de datos de transmisión: Desafíos.
  • Manejo de volúmenes de datos variables.
  • Manejo de datos desordenados/tardíos.
  • Laboratorio: Diseño de un pipeline de streaming.
Módulo 12: Ingesta de Volúmenes Variables
  • ¿Qué es Cloud Pub/Sub?.
  • Cómo funciona: Temas y suscripciones.
  • Laboratorio: Simulador.
Módulo 13: Implementación de Pipelines de Streaming
  • Desafíos en el procesamiento de transmisión.
  • Manejo de datos tardíos: marcas de agua, desencadenantes, acumulación.
  • Laboratorio: Pipeline de procesamiento de datos de transmisión para datos de tráfico en vivo.
Módulo 14: Análisis y Dashboards de Streaming
  • Análisis de streaming: de datos a decisiones.
  • Consulta de datos de transmisión con BigQuery.
  • ¿Qué es Google Data Studio?.
  • Laboratorio: Construir un dashboard en tiempo real para visualizar datos procesados.
Módulo 15: Alto Rendimiento y Baja Latencia con Bigtable
  • ¿Qué es Cloud Spanner?.
  • Diseño de esquema de Bigtable.
  • Ingesta en Bigtable.
  • Laboratorio: Ingesta de streaming en Bigtable.

T e s t i m o n i o s

¿Qué opinan nuestros alumnos de este curso?

Luis Alberto SánchezLuis Alberto Sánchez
15:40 31 May 24
Anteriromente tome el curso de PL-100 y ahora terminé el curso PL-200 , algo que le califico con 10 es que los instructores son personas con mucha experiencia y tiene todos los conocimientos para sacarte de dudas, son pacientes y puedes sacar mucho provecho de ello, recomiendo ampliamante esta empresa de capacitación.
Buena opción de capacitación, los instructores respetuosos y capacitados.
Acabo de terminar curso de Introduction to Python y sinceramente el instructor dejó todo el contenido muy claro, la dinámica práctica del curso excepcional. Felicidades
Fer De la CruzFer De la Cruz
16:44 10 May 24
Tomé con ellos el Curso de Power BI y la verdad excelente, la organización y el instructor muy buenos. Recomendado ampliamente.
Acabo de terminar el curso de Power BI que tomé en línea con ellos, la verdad me gustó mucho, el instructor super paciente y muy bien capacitado, explicó las actividades paso por paso y se aseguraba de que todo el grupo fuera siguiendo punto por punto cada ejercicio para que nadie se quedara atrás.Muy recomendado. 🙂
Tome el curso de VMWARE Vsphere 8 install and configurationEl instructor muy capacitado y atendio diversas dudas incluso aunque fuera temas mas avanzados al alcance del curso, una atencion excelente ya que en otros lados me a tocado que solo lo que es al momento y ya, totalmente recomendado
Montserrat CruzMontserrat Cruz
15:17 08 Mar 24
Tome el curso de ITIL 4 en linea la cual me gusto mucho porque el instructor realizo actividades dinamicas , realizamos actividades interactivas en Miro, tambien se hacian preguntas de cada modulo desde mentimeter. El instructor viene muy bien preparado y con conocimiento entendible.
jose guzmanjose guzman
14:59 18 Jan 24
Yo tome el curso de power BI, el profesor muy profecional y preparado, el curso lo impartio muy dinamico. aprendi tanto el uso general de la herramienta como las posibles aplicaciones. lo recomiendo.
Excelente empresa para capacitarte en tecnologías de información. Altamente recomendable.
Excelente curso muy profesional siempre es una forma eficiente de capacitarte y con garantia de cada curso Excelente desde Monterrey
Ivan Gomez MuñozIvan Gomez Muñoz
23:54 21 Dec 23
Alonso SigalaAlonso Sigala
17:47 21 Dec 23
tomé el curso de RH294; Los instructores fueron muy profesionales al igual que el curso; La atención de Executrain es inigualable y sin duda volveré a solicitarles cursos/certificaciones
Tomé un curso de Power BI y me agradó la forma en que se imparte. Clases prácticas, entrenamiento en plataformas, presentaciones claras y precisas. Instructor capacitado y con gran facilidad para explicar.
Mauricio RuizMauricio Ruiz
14:27 05 Dec 23
Tomé el curso de Power BI con ellos y la verdad me gusto mucho. El instructor esta muy bien capacitado, explica muy bien y el curso fié teórico y practico lo que permite reforzar y saber el por que de cada proceso y lo intuitivo que se vuelve el curso con cada práctica.
Carnage SoulEdgeCarnage SoulEdge
14:47 30 Nov 23
Super recomendable para recibir capacitaciones especializadas sobre tecnología. Instructores calificados y certificados que enseñan con laboratorios pre configurados.He tomado cursos con ellos antes de la pandemia y hace poco volví a asistir para presentar exámenes de certificación, no han cambiado en su buen servicio y atención.
Monica HernandezMonica Hernandez
20:59 17 Nov 23
Tomé el curso de Scrum Master con ellos y la verdad me encantó. La instructora esta muy bien capacitada, explica muy bien y el curso fué teórico práctico lo cuál lo hizo muy interesante y me permitió hacer networking con profesionales de otras empresas.
Vladimir GuzmanVladimir Guzman
16:31 08 Mar 23
Excelente profesor, con mucha experiencia en el sector; y fue un curso a un costo muy accesible para la compañía, incluía certificación. tuve problemas con los labs pero si hicieron lo posible para dejarlos una semana mas.
Fabricio TorresFabricio Torres
19:21 20 Feb 23
un curso muy interesante, buen instructor,contenido excelenteFundamentals of Ethical Hacking and Penetration Testing
buena opción en capacitación, atención excelente y te brindan muy buen servicio, sus cursos excelentes
Eric RamosEric Ramos
21:58 04 Apr 22
Excelente la atencion durante los cursos virtuales, asi como los instructores cuentan con aplios conocimientos en el tema.Recomendables cien por ciento
JESUS AVILAJESUS AVILA
16:21 26 Mar 22
Tomé el curso de manera remota, muy buena disposición del instructor cumpliendo con las expectativas y respondiendo todas las dudas de los participantes. El material utilizado para el desarrollo de las actividades muy bueno y nos sirve como guía para trabajos futuros.
js_loader

¡Prepárate para ser inspirado por historias reales de éxito y crecimiento profesional!

Explora el impactante primer contacto que nuestros alumnos experimentan al unirse a nuestra comunidad educativa. Descubrirás por qué Executrain es tan apreciado por aquellos que buscan dominar las habilidades informáticas de vanguardia.

Invierte en tu FUTURO

¿Por qué aprender Data Engineering on Google Cloud Platform?

Aprender “Data Engineering on Google Cloud Platform” ofrece numerosos beneficios tanto a nivel profesional como organizacional.

1. Adquirir Habilidades Esenciales en Ingeniería de Datos

  • Fundamentos de Big Data: Aprenderás los conceptos clave del Big Data, incluyendo la ingesta, el almacenamiento, la transformación y el análisis de grandes volúmenes de datos.
  • Técnicas Avanzadas de Procesamiento de Datos: Desarrollarás habilidades en el uso de herramientas y servicios avanzados de Google Cloud, como Dataproc, Dataflow y BigQuery.

2. Dominar Herramientas de Google Cloud Platform (GCP)

  • Servicios de GCP: El curso cubre una amplia gama de servicios de GCP, incluyendo BigQuery, Cloud Storage, Pub/Sub, y TensorFlow, entre otros. Esto te permitirá aprovechar al máximo las capacidades de la plataforma para la ingeniería de datos.
  • Integración de Herramientas: Aprenderás a integrar diferentes herramientas y servicios para crear soluciones de datos completas y eficientes.

3. Experiencia Práctica y Aplicable

  • Laboratorios Prácticos: El curso incluye numerosos laboratorios prácticos que simulan escenarios del mundo real, proporcionando experiencia directa en el uso de herramientas y servicios de GCP.
  • Proyectos Reales: La experiencia práctica adquirida te permitirá aplicar lo aprendido en proyectos reales, mejorando tu capacidad para resolver problemas complejos en el ámbito laboral.

¿Deseas conocer más acerca de nuestros servicios?

 En Executrain contamos con las mejores opciones para tu crecimiento profesional.










    Regístrate para Recibir Nuestras Promociones!


    Aprende Data Engineering on Google Cloud Platform y prepárate para el futuro

    Aprender “Data Engineering on Google Cloud Platform” te proporcionará habilidades técnicas avanzadas, experiencia práctica y conocimientos aplicables que mejorarán tus oportunidades profesionales y contribuirán significativamente al éxito de tu organización.

     

     

     

    ¡Inscríbete ahora y haz que tu carrera despegue con nosotros!

    Executrain-logo
    V E R  C U R S O S   R E L A C I O N A D O S

    Google Cloud Fundamentals: Core Infrastructure (GCF-CI)

     

     

    Esta clase Google Cloud Fundamentals: Core Infrastructure (GCF-CI) de un día dirigida por un instructor proporciona una descripción general de los productos y servicios de Google Cloud Platform. 

    Architecting with Google Cloud Platform: Design and Process (AGCP-DP)

    Esta clase Architecting With Google Cloud Platform: Design And Process (Agcp-Dp) de capacitación de dos días dirigida por un instructor prepara a los estudiantes para crear soluciones altamente confiables y eficientes en Google.

    Architecting with Google Compute Engine (AGCE)

     

    Esta clase Architecting With Google Compute Engine (Agce) de tres días dirigida por un instructor presenta a los participantes la infraestructura completa y flexible y los servicios de plataforma proporcionados por Google Cloud Platform

    Networking in Google Cloud Platform (NGCP)

     

    Este curso Networking in Google Cloud Platform (NGCP) de 2 días dirigido por un instructor brinda a los participantes un estudio amplio de las opciones de redes en Google Cloud Platform. 

    Abrir chat
    ¿Necesitas ayuda?
    ¡Hola! Buen día,
    ¿Te podemos ayudar con información sobre alguno de nuestros cursos?