600 € – 660 €

Apache Spark con Scala (1ª edición)

Información sobre el evento

Comparte este evento

Fecha y hora

Ubicación

Ubicación

Offiplace

C\Fernando VI, 17

1º Izda

28004 Madrid

Spain

Ver mapa

Política de reembolso

Política de reembolso

Reembolsos hasta 1 día antes del evento

La tarifa de Eventbrite no es reembolsable.

Descripción del evento

Descripción

Resumen

Este curso ofrece una introducción avanzada a la programación distribuida con Apache Spark en Scala. El curso se centra en dotar al alumno de conocimientos sobre los fundamentos del modelo de computación de Spark, ilustrándolo a través de numerosos ejemplos interactivos. Además se explicará cómo analizar la eficiencia de programas utilizando las herramientas que Spark pone a nuestra disposición, como SparkUI, y se explicarán las técnicas que permiten obtener el máximo beneficio de las optimizaciones que Spark ofrece a los programadores a través de ejercicios prácticos de patrones y antipatrones.

Audiencia

  • Programadores con nociones básicas de Scala, interesados en introducirse en el mundo del Big Data
  • Desarrolladores de Big Data que quieran mejorar sus habilidades sobre Spark, independientemente de su experiencia previa con el lenguaje de programación Scala

Objetivos

Al terminar el curso, los alumnos serán capaces de:

  • Comprender en profundidad el modelo de computación de Spark
  • Desarrollar procesos ETL con Spark de una forma modular y testable
  • Identificar y resolver problemas habituales en Spark, particularmente de rendimiento

Temario

  • Modelo de computación I: Introducción
    • Transformaciones y acciones
    • Computación distribuida
    • Transformaciones narrow vs. wide
    • Transformaciones: joins
    • Cacheo
  • Modelo de computación II: Plan de ejecución
    • Jobs, stages y tasks
    • Gestores de clúster: Yarn, Standalone, Mesos
    • Driver y executors
    • SparkUI
  • APIs
    • Los lenguajes de Spark: SparkSQL, RDDs, ML, GraphX
    • Dataset: Type safe
    • DataFrame: Type unsafe
    • Datasets vs DataFrames
  • Lectura y escritura de datos
    • Ficheros: JSON, Parquet
    • Bases de datos: JDBC, NoSQL
  • Patrones y antipatrones
    • Gestión de memoria
    • Problemas de serialización
    • Cacheo
    • Tareas que no terminan
    • Estructura del workflow (ETL)
    • Testing

Organización

  • Las explicaciones en el aula alternarán el uso de transparencias y ejemplos de programación en live-coding utilizando notebooks, con una preferencia por este último medio. Al terminar cada bloque de contenido se propondrán pequeños ejercicios y retos para ser resueltos en clase.
  • Después de cada sesión, se propondrá a los asistentes la resolución de una serie de ejercicios adicionales que podrán subirse al repositorio Github del curso. El equipo de Habla Computing proporcionará feedback por medio de revisiones de código a todos aquellos que completen dichos ejercicios dentro de un plazo determinado de tiempo.

Sobre los profesores

El curso será impartido por Alfonso Roa Redondo y Mikel San Vicente Maeztu. Alfonso y Mikel son arquitectos funcionales en Habla Computing. Llevan usando Scala desde hace más de 5 años en aplicaciones en dominios variados como financiero, predictive marketing, retail, paquetería, obras publicas, etc. Tienen amplia experiencia en consultoría con proyectos con Spark, Akka y otros frameworks del ecosistema de Scala. Alfonso es co-organizador del Meetup de Scala de Madrid (ScalaMad)

Más información en ...

http://www.hablapps.com/index.html#spark-101-es

Si no puedes asistir y quieres estar enterado de próximas convocatorias apúntate a nuestra lista

http://eepurl.com/dgGDwX

Comparte con tus amigos

Fecha y hora

Ubicación

Offiplace

C\Fernando VI, 17

1º Izda

28004 Madrid

Spain

Ver mapa

Política de reembolso

Reembolsos hasta 1 día antes del evento

La tarifa de Eventbrite no es reembolsable.

Guarda este evento

Evento guardado