Formation Pig, Hive et Impala

Votre devis en 3 clics

  • Un support et les exercices du cours pour chaque stagiaire
  • Un formateur expert ayant suivi une formation à la pédagogie
  • Boissons offertes pendant les pauses en inter-entreprises
  • Salles lumineuses et locaux facilement accessibles
  • Méthodologie basée sur l'Active Learning : 75% de pratique minimum
  • Matériel pour les formations présentielles informatiques : un PC par participant
  • Evaluation de fin de formation : Certification CPF ou mise en situation notée par le formateur
Durée :
4 jours
Public :
techniciens et spécialistes des bases de données, responsables, analystes métier et professionnels BI, souhaitant utiliser les technologies Big Data dans leur entreprise
Pré-requis :
Connaissances fondamentales des bases de données et de SQL sont un atout majeur
Objectifs :
- Manipuler des ensembles de données complexes stockés dans Hadoop sans avoir à écrire de code complexe avec Java - Automatiser le transfert des données dans le stockage Hadoop avec Flume et Sqoop - Filtrer les données avec les opérations Extract-Transform-Load (ETL) avec Pig - Interroger plusieurs ensembles de données pour une analyse avec Pig et Hive
Sanction :
Attestation de fin de stage mentionnant le résultat des acquis
Référence :
BUS100295-F
Demandeurs d'emploi :
Contactez-nous pour connaître les remises Pôle Emploi
Téléchargez le PDF

Introduction

Vue d'ensemble de Hadoop
Analyser les composants Hadoop
Définir l'architecture Hadoop

Stocker les données dans HDFS

Réaliser un stockage fiable et sécurisé
Surveiller les mesures du stockage
Contrôler HDFS à partir de la ligne de commande

Traitement parallèle avec MapReduce

Détailler l'approche MapReduce
Transférer les algorythmes et non les données
Décomposer les étapes clés d'une tâche MapReduce

Automatiser le transfert des données

Faciliter l'entrée et la sortie des données
Agréger les données avec Flume
Configurer le fan in et le fan out des données
Déplacer les données relationnelles avec Sqoop

Décrire les caractéristiques d'Apache Pig

Exposer les différences entre Pig et MapReduce
Identifier les cas d'utilisation de Pig
Identifier les configurations clés de Pig

Structurer les données non structurées

Représenter les données dans le modèle de données de Pig
Exécuter les commandes Pig Latin au Grunt Shell
Exprimer les transformations dans la syntaxe Pig Latin
Appeler les fonctions de chargement et de stockage

Transformer les données avec les opérateurs relationnels

Créer des nouvelles relations avec des jointures
Réduire la taille des données par échantillonnage
Exploiter Pig et les fonctions définies par l'utilisateur

Filtrer les données avec Pig

Consolider les ensembles de données avec les unions
Partitionner les ensembles de données avec les splits
Ajouter des paramètres dans des scripts Pig

Exploiter les avantages métier de Hive

Factoriser Hive en composants
Imposer la structure sur les données avec Hive

Organiser les données dans Hive

Créer des bases de données et des tables Hive
Exposer les différences entre les types de données dans Hive
Charger et stocker les données efficacement avec SerDes

Concevoir la disposition des données pour la performance

Remplir les tables à partir de requêtes
Partitionner les tables de Hive pour des requêtes optimales
Composer des requêtes HiveQL

Réaliser des jointures sur des données non structurées

Distinguer les jointures disponibles dans Hive
Optimiser la structure des jointures pour les performances

Repousser les limites de HiveQL

Trier, répartir et regrouper des données
Réduire la complexité des requêtes avec les vues
Améliorer la performance des requêtes avec les index

Déployer Hive en production

Concevoir les schémas de Hive
Établir la compression des données
Déboguer les scripts de Hive

Rationaliser la gestion du stockage avec HCatalog

Unifier la vue des données avec HCatalog
Exploiter HCatalog pour accéder au metastore Hive
Communiquer via les interfaces HCatalog
Remplir une table Hive à partir de Pig

Traitement parallèle avec Impala

Décomposer les composants fondamentaux d'Impala
Soumettre des requêtes à Impala
Accéder aux données Hive à partir d'Impala

Lancer le framework Spark

Réduire le temps d'accès aux données avec Shark
Interroger les données Hive avec Shark


CopyrightDepot Dawan
Dates à Bordeaux

Du 23/03/2020 au 26/03/2020

Du 06/07/2020 au 09/07/2020

Du 05/10/2020 au 08/10/2020

Dates à Bruxelles

Du 09/12/2019 au 12/12/2019

Du 16/03/2020 au 19/03/2020

Du 22/06/2020 au 25/06/2020

Du 21/09/2020 au 24/09/2020

Du 21/12/2020 au 24/12/2020

Dates à Geneve

Du 13/01/2020 au 16/01/2020

Du 06/04/2020 au 09/04/2020

Du 27/07/2020 au 30/07/2020

Du 19/10/2020 au 22/10/2020

Dates à Lille

Du 09/12/2019 au 12/12/2019

Du 16/03/2020 au 19/03/2020

Du 29/06/2020 au 02/07/2020

Du 28/09/2020 au 01/10/2020

Dates à Luxembourg

Du 09/12/2019 au 12/12/2019

Du 06/01/2020 au 09/01/2020

Du 30/03/2020 au 02/04/2020

Du 06/07/2020 au 09/07/2020

Du 05/10/2020 au 08/10/2020

Dates à Lyon

Du 13/01/2020 au 16/01/2020

Du 06/04/2020 au 09/04/2020

Du 27/07/2020 au 30/07/2020

Du 19/10/2020 au 22/10/2020

Dates à Marseille

Du 20/01/2020 au 23/01/2020

Du 14/04/2020 au 17/04/2020

Du 27/07/2020 au 30/07/2020

Du 19/10/2020 au 22/10/2020

Dates à Montpellier

Du 20/01/2020 au 23/01/2020

Du 14/04/2020 au 17/04/2020

Du 27/07/2020 au 30/07/2020

Du 19/10/2020 au 22/10/2020

Dates à Nantes

Du 23/03/2020 au 26/03/2020

Du 20/07/2020 au 23/07/2020

Du 12/10/2020 au 15/10/2020

Dates à Nice

Du 13/01/2020 au 16/01/2020

Du 06/04/2020 au 09/04/2020

Du 27/07/2020 au 30/07/2020

Du 19/10/2020 au 22/10/2020

Dates à Paris

Du 09/12/2019 au 12/12/2019

Du 06/01/2020 au 09/01/2020

Du 30/03/2020 au 02/04/2020

Du 27/07/2020 au 30/07/2020

Du 19/10/2020 au 22/10/2020

Dates à Rennes

Du 23/03/2020 au 26/03/2020

Du 06/07/2020 au 09/07/2020

Du 05/10/2020 au 08/10/2020

Dates à Strasbourg

Du 09/12/2019 au 12/12/2019

Du 06/01/2020 au 09/01/2020

Du 30/03/2020 au 02/04/2020

Du 06/07/2020 au 09/07/2020

Du 05/10/2020 au 08/10/2020

Dates à Toulouse

Du 20/01/2020 au 23/01/2020

Du 14/04/2020 au 17/04/2020

Du 27/07/2020 au 30/07/2020

Du 19/10/2020 au 22/10/2020

Transmettre l’envie d'apprendre, de comprendre, de progresser, de partager : c'est ce qui nous motive chaque jour pour améliorer sans cesse l'entreprise, le travail de nos équipes et la satisfaction de nos clients.
C'est pour cela que nous mettons tout en œuvre pour vous accueillir dans le meilleur des cadres, avec les meilleurs contenus, les meilleurs formateurs, des supports constamment renouvelés et une démarche commerciale résolument innovante.

GAGNER EN QUALITE

Depuis 2000, nous progressons continuellement pour faire évoluer notre catalogue, nos cours, nos supports, notre accueil et notre pédagogie. Nous sommes certifiés OPQF depuis la rentrée 2012 et poursuivons notre démarche qualité en formant constamment nos intervenants aux nouvelles techniques pédagogiques et aux évolutions technologiques.

DEVELOPPER NOTRE EQUIPE DE FORMATEURS INTERNES

Nous avons développé une équipe de professionnels de la pédagogie qui interviennent pour notre propre compte ainsi qu'en sous-traitance pour la plupart de nos confrères. Nous bénéficions ainsi d'une très riche expérience de l'enseignement en nous confrontant constamment à la quasi-globalité des contenus et outils pédagogiques du marché de la formation professionnelle.

ASSURER UNE REACTIVITE COMMERCIALE

Notre équipe de commerciaux est parfaitement formée aux nouvelles technologies et saura répondre à tous les besoins en moins de 48h. Disponibilité, programme, coût : vous aurez une réponse appropriée, claire et vraiment rapide.

CREER DES SUPPORTS INNOVANTS

Nous veillons à ce que nos clients soient parfaitement satisfaits des supports que nous offrons. Aussi, nous avons développé des produits internes très efficaces que nous mixons avec les meilleurs supports du marché. A cela s'ajoute un tutorat mail pendant 30 jours pour que chaque stagiaire puisse poser toutes les questions qui lui viennent après le cours.

SOIGNER L'ACCUEIL DE NOS CLIENTS

Nous mettons un point d'honneur à ce que nos clients soient parfaitement accueillis quand ils viennent chez nous : prise en charge dès leur arrivée, boissons et viennoiseries aux pauses, repas avec les autres stagiaires et formateurs, questions/réponses après les cours. Nos formations représentent une étape de progression et de réflexion dans la carrière de nos clients et nous souhaitons qu'elle se fasse dans les meilleures conditions.

DISPOSER D'UN ENVIRONNEMENT PRIVILEGIE

Nous vous accueillons dans des salles parfaitement adaptées à l'apprentissage : des machines très puissantes pour les formations gourmandes en ressources, des salles lumineuses et climatisées, des locaux faciles d'accès en centre ville et à proximité immédiate des gares etc. Tout a été pensé pour votre confort !

PARTAGER NOTRE SENS DU SERVICE

Nous voulons continuer à vous apporter le meilleur service au meilleur coût. Sollicitez Dawan pour vos besoins de formations et vous découvrirez un organisme réellement désireux de participer à la réussite des projets de ses clients.

formation

Datadock

Dawan bénéficie du soutien du FRED

TOSA
logo OPQF
logo FFP