Aperçu du cours
Objectif de la formation : La formation vise à doter les participants de compétences pratiques pour manipuler, analyser et traiter de grands volumes de données en utilisant SQL, Hive et Spark DataFrames.
L’apprenant aura les connaissances nécessaires pour intégrer ces technologies afin d’optimiser l’extraction, la transformation et le chargement (ETL) des données dans des environnements Big Data.
Prérequis
- Connaissances de base en programmation SQL.
- Familiarité avec les concepts de base du traitement de données et des systèmes de gestion de bases de données.
- Une expérience préalable avec des outils de traitement de données comme Hive ou Spark est un plus, mais pas obligatoire.
Fonctionnalités
- Comprendre les rôles de SQL, Hive, et Spark dans l'écosystème Big Data.
- Être capable de réaliser des manipulations de données complexes et des analyses avec Hive.
- Maîtriser l'utilisation des Spark DataFrames pour le traitement de données à grande échelle.
- Intégrer SQL, Hive et Spark pour optimiser les processus ETL dans des projets Big Data.
Public ciblé
- Développeurs
- Ingénieurs Big Data
- Data analysts