Aucun article dans le panier.
Big Data : fondamentaux, outils et cas pratiques
Réf. : DAT0027
Durée (en heure) : 14.0
Public : Data analysts débutants, développeurs, chefs de projet, consultants, fonctions IT
Prérequis :
Notions de base en informatique. Connaissance de la gestion de données (tableurs, par exemple). Intérêt pour les nouvelles technologies et la transformation numérique.
Jour 1 – Panorama du Big Data & traitement des données
Matinée (3h30)
🔹 Introduction au Big Data
-
Définition, 5V (Volume, Vitesse, Variété, Véracité, Valeur)
-
Enjeux pour les entreprises (ROI, gouvernance, métiers)
-
Différence Data Lake / Data Warehouse
-
Cas d’usage concrets (marketing, industrie, santé…)
🔹 Écosystèmes technologiques du Big Data
-
Hadoop, Spark, NoSQL, stockage distribué
-
Présentation rapide d’une architecture Big Data moderne (sur cloud ou locale)
-
Introduction aux pipelines de données
Après-midi (3h30)
🔹 Collecte et traitement des données massives
-
Outils ETL : Talend, Apache NiFi, Airbyte
-
Formats courants : CSV, JSON, API, logs
-
Cas pratique : automatiser un flux de collecte et transformation
🔹 Manipulation de données avec Spark ou Python (Pandas)
-
Lecture, nettoyage, filtrage, agrégation
-
Atelier : mini-pipeline de traitement sur données volumineuses
Jour 2 – Analyse et restitution des données
Matinée (3h30)
🔹 Méthodes d’analyse orientées Big Data
-
Classification, segmentation, prédiction simple
-
Outils : Python (Scikit-learn) ou R
-
Atelier pratique : mini-modèle de scoring ou d’analyse client
🔹 Datavisualisation et restitution
-
Outils : Power BI, Looker Studio, Apache Superset
-
Atelier : créer un dashboard interactif pour restituer des résultats d’analyse
-
Bonnes pratiques de présentation des données (Data storytelling)
Après-midi (3h30)
🔹 Cas pratique final : chaîne complète de traitement
-
Du chargement à la visualisation (pipeline + analyse + dashboard)
-
Application possible sur données d’e-réputation, satisfaction client ou performance interne
🔹 Clôture et perspectives
-
Débriefing collectif
-
Ressources pour progresser : plateformes, MOOC, communautés
-
Quiz de fin de formation & évaluation des acquis
OBJECTIFS VISÉS
-
Comprendre les concepts clés du Big Data et son apport pour les entreprises.
-
Manipuler des outils et architectures modernes pour stocker, traiter et analyser des données massives.
-
Savoir extraire de la valeur métier à partir de données hétérogènes et complexes.
VALIDATION DES ACQUIS
- 60 % théorie / 40 % pratique
- Études de cas, démonstrations, ateliers techniques (ETL, Hadoop, DataViz)
- Support de formation PDF + exercices corrigés remis aux participants
- Auto-évaluation en début et en fin de parcours