Big Data : fondamentaux, outils et cas pratiques

Réf. : DAT0027

Durée (en heure) : 14.0

Public : Data analysts débutants, développeurs, chefs de projet, consultants, fonctions IT

Prérequis :
Notions de base en informatique. Connaissance de la gestion de données (tableurs, par exemple). Intérêt pour les nouvelles technologies et la transformation numérique.

Télécharger la brochure

Jour 1 – Panorama du Big Data & traitement des données

Matinée (3h30)

🔹 Introduction au Big Data

  • Définition, 5V (Volume, Vitesse, Variété, Véracité, Valeur)

  • Enjeux pour les entreprises (ROI, gouvernance, métiers)

  • Différence Data Lake / Data Warehouse

  • Cas d’usage concrets (marketing, industrie, santé…)

🔹 Écosystèmes technologiques du Big Data

  • Hadoop, Spark, NoSQL, stockage distribué

  • Présentation rapide d’une architecture Big Data moderne (sur cloud ou locale)

  • Introduction aux pipelines de données

Après-midi (3h30)

🔹 Collecte et traitement des données massives

  • Outils ETL : Talend, Apache NiFi, Airbyte

  • Formats courants : CSV, JSON, API, logs

  • Cas pratique : automatiser un flux de collecte et transformation

🔹 Manipulation de données avec Spark ou Python (Pandas)

  • Lecture, nettoyage, filtrage, agrégation

  • Atelier : mini-pipeline de traitement sur données volumineuses

Jour 2 – Analyse et restitution des données

Matinée (3h30)

🔹 Méthodes d’analyse orientées Big Data

  • Classification, segmentation, prédiction simple

  • Outils : Python (Scikit-learn) ou R

  • Atelier pratique : mini-modèle de scoring ou d’analyse client

🔹 Datavisualisation et restitution

  • Outils : Power BI, Looker Studio, Apache Superset

  • Atelier : créer un dashboard interactif pour restituer des résultats d’analyse

  • Bonnes pratiques de présentation des données (Data storytelling)

Après-midi (3h30)

🔹 Cas pratique final : chaîne complète de traitement

  • Du chargement à la visualisation (pipeline + analyse + dashboard)

  • Application possible sur données d’e-réputation, satisfaction client ou performance interne

🔹 Clôture et perspectives

  • Débriefing collectif

  • Ressources pour progresser : plateformes, MOOC, communautés

  • Quiz de fin de formation & évaluation des acquis


Prérequis de la formation

Notions de base en informatique. Connaissance de la gestion de données (tableurs, par exemple). Intérêt pour les nouvelles technologies et la transformation numérique.

Réf. : DAT0027

Durée (en heure) : 14.0

Public : Data analysts débutants, développeurs, chefs de projet, consultants, fonctions IT

Documents à télécharger

Télécharger la brochure PDF

OBJECTIFS VISÉS

  • Comprendre les concepts clés du Big Data et son apport pour les entreprises.

  • Manipuler des outils et architectures modernes pour stocker, traiter et analyser des données massives.

  • Savoir extraire de la valeur métier à partir de données hétérogènes et complexes.

VALIDATION DES ACQUIS

  • 60 % théorie / 40 % pratique
  • Études de cas, démonstrations, ateliers techniques (ETL, Hadoop, DataViz)
  • Support de formation PDF + exercices corrigés remis aux participants
  • Auto-évaluation en début et en fin de parcours