Formateur Ziggourat

Datagouvernance : analyser et Maitriser ses données pour l'IA

Cette formation de deux jours vous permettra d'acquérir une compréhension approfondie des méthodes d'analyse de données et des techniques de nettoyage et de management des données. Vous apprendrez à utiliser Python et Pandas pour l'analyse de données, à transformer les variables qualitatives et à normaliser les données. Vous découvrirez également les méthodes avancées d'analyse, y compris la régression linéaire et les tests statistiques. Enfin, vous aurez l'occasion d'expérimenter avec des modèles non-linéaires de machine learning tels que K-means, Tree, Random Forest.

14 heures sur 2 jours

à Paris & à distance
(Zoom, Google Meet, etc.).
Nous nous engageons à vous répondre dans un délai de 48h

1 500 € HT / personne

Etudions ensemble vos options de financement
Contactez-nous pour monter votre dossier !

QUALIOPI

8 stagiaires maximum par session.
Découvrez les autres engagements qualité qui font la marque de Ziggourat Formation

Objectifs de la formation

Datagouvernance : analyser et Maitriser ses données pour l'IA

Comprendre les méthodes d'analyse de données et les techniques de nettoyage et de management des données.
Maîtriser l'utilisation de Python et de Pandas pour l'analyse de données.
Apprendre à transformer les variables qualitatives et à normaliser les données.
Découvrir les méthodes avancées d'analyse, y compris la régression linéaire et les tests statistiques.
Expérimenter avec des modèles non-linéaires de machine learning tels que K-means, Tree, Random Forest.

Pré-requis

Bonne connaissance et pratique des fondamentaux de Python et de Pandas

Pour qui ?

Cette formation s'adresse à toute personne souhaitant développer des compétences d'analyse et de management de la donnée avec Python. Que vous soyez un professionnel cherchant à améliorer vos compétences en data analyse, un étudiant cherchant à approfondir vos connaissances, ou simplement un passionné de data science, cette formation est faite pour vous.

Avoir suivi

Aucun programme supplémentaire n'est requis pour suivre cette formation.

Au programme

Introduction à Pandas et importation des données

  • Présentation de la bibliothèque Pandas
  • Importation de données (csv)
  • Découverte de la structure des DataFrames et des Series
  • Aperçu des données importées : head, info

Exploration et analyse univariée

  • Identification et comptage des types de données
  • Statistiques descriptives : mean vs median, std, quantile
  • Visualisations (histogram, pie-chart, boxplot)

Nettoyage des données

  • Suppression des constantes, doublons et autres variables inutiles
  • Gestion des valeurs manquantes : suppression et méthodes d'imputation
  • Détection et gestion des valeurs aberrantes (Z-score, IQR)

Méthodes d'aggregation

  • Sélection et filtrage des données
  • Regrouppements et pivots
  • Jointures et concaténations

Analyse bi/multi-variée

  • Analyse des Corrélations
  • Visualisations (line/scatter plot, heatmap)
  • Analyse en composantes principales (ACP)

Feature engineering

  • Transformation variable qualitative (one-hot encoder)
  • Normalisation, logarisation
  • Création variables : catégorisation, simplification (dates en saisons / age)

Méthodes avancées d'analyse

  • Régression Linéaire : sklearn vs statsmodels
  • Tests statistiques (Pearson, ANOVA, non-paramétriques)
  • Modèles non-linéaires (machine learning) : K-means, Tree, Random Forest

Librairies complémentaires

  • Pandas profiling
  • Missingno
  • Plotly

Méthode pédagogique

8 participants maximum, un poste par stagiaire et un support de cours est remis en fin de stage. La formation est constituée d'apports théoriques, de démonstrations et de mises en pratique basées sur des exercices (méthode démonstrative).

Accessibilité

Cette formation est accessible aux personnes en situation de handicap.

Modalité de validation des acquis

Évaluation continue des connaissances via des exercices et/ou ateliers et des acquis via un questionnaire en fin de formation. Attestation de fin de stage (certificat de réalisation). Émargement quotidien d'une feuille de présence.

Obtenir des informations

sur une prochaine session
Voir d'autres avis
du 30 mai au 31 mai 2024
1500 €
Disponibilité Printemps
du 22 août au 23 août 2024
1500 €
Disponibilité Été
du 14 Nov au 15 Nov 2024
1500 €
Disponibilité Automne
du 06 févr au 07 févr 2025
1500 €
Disponibilité Hiver
Voir d'autres avis
Demander le programme
S'inscrire directement

Responsable de formation

Participants

Participant
retirer ce participant
Ajouter un participant

Financement

Comment souhaitez-vous financer cette formation ?


Modalités

Souhaitez-vous du distanciel ou du présentiel ?



Envoyer l'inscription
Merci, un conseiller vous contacte rapidement !
deco validation Ziggourat
J’accepte que Ziggourat collecte et utilise les données personnelles renseignées dans ce formulaire dans le but de recevoir une offre commerciale en accord avec notre politique de données personnelles.

Formations similaires

Ces formations pourraient vous intéresser

Voir d'autres formations
Voir d'autres formations