> Formations > Technologies numériques > Développement logiciel > Python > Formation Pandas avancé > Formations > Technologies numériques > Formation Pandas avancé

Formation : Pandas avancé

La bibliothèque Python pour l'analyse de données

Pandas avancé

La bibliothèque Python pour l'analyse de données
Télécharger le programme Partager cette formation


Vous avez découvert lors de vos apprentissages Python, Pandas : la bibliothèque pour l'analyse de données. Vous souhaitez être guidé, par un expert du domaine, pour approfondir l'exploration de cette librairie nécessaire à tous projets de data science, Cette formation est faite pour vous.


Inter
Intra
Sur mesure

Cours pratique en présentiel ou en classe à distance

Réf. PND
Prix : 1450 € H.T.
  2j - 14h00
Pauses-café et
déjeuners offerts




Vous avez découvert lors de vos apprentissages Python, Pandas : la bibliothèque pour l'analyse de données. Vous souhaitez être guidé, par un expert du domaine, pour approfondir l'exploration de cette librairie nécessaire à tous projets de data science, Cette formation est faite pour vous.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Maîtriser la librairie Pandas pour l’analyse de données
  • Connaître les subtilités des groupbys
  • Savoir manipuler les tables pivots et les tableaux croisés
  • Acquérir des notions sur l’accélération des calculs avec Pandas
  • Connaître les bonnes pratiques en Data Science

Public concerné
Développeurs, ingénieurs et toute personne analysant les données avec des compétences de développement.

Prérequis
Maîtrise de Python
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Programme de la formation

Tour d’horizon de la librairie Pandas

  • Rappels sur les notions de bases de Pandas.
  • Lecture de fichiers de données (csv, excel, SQL, parquet).
  • Description du jeu de données, et analyse statistique simple.
  • Implémenter des analyses et des visualisations différentes en fonction du type de données.
  • Gestion des données manquantes.
  • Manipulation de dates pour les Time Series.
  • Gestion des chaînes de caractères.
  • Mise en place des bonnes pratiques en Data Science.
Travaux pratiques
Mise en place d’un environnement virtuel pour la Data Science, lecture d’un fichier csv et xls, brève analyse statistique et description des jeux de données.

Maîtriser les subtilités des groupbys

  • Les groupbys pour appréhender les modalités dans les jeux de données.
  • Groupby à simple indice avec les fonctions d’agrégations classiques.
  • Personnalisation des fonctions d’agrégations.
  • Groupby à multiples indices.
  • Différence entre les fonctions apply et transform.
  • Rappels sur les fonctions anonymes.
Travaux pratiques
Sur 2 jeux de données économiques, mise en pratique du groupby et visualisation des données. Création d’un toy dataset et utilisation du groupby.

Tables pivots et tableaux croisés

  • Fonctions d’agrégation et tables pivots.
  • Matrice de contingence.
  • Tableaux croisés.
Travaux pratiques
Sur 2 jeux de données économiques, mise en pratique des tables pivots et tableaux croisés.

Jointure de tables

  • Notions d’axes.
  • Concaténation.
  • Merge selon une ou plusieurs clés.
  • Jointure par rapport aux indices.
Travaux pratiques
Sur 2 jeux de données économiques, mise en pratique des différents types de jointures.

Accélération du calcul avec Pandas

  • Boucler sur les lignes et les colonnes.
  • Revenir aux basiques avec NumPy.
  • Exemples de multiprocessing avec la librairie Modin.
  • Exemples de multiprocessing avec la librairie Numba.
Travaux pratiques
Sur un jeu de données volumineux, mise en pratique des différentes notions abordées lors du cours.


Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.

Avis clients
4,7 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
SILVA THAYNARA PAULA D.
11/07/24
5 / 5

Contenu très intéressant et pertinent, adapté aux besoins des élèves. Le formateur est pédagogue et sait adapter le contenu au niveau et aux questions d’intérêt des participants.
ELODIE S.
11/07/24
5 / 5

Très bon formateur qui nous a donné les bonnes bases et pratiques sur Pandas
ALIREZA K.
11/07/24
5 / 5

Contenu très intéressant, un tour complet de Pandas. Avoir plus de temps pour la pratique, peut être que 2 jours c’est un peu court. Formation sur 3 jours ?




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
En classe à distance, la formation démarre à partir de 9h.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance