Indexation de tables⚓︎
Fichier CSV⚓︎
Contenu d'un fichier CSV
Les fichiers CSV (Comma-Separated Values) sont un format de fichier couramment utilisé pour stocker des données tabulaires, comme une feuille de calcul ou une base de données.
Chaque ligne du fichier correspond à une ligne de la table,
et les valeurs sur chaque ligne sont séparées par des virgules (ou un autre délimiteur comme un point-virgule ou une tabulation).
Structure d'un fichier CSV
Un fichier CSV typique a la structure suivante :
- La première ligne est souvent l'en-tête, qui décrit les colonnes.
- Chaque ligne suivante représente une entrée ou un enregistrement de données.
- Les valeurs sont séparées par des virgules (ou un autre délimiteur).
Avantages des fichiers CSV⚓︎
- Simplicité : facile à créer, lire et éditer avec un simple éditeur de texte.
- Compatibilité : supporté par presque tous les logiciels de feuilles de calcul (comme Microsoft Excel, Google Sheets) et systèmes de gestion de bases de données.
- Taille : généralement plus léger que d'autres formats comme Excel.
Lire et écrire des fichiers CSV en Python⚓︎
Python offre un module intégré appelé csv pour travailler avec les fichiers CSV.
Voici quelques exemples de base :
Lire un fichier CSV⚓︎
import csv
with open('fichier.csv', mode='r') as fichier:
lecteur = csv.reader(fichier)
for ligne in lecteur:
print(ligne)
Écrire dans un fichier CSV⚓︎
import csv
with open('fichier.csv', mode='w', newline='') as fichier:
écrivain = csv.writer(fichier)
écrivain.writerow(['Nom', 'Âge', 'Ville'])
écrivain.writerow(['Alice', '30', 'Paris'])
écrivain.writerow(['Bob', '25', 'Lyon'])
Importation depuis un fichier CSV⚓︎
Python propose plusieurs méthodes pour importer des données tabulaires. La plus courante utilise le module csv ou pandas.
- Avec le module
csv
import csv
# Lecture d'un fichier CSV
with open('donnees.csv', mode='r', encoding='utf-8') as fichier:
lecteur = csv.DictReader(fichier)
table = [ligne for ligne in lecteur]
# Affichage des 5 premières lignes
for ligne in table[:5]:
print(ligne)
- Avec le module
pandas
import pandas as pd
# Lecture du fichier CSV
table = pd.read_csv('donnees.csv')
# Affichage des 5 premières lignes
print(table.head())
Utilisation de Pandas pour les fichiers CSV⚓︎
Pour des opérations plus avancées, la bibliothèque pandas est très utile. Elle permet de manipuler facilement les données CSV.
Lire un fichier CSV avec Pandas⚓︎
Écrire dans un fichier CSV avec Pandas⚓︎
import pandas as pd
data = pd.DataFrame({
'Nom': ['Alice', 'Bob'],
'Âge': [30, 25],
'Ville': ['Paris', 'Lyon']
})
data.to_csv('fichier.csv', index=False)
Bonnes pratiques⚓︎
- Encodage : assurez-vous d'utiliser le bon encodage (généralement UTF-8) pour éviter les problèmes avec les caractères spéciaux.
- Gestion des erreurs : toujours gérer les exceptions lors de la lecture/écriture de fichiers pour éviter les plantages.
- Validation des données : vérifiez les données pour vous assurer qu'elles sont cohérentes et complètes.
Applications pratiques⚓︎
- Import/Export de données : utilisé pour transférer des données entre différents systèmes ou applications.
- Analyse de données : les fichiers CSV sont souvent utilisés comme source de données pour l'analyse.
- Sauvegarde de données : format simple pour sauvegarder des données structurées.
Les fichiers CSV sont un outil fondamental pour quiconque travaille avec des données, et savoir les manipuler est une compétence précieuse dans de nombreux domaines, de l'analyse de données à la gestion de bases de données.
Recherche dans une table⚓︎
Recherche avec critères
Exemple avec une liste de dictionnaires :





