Tables et fichiers CSV
Introduction⚓︎
Aujourd’hui, l’un des rôles essentiels de l’informatique est de permettre le traitement de grandes quantités de données dans des domaines très variés.
Voici quelques exemples concrets :
-
un site de commerce en ligne doit pouvoir gérer des informations sur des dizaines de milliers de produits, de clients et de commandes ;
-
un hôpital doit accéder rapidement et efficacement à l’historique médical de chacun de ses patients ;
-
et bien d’autres secteurs dépendent aussi de la bonne gestion des données.
Pour cela, on utilise généralement des logiciels spécialisés appelés « Systèmes de Gestion de Bases de Données » (ou SGBD). Ces outils sont conçus pour stocker, organiser, et retrouver les données de manière rapide et sécurisée.
Cependant, même sans utiliser un SGBD complet, il est possible d’apprendre à manipuler des données de base en utilisant un langage de programmation comme Python. Ce langage permet de comprendre les principes fondamentaux de la gestion de données, tout en étant simple à prendre en main.
Les données sous forme de table⚓︎
Lorsqu’elles sont organisées en table, les données prennent la forme d’une liste d’enregistrements structurés de la forme suivante :
En informatique, une table de données peut être vue comme une liste de p-uplets nommés (ou dictionnaires en Python) qui partagent les mêmes descripteurs, c’est-à-dire les mêmes noms de champs.
Par exemple, en Python, un enregistrement (ou p-uplet nommé) peut s’écrire ainsi :
Dans ce contexte, chaque clé (comme 'Id', 'Nom', 'Prenom', 'Pays', 'Classement_Mondial') correspond à un descripteur, et chaque valeur associée représente une information spécifique pour cet enregistrement.
Autrement dit, en Python, les données tabulaires sont souvent représentées par une liste de dictionnaires, chaque dictionnaire décrivant une ligne de la table.
Voici un exemple de table de données représentée en Python, contenant des informations sur quelques joueurs de tennis de table célèbres. Chaque joueur est un dictionnaire, et l’ensemble des joueurs forme une liste de dictionnaires :
joueurs = [
{'Id': 1, 'Nom': 'LEBRUN', 'Prenom': 'Félix', 'Pays': 'France', 'Classement_Mondial': 6},
{'Id': 2, 'Nom': 'CALDERANO', 'Prenom': 'Hugo', 'Pays': 'Brésil', 'Classement_Mondial': 3},
{'Id': 3, 'Nom': 'HARIMOTO', 'Prenom': 'Tomakozu', 'Pays': 'Japon', 'Classement_Mondial': 4},
{'Id': 4, 'Nom': 'MOREGARD', 'Prenom': 'Truls', 'Pays': 'Suède', 'Classement_Mondial': 7},
{'Id': 5, 'Nom': 'LIN', 'Prenom': 'Shidong','Pays': 'Chine', 'Classement_Mondial': 1},
{'Id': 6, 'Nom': 'WANG', 'Prenom': 'Chuqin', 'Pays': 'Chine', 'Classement_Mondial': 2}
]
Explications :
-
Chaque dictionnaire représente un joueur.
-
Les clés (
'Id','Nom','Prenom','Pays','Classement_Mondial') sont les descripteurs communs. -
Les valeurs contiennent les informations propres à chaque joueur.
On peut facilement accéder à un joueur ou filtrer ceux d’un pays donné, par exemple :
# Afficher les joueurs chinois
for joueur in joueurs:
if joueur['Pays'] == 'Chine':
print(joueur['Prenom'], joueur['Nom'])
Fichiers CSV⚓︎
Contenu d'un fichier CSV
Les fichiers CSV, ou « Comma-Separated Values », sont un format de fichier largement utilisé pour le stockage de données tabulaires, similaires à une feuille de calcul ou une base de données.
Dans ces fichiers, chaque ligne représente une entrée de la table, et les valeurs de chaque ligne sont séparées par des virgules (bien que d'autres délimiteurs comme des points-virgules ou des tabulations puissent être utilisés, notamment dans les fichiers TSV).
Structure d'un fichier CSV
Un fichier CSV typique a la structure suivante :
Nom,Prenom,Pays,Classement_Mondial
LEBRUN,Félix,France,6
CALDERANO,Hugo,Brésil,3
HARIMOTO,Tomakozu,Japon,4
MOREGARD,Truls,Suède,7
LIN,Shidong,Chine,1
WANG,Chuqin,Chine,2
- La première ligne est souvent l'en-tête, qui décrit les colonnes.
- Chaque ligne suivante représente une entrée ou un enregistrement de données.
- Les valeurs sont séparées par des virgules (ou un autre type de délimiteur).
Remarque : Les tableurs (MS Excel, LibreOffice Calc, …) sont capables d’ouvrir ce genre de fichier. Ils permettent de les afficher sous forme de tableau et d’en manipuler facilement les données :
Avantages des fichiers CSV⚓︎
- Simplicité : facile à créer, lire et éditer avec un simple éditeur de texte.
- Compatibilité : supporté par presque tous les logiciels de feuilles de calcul (comme Microsoft Excel, Google Sheets) et systèmes de gestion de bases de données.
- Taille : généralement plus léger que d'autres formats comme Excel.



