JSON Lines (JSONL)

  • Mise à jour le 25 septembre 2024
  • 1 min. à lire

JSON Lines (JSONL) est un format de données textuelles conçu pour stocker des objets JSON structurés, avec chaque objet occupant une seule ligne. Ce format est particulièrement utile pour le traitement de grands volumes de données et les flux de données en continu.

Dans un fichier JSONL, chaque ligne représente un objet JSON complet et valide, séparé des autres par un retour à la ligne. Cette structure permet une lecture et une écriture séquentielles efficaces, facilitant le traitement des données par lots ou en temps réel.

Exemple de fichier JSONL :

{"nom": "Dupont", "age": 30, "ville": "Paris"}
{"nom": "Martin", "age": 25, "ville": "Lyon"}
{"nom": "Durand", "age": 35, "ville": "Marseille"}

JSONL est souvent utilisé dans des contextes tels que :

  • L'analyse de logs et le traitement de données de journalisation
  • Les pipelines de données pour le machine learning
  • L'échange de données entre systèmes distribués

Contrairement au JSON standard qui peut contenir un seul objet racine, JSONL permet de stocker plusieurs objets indépendants dans un même fichier. Cette caractéristique le rend particulièrement adapté aux opérations d'ajout incrémental et à la gestion de flux de données continus.

tracking-thumb