Daniel Lemire, TELUQ : Traiter des gigaoctets de JSON par seconde


Wednesday 11 March 2020 - Seminars

Qui ? Daniel Lemire, professeur au département d’informatique, uqam


Quand ? mercredi 11 mars 2020, 12h30


Où ? PK 5115

Titre : Traiter des gigaoctets de JSON par seconde

Résumé :

Nos disques et réseaux peuvent charger des données au rythme de gigaoctets par seconde. Nous croyons que notre logiciel devrait en faire de même. Le format JSON est le format de données standard que ce soit dans l’infonuagique ou dans l’informatique mobile. Nous avons écrit ce qui est sans doute le parseur JSON le plus rapide du monde. Il peut construire le DOM (document-object-model) de fichiers JSON à plus de 2 gigaoctets par seconde en utilisant un seul coeur, tout en fournissant une validation complète des données. Notre parseur est plusieurs fois plus rapides que les parseurs conventionnels. Il roule aussi bien sur un iPhone que sur un puissant serveur. Il est utilisé par des entreprises comme Microsoft ou Yandex. Sur GitHub, la librairie logicielle correspondante (simdjson) est le 77e projet C++ ayant le plus d’étoiles sur environ 1 million de projets.