Contribuez à la Mission Politique publique de la donnée
Constats, freins et solutions
Diffuser les données dans des formats libres
Beaucoup de données restent diffusées dans des formats de donnés propriétaires, y compris lorsque des alternatives libres et largement répandues existent. On peut citer ici les données diffusées au format XSLT au lieu du CSV/TSV par exemple. Il en va de même pour les documentations qui accompagnent les données parfois diffusées en PDF.
Ce type de format fermés ne favorisent ni la diffusion, ni l'exploitation, ni la pérennité des données conservées sur les plateformes d'Open Data.
Liste des soutiens
et 15 autres personnes
(voir plus)
(voir moins)
Signaler un contenu inapproprié
Ce contenu est-il inapproprié ?
Détails du commentaire
Vous ne voyez qu'un seul commentaire
Vous pouvez accéder au reste des commentaires ici.
Certes le format PDF/A est très utile à des fins d'archivage, est-il pour autant adapté à la documentation des dépôts de données ? Ce format n'est pas très ergonomique : impossible de le versionner proprement, copier/coller fastidieux, nécessite l'utilisation d'un logiciel spécifique, possibilités des réutilisations faibles.
Ne faudrait-il pas s'inspirer des usages de plateformes comme GitHub/Gitlab et favoriser l'utilisation de langage de balisage léger comme Markdown, d'autant que ces langages peuvent être convertis facilement dans d'autres formats plus "conventionnels".
Mais la question de la documentation qui accompagne les dépôts/code mériterait peut-être une proposition à part.
Ce que je souhaite souligner à propos des formats, c'est qu'ils sont souvent utilisés par défaut. Le format exposé correspond au format de production des données (les fameux XLSX encodé en windows-1252), ce qui est dommage. Le format des données doit être considéré comme un critère de qualité.
Chargement des commentaires ...