Contribuez à la Mission Politique publique de la donnée
Constats, freins et solutions
Diffuser les données dans des formats libres
Beaucoup de données restent diffusées dans des formats de donnés propriétaires, y compris lorsque des alternatives libres et largement répandues existent. On peut citer ici les données diffusées au format XSLT au lieu du CSV/TSV par exemple. Il en va de même pour les documentations qui accompagnent les données parfois diffusées en PDF.
Ce type de format fermés ne favorisent ni la diffusion, ni l'exploitation, ni la pérennité des données conservées sur les plateformes d'Open Data.
Liste des soutiens
et 15 autres personnes
(voir plus)
(voir moins)
Signaler un contenu inapproprié
Ce contenu est-il inapproprié ?
6 commentaires
Conversation avec Colin Maudry
Le format PDF/A est standardisé et documenté, ce qui en fait un bon choix pour la publication de documents, avec le format OpenDocument Text (ODT) : https://fr.wikipedia.org/wiki/PDF/A
Certes le format PDF/A est très utile à des fins d'archivage, est-il pour autant adapté à la documentation des dépôts de données ? Ce format n'est pas très ergonomique : impossible de le versionner proprement, copier/coller fastidieux, nécessite l'utilisation d'un logiciel spécifique, possibilités des réutilisations faibles.
Ne faudrait-il pas s'inspirer des usages de plateformes comme GitHub/Gitlab et favoriser l'utilisation de langage de balisage léger comme Markdown, d'autant que ces langages peuvent être convertis facilement dans d'autres formats plus "conventionnels".
Mais la question de la documentation qui accompagne les dépôts/code mériterait peut-être une proposition à part.
Ce que je souhaite souligner à propos des formats, c'est qu'ils sont souvent utilisés par défaut. Le format exposé correspond au format de production des données (les fameux XLSX encodé en windows-1252), ce qui est dommage. Le format des données doit être considéré comme un critère de qualité.
Conversation avec Colin Maudry
Coquille dans votre proposition : XSLT => XLSX (MS Excel).
Effectivement c'est bien du XLSX dont je veux parler ici.
Malheureusement je ne sais pas comment proposer une nouvelle version de ma proposition.
Je suis aussi plus favorable à des solutions de type markdown. Au delà de l'ouverture, ce format présente l'avantage d'être plus léger effectivement.
Il suffit de s'appuyer sur la définition de "format ouvert" dans la LCEN (titre 1, article 4 de mémoire).
Chargement des commentaires ...