Archivistes numériques: protéger les données publiques contre l’effacement

 Archivistes numériques: protéger les données publiques contre l’effacement

Dans les trois décennies qui ont suivi Brewster Kahle a tourné à but non lucratif Internet Archives Wayback Machineil s’est étendu pour inclure des sites Web et des ensembles de données gouvernementaux, dont beaucoup sont essentiels aux communautés d’ingénierie et scientifiques. Des agences gouvernementales américaines comme le Fondation des sciences nationales, Département de l’énergieet NASA sont des sources critiques de données de recherche, de spécifications techniques et de documentation des normes dans à peu près tous les domaines où Spectre IEEELe public des œuvres – ai et informatique, appareils biomédicaux, puissance et énergie, semi-conducteursTélécommunications… La liste continue.

L’accès à ces données gouvernementales affecte directement la reproductibilité des expériences, la validation des modèles et l’intégrité du dossier savant.

Alors, que se passe-t-il si un ensemble de données entier disparaît? Entre autres choses, il peut invalider des années de recherche fondé sur cette fondation.

Jusqu’à récemment, la suppression en gros des données a été rare. Dans le États-Unisles transitions présidentielles impliquent généralement des modifications des sites Web du gouvernement pour refléter les nouvelles priorités politiques. Et après le 11 septembre, l’administration George W. Bush a supprimé «millions d’octets«D’informations des sites gouvernementaux pour des raisons de sécurité ainsi que des centaines de Ministère de la Défense documents et «dizaines de milliers» Commission fédérale de la réglementation de l’énergie fichiers.

Le Obama Et les administrations de Biden ont également apporté des modifications aux sites Web du gouvernement, mais n’ont pas engagé la suppression à grande échelle des pages Web ou des ensembles de données. Obama, en fait, a élargi l’accès public aux données du gouvernement en 2009 en lançant Data.govdont la mission indiquée est en partie «de libérer le pouvoir des données ouvertes du gouvernement pour éclairer les décisions du public et des décideurs.»

Pendant le premier mandat du président Donald J. Trump, les chercheurs de l’initiative environnementale de données et de gouvernance trouvé que certains sites gouvernementaux sont devenus inaccessibles et que l’expression «changement climatique» a été purgé de plusieurs pages Web du gouvernement.

Mais les groupes de surveillance n’observent principalement pas de la destruction des données, selon Spectre Rédactrice adjointe Gwendolyn Rak.

L’accès aux données gouvernementales affecte directement la reproductibilité des expériences, la validation des modèles et l’intégrité de l’enregistrement savant.

Le deuxième terme a été différent. En février, quelques semaines après que Trump a été assermenté pour son deuxième mandat, Le New York Times signalé que son administration a abattu plus de 8 000 pages Web et bases de données. Beaucoup de ces pages ont depuis réapparu, mais certaines des pages et fichiers restaurés ont eu des changements, notamment l’effacement de Des termes comme le «changement climatique» (encore une fois) et «l’énergie propre»,Blé à moudre Rapports. Ces mesures ont été confrontées à plusieurs contestations judiciaires; Le 11 février, par exemple, un juge fédéral a ordonné que l’accès public aux pages Web et aux ensembles de données appartenant aux Centers for Disease Control and Prevention et la Food and Drug Administration soient restaurés.

Dans notre avril problèmeRak rapports sur les efforts visant à préserver l’accès public à l’information. En plus du travail en cours au Archives Internetelle décrit comment les archivistes du Bibliothèque Innovation Lab à la Harvard Law School Amassée une copie des 16-teraboctets archive de data.gov, qui comprend plus de 311 000 ensembles de données publiques. Cette archive copiée est mise à jour quotidien programmation interfaces (API).

Les archivistes sont les gardiens de la mémoire. Nous dépendons d’eux pour nous aider à rester en contact avec notre histoire, à maintenir notre base de connaissances et à fournir un contexte, nous permettant de comprendre comment nous sommes devenus là où nous sommes et éclairer la voie à suivre. Dans les domaines de la science, de l’ingénierie et de la médecine, où les innovations d’aujourd’hui sont sur les épaules des découvertes d’hier, ces conservateurs numériques garantissent que le circuit de la connaissance humaine reste ininterrompu.

Cet article apparaît dans le numéro d’impression d’avril 2025 car «beaucoup de copies gardent les trucs en sécurité».

À partir des articles de votre site

Articles connexes sur le Web



Source link

Related post