En réponse à des problèmes de sécurité accrus, un certain nombre d’organisations ont supprimé les informations « sensibles » de leurs sites Web, mais malgré ces précautions, une grande partie de ces informations sont toujours disponibles, même pour les personnes ayant des compétences de recherche relativement modestes.
Des problèmes de sécurité accrus ont conduit un certain nombre d’organisations à supprimer des informations sensibles de leurs sites Web, mais une grande partie de ces informations est toujours disponible, même pour les personnes ayant des compétences de recherche relativement modestes.
Parmi ces organisations qui suppriment du contenu, le site Web de la Fédération des scientifiques américains (FAS) a supprimé des diagrammes et des photos des installations de renseignement américaines, selon un article de l’Associated Press. Un article du Washington Post a rapporté que
les Centers for Disease Control and Prevention ont supprimé un rapport sur le terrorisme chimique », qui décrit les lacunes de l’industrie dans la préparation d’une éventuelle attaque terroriste.
Le rapport du CDC, ainsi que des milliers de pages apparemment supprimées du site Web de FAS, sont toujours disponibles via la fonction de cache de Google. Une page contenant des informations détaillées sur l’endroit et la manière dont le FAS a obtenu certaines des images et des cartes qu’il mettait auparavant à disposition sur son site est également disponible.
Une recherche sur Google à l’aide de l’expression « installations de renseignement des États-Unis » limitée au site Web du FAS a donné plus de 4 500 résultats. En cliquant sur la plupart des liens de résultats, vous avez obtenu 404 messages introuvables. Cela devrait être prévu puisque les pages ont été supprimées relativement récemment et que Google n’a pas encore exploré le site et supprimé les liens désormais morts de sa base de données.
Cependant, en cliquant sur le lien vers des copies mises en cache de plus d’une douzaine de ces résultats de recherche, la page attendue s’est affichée. La plupart, sinon toutes les pages supprimées resteront disponibles jusqu’à ce que Google réexplore le site et supprime les liens morts de son index.
Google ne supprime pas de manière proactive le contenu de sa base de données, même pour des cas comme le site FAS qui a été signalé dans les principaux médias. Nous ne faisons rien de spécial », a déclaré le porte-parole de Google, David Krane. Le Net évolue si vite en ce moment qu’il y a tout simplement trop de choses à maîtriser.
Google propose un certain nombre de méthodes pour supprimer des pages de son cache ou empêcher la mise en cache d’une page lorsque le robot d’exploration la découvre pour la première fois. Pour les situations urgentes, Google fournit également un moyen automatisé de supprimer un grand nombre de pages de son cache.
Une partie du contenu signalé par l’AP et le Washington Post comme étant supprimé n’est pas disponible via Google, ou tout autre moteur de recherche, d’ailleurs. La plupart de ces informations semblent avoir été stockées dans des bases de données accessibles sur le Web, ce qui en fait une partie du Web invisible.
Un exemple est la base de données du plan de gestion des risques RMPInfo de l’Environmental Protection Agency. Ce système a permis une recherche approfondie des matières dangereuses stockées dans des milliers d’emplacements par nom d’installation, nom chimique ou emplacement géographique. Le formulaire de recherche de la base de données est toujours disponible via le cache de Google, mais tenter de rechercher la base de données à l’aide du formulaire renvoie simplement un message 404 – Not Found ».
Bien que les inquiétudes des organisations qui ont supprimé du contenu du Web soient compréhensibles, il est regrettable que le Web n’ait plus le degré d’ouverture qu’il avait autrefois. Ce qui se passe n’est pas une censure généralisée, car de nombreuses organisations qui ont détourné du contenu Web continuent de mettre des informations sensibles à la disposition de leurs bureaux aux personnes présentant une pièce d’identité appropriée.
Mais c’est juste plus difficile maintenant. Cela dit, les chercheurs intelligents trouveront d’autres moyens de trouver le type d’informations détaillées qui ne sont plus disponibles sur le site FAS. Par exemple, TerraServer possède une énorme base de données d’images aériennes et satellites de plus de 60 pays, vous permettant de sélectionner et d’imprimer des images haute résolution d’une taille aussi petite que 1,96 kilomètre carré.