Illustration de Google Dorking sur ordinateur portable avec loupe, interface de recherche et ambiance cybersécurité bleue.

Google Dorks : guide complet des requêtes avancées pour la cybersécurité

En bref : ce que vous allez apprendre

Les Google Dorks sont des requêtes avancées qui permettent de filtrer les résultats Google avec une précision chirurgicale Cinq opérateurs recherche suffisent pour découvrir des fichiers sensibles accessibles publiquement 58 % des hackers éthiques utilisent le google dorking comme première phase de reconnaissance Des outils comme Dorksearcher centralisent plus de 7000 dorks pour automatiser les audits Protéger vos données passe par une analyse régulière de ce que Google indexe sur votre domaine

Qu’est-ce que les Google Dorks exactement

Quand vous tapez quelques mots dans la barre de recherche Google, le moteur recherche vous renvoie des pages génériques. Les Google Dorks, c’est autre chose. Ce terme désigne des requêtes spécifiques qui exploitent les opérateurs avancés du moteur de recherche pour cibler des contenus bien précis : des fichiers PDF exposés, des répertoires mal configurés, des pages d’administration accessibles sans mot de passe, ou des données sensibles qui n’auraient jamais dû se retrouver en ligne.

Le terme vient du milieu de la sécurité informatique. Johnny Long, chercheur en cybersécurité, a popularisé cette approche au début des années 2000 et a constitué la Google Hacking Database (GHDB), une liste de requêtes classées par type de vulnérabilité. Depuis, la pratique a beaucoup évolué.

La différence avec une recherche Google classique ? Une recherche normale utilise des mots clés simples. Un dork combine plusieurs opérateurs pour rechercher des contenus cachées dans les résultats habituels. Par exemple, site:exemple.com filetype:pdf password va chercher directement sur un domaine particulier tous les fichiers PDF contenant le mot « password ». Résultat : des documents confidentielles que l’administrateur du site pensait protéger.

Google hacking : un terme qui fait peur, souvent mal compris

Le terme « google hacking » fait souvent penser à une attaque sophistiquée. En réalité, cela ne demande aucune compétence en code. On utilise uniquement l’interface standard de Google search. Ce qui rend les dorks les plus efficaces, c’est leur simplicité : pas besoin d’exploiter des failles sécurité techniques, les informations sont publiquement accessibles et indexées par Google lui-même.

Ce que Google indexe sans que vous le sachiez

Google crawle en permanence des milliards de pages. Certaines entreprises publient des fichiers, des répertoires ou des documents sans réaliser qu’ils seront indexés. Un fichier .txt contenant des identifiants, un rapport Excel avec des coordonnées bancaires, une base de données accessible via une URL prévisible : toutes ces ressources peuvent être trouvées avec les bonnes requêtes. C’est là que réside la puissance des Google Dorks.

Les 5 opérateurs Google Dorks incontournables

Les opérateurs recherche sont les briques de base du google dorking. Comprendre comment ils fonctionnent permet de construire des requêtes redoutablement précises. Voici les cinq opérateurs les plus utilisés.

Les opérateurs fondamentaux à connaître

site: permet de limiter les résultats à un domaine précis. Exemple : site:gouvernement.fr filetype:pdf renvoie uniquement les PDF indexés sur ce domaine. inurl: cible les pages dont l’URL contient un mot ou une chaîne spécifique. inurl:admin login fait remonter des pages d’administration potentiellement accessibles. filetype: (ou ext:) filtre par extension de fichier. filetype:xls permet de trouver des fichiers Excel publics. Combiné à intext:password, il peut révéler des données sensibles. intitle: cherche dans les titres des pages web. intitle:index of est l’un des dorks les plus connus : il repère les répertoires ouverts sur des serveurs mal configurés. cache: affiche la version mise en cache d’une page par Google. Utile pour voir un contenu qui a été supprimé récemment, ou pour vérifier l’état d’un site à une date antérieure.

Combiner plusieurs opérateurs pour des recherches avancées

La vraie puissance des dorks est dans la combinaison. Un exemple concret et réaliste : site:entreprise.com filetype pdf intext: »confidentiel ». Cette requête avancée cherche sur un site spécifique tous les fichiers PDF contenant le mot « confidentiel ». En quelques secondes, vous pouvez découvrir des informations sensibles que l’équipe IT pensait hors d’atteinte.

Autre exemple utile pour un audit : intitle index of « database » site:.fr permet d’identifier des répertoires exposés sur des domaines français. Ce type de recherche est utilisé dans les audits de sécurité internes pour cartographier la surface d’exposition avant qu’un attaquant ne le fasse.

On peut aussi utiliser allintext:username password filetype:txt pour rechercher des fichiers texte contenant des identifiants. Ces requêtes démontrent à quel point certaines données restent accessibles faute d’une bonne configuration.

Il y a aussi inurl:php?id= qui permet de repérer des pages potentiellement vulnérables aux injections SQL. Ce n’est pas une technique d’exploitation, juste une méthode de découverte rapide de cibles potentielles.

Et inurl:login intext:admin ou des variantes similaires permettent de trouver des pages de login d’administration exposées sur internet. Résultat parfois surprenant quand on voit le nombre de pages indexées.

Comment les attaquants exploitent les Google Dorks

Scénarios d’exploitation réalistes

Savoir comment les dorks sont utilisés de façon malveillante, c’est la meilleure façon de comprendre pourquoi il faut s’en protéger. Trois scénarios reviennent souvent dans les rapports de cybersécurité.

Premier cas : des fichiers Excel publics contenant des données confidentielles. Une PME publie un fichier .xls sur son serveur web pour le partager en interne via un lien. Elle oublie que Google va l’indexer. Avec filetype xls intext: »IBAN », un attaquant peut trouver des documents contenant des informations bancaires. Ce type d’erreur est plus fréquent qu’on ne le pense.

Deuxième cas : des bases de données accessibles via une URL prévisible. Certains administrateurs laissent des interfaces phpMyAdmin ou des fichiers database.sql accessibles directement en ligne. Un dork comme inurl:phpmyadmin intext: »Welcome to phpMyAdmin » peut identifier ces systèmes exposés. Les attaquants ont alors accès potentiellement à toutes les données d’une base.

Troisième cas : des clés API visibles dans du code source ou des fichiers de configuration. intext: »api_key » filetype:txt site:github.com est un dork pour lequel les résultats sont souvent alarmants. Les développeurs publient parfois du code contenant des clés actives, utilisées ensuite pour accéder à des services cloud ou des systèmes de mail.

Pourquoi les dorks sont si efficaces

La raison principale, c’est qu’il n’y a pas de pare-feu à contourner. Google fait le travail : il indexe le contenu public, et les dorks permettent juste d’interroger cet index de façon plus précise. Aucune intrusion au sens technique, juste une recherche Google bien construite. C’est ce qui rend cette technique particulièrement difficile à détecter et à contrer. Selon plusieurs études liées à la cybersécurité offensive, 58 % des hackers éthiques utilisent le google dorking comme première étape de leur phase de reconnaissance.

Outils et ressources pour automatiser les recherches Dorks

Dorksearcher et la Google Hacking Database

Faire des recherches manuelles dork par dork prend du temps. C’est là qu’interviennent les outils spécialisés. Dorksearcher est l’un des plus utilisés : il centralise plus de 7000 dorks prédéfinis, classés par catégorie (fichiers sensibles, pages d’administration, vulnérabilités spécifiques, etc.). Vous souhaitez tester si votre domaine expose des fichiers .sql ou des pages admin ? En quelques clics, Dorksearcher lance une série de requêtes automatiquement.

La GHDB, database ghdb maintenue par la communauté Offensive Security, est l’autre ressource incontournable. Elle recense des milliers de dorks pour organisés par type de cible et régulièrement mis à jour. C’est la source de référence pour les professionnels du pentesting éthique.

Autres outils liés au google dorking

Il existe d’autres outils comme Dorker, un script Python qui permet de lancer des requêtes automatisées et d’exporter les résultats. OSINT Google passe souvent par ces outils pour cartographier rapidement la surface d’exposition d’une cible légale. L’automatisation permet de passer en revue des listes de dorks en quelques minutes, là où une analyse manuelle prendrait des heures. C’est particulièrement utile lors d’audits de sécurité ou de missions de pentesting avec autorisation explicite du client. Sans automatisation, exploiter toutes les techniques disponibles serait simplement impossible à l’échelle d’une infrastructure de taille moyenne.

Protéger vos données contre les Google Dorks

Actions concrètes pour réduire votre exposition

La bonne nouvelle, c’est que protéger vos données contre les Google Dorks est parfaitement possible avec des mesures simples. Voici cinq actions à mettre en place :

Vérifier régulièrement ce que Google indexe sur votre site via Google Search Console, en particulier les fichiers et répertoires qui ne devraient pas être publics Configurer un fichier robots.txt pour bloquer l’indexation des dossiers sensibles (ex : Disallow: /admin/, Disallow: /backup/) Ne jamais stocker de fichiers contenant des mots passe, des clés API ou des données sensibles dans des répertoires accessibles publiquement Chiffrer les fichiers et documents confidentiels même s’ils sont hébergés sur un serveur web, de sorte qu’ils soient inutilisables même si découverts Former les équipes techniques pour qu’elles comprennent les risques liés à l’indexation involontaire de contenus sensibles

La sauvegarde des données reste également un réflexe essentiel en complément de ces mesures de protection.

Tableau comparatif : vulnérabilités courantes et solutions

Vulnérabilité communeExemple de dork associéSolution recommandée
Répertoires ouverts sur le serveurintitle index of /backupDésactiver le directory listing dans la config Apache/Nginx
Fichiers PDF ou XLS exposéssite:votre-site.com filetype pdf confidentialDéplacer les documents hors du répertoire web ou restreindre l’accès
Pages d’administration indexéesinurl admin login site:votre-site.comBloquer ces URL dans robots.txt et mettre en place une IP blanche
Clés API dans des fichiers texteintext api_key filetype txtNe jamais stocker de clés dans des fichiers accessibles ; utiliser des variables d’environnement
Bases de données accessibles en ligneinurl phpmyadminPlacer phpMyAdmin derrière un VPN ou une authentification forte

Scanner son infrastructure avant les attaquants

Un RSSI qui souhaitez anticiper les attaques peut faire régulièrement des audits de sécurité en utilisant les mêmes dorks que les attaquants. C’est le principe du « penser comme un attaquant ». En lançant des requêtes ciblées sur votre propre domaine, vous découvrez ce qui est exposé et pouvez corriger avant qu’une exploitation ne se produise. Cette pratique s’intègre parfaitement dans les audits de sécurité périodiques et dans un modèle de sécurité global. L’objectif : que vos données sensibles ne soient jamais accessibles via une simple recherche Google. Pour les entreprises hébergeant des services critiques, la sécurisation des données en cloud est un volet complémentaire à ne pas négliger.

Google Dorks en OSINT Google et pentesting éthique

Usage défensif vs usage offensif

Le même outil, selon l’usage qu’on en fait, peut être légal ou illégal. Dans le cadre d’une mission de pentesting avec autorisation écrite du client, utiliser les Google Dorks pour identifier des informations exposées est une pratique professionnelle reconnue. C’est l’une des techniques de base en OSINT Google : collecter des informations accessibles publiquement pour cartographier la surface d’attaque d’un système.

À l’inverse, utiliser ces techniques sur des sites sans autorisation, même pour « voir ce qui est accessible », peut avoir des conséquences juridiques sérieuses selon la législation en vigueur. La frontière entre curiosité et intrusion est souvent mince. La conformité RGPD encadre d’ailleurs strictement l’accès aux données personnelles, même lorsqu’elles sont exposées publiquement.

Cas d’usage légitimes du google dorking

Les cas d’usage légitimes sont nombreux : audit interne d’une infrastructure pour identifier des failles avant un déploiement en production, recherche d’informations publiques sur une cible dans le cadre d’une analyse concurrentielle légale, vérification que des documents confidentiels ne sont pas indexées après une mise à jour du site. Les journalistes d’investigation et les chercheurs en cybersécurité utilisent aussi ces techniques pour trouver des documents publics dans le cadre de leurs travaux. L’outil en lui-même est neutre. C’est l’intention et le cadre légal qui déterminent si son utilisation est acceptable ou non.

Questions fréquentes sur les Google Dorks

Les Google Dorks sont-ils illégaux ?

Non, les Google Dorks ne sont pas illégaux en eux-mêmes. Ils permettent uniquement d’accéder à des informations déjà publiquement accessibles et indexées par Google. En revanche, utiliser ces techniques pour accéder à des systèmes ou des données sans autorisation du propriétaire est illégal dans la plupart des pays, y compris en France sous l’article 323-1 du Code pénal.

Quelle est la différence entre Google Dorks et le dark web ?

Ce sont deux choses totalement différentes. Les Google Dorks fonctionnent uniquement sur le moteur de recherche Google et ciblent du contenu public indexé. Le dark web nécessite des outils spécifiques comme Tor pour y accéder et contient des contenus volontairement non indexés. Il n’y a aucun lien entre les deux.

Comment savoir si mon site est vulnérable aux Google Dorks ?

La méthode la plus directe : lancez vous-même des recherches en utilisant site:votre-domaine.com combiné avec des opérateurs comme filetype:pdf, inurl:admin, ou intitle:index of. Google Search Console permet aussi de voir quelles pages sont indexées. Si des fichiers ou des répertoires sensibles apparaissent dans les résultats, il faut agir rapidement.

Combien d’opérateurs Google Dorks existe-t-il au total ?

Google propose officiellement une vingtaine d’opérateurs recherche documentés. Mais les dorks les plus utilisés en cybersécurité sont en réalité des combinaisons de ces opérateurs de base. La GHDB recense des milliers de requêtes construites à partir de ces briques. Des outils comme Dorksearcher en centralisent plus de 7000 disponibles, classés par cas d’usage.

Peut-on automatiser les recherches Google Dorks sans se faire bloquer ?

Google détecte et bloque les requêtes automatisées à grande vitesse. Les outils comme Dorker incluent des mécanismes pour espacer les requêtes et éviter les blocages temporaires. En pratique, pour des audits professionnels, il vaut mieux combiner ces outils avec des proxies ou limiter le volume de requêtes par session. L’utilisation doit toujours rester dans un cadre légal et avec une autorisation explicite si vous analysez des systèmes tiers.

Lionel Gigot

Rédacteur data & blogueur

Dans la même catégorie

Le média de référence pour les professionnels de la data. Actus, analyses, tutoriels — 100% indépendant

© 2026 Mission open data • Tous droits réservés

Retour en haut