Wat verstaan we onder het deep web
Het woord deep web klinkt spannend, maar het begrip wordt vaak verkeerd gebruikt. Veel mensen denken direct aan illegale marktplaatsen en hackers, maar dat is meestal het domein van het dark web. Het deep web is simpelweg het deel van het internet dat niet door zoekmachines zoals Google, Bing of DuckDuckGo wordt geïndexeerd.
Denk aan pagina’s achter een inlogscherm, zoals je webmail, internetbankieren, een leeromgeving van school of interne bedrijfsportalen. Deze pagina’s bestaan wel op het internet, maar zijn niet openbaar doorzoekbaar. Zonder de juiste link, toegang of inloggegevens kom je er niet bij.
Waarom kan Google het deep web niet zien
Technische beperkingen van zoekmachines
Zoekmachines werken met bots die het openbare web afspeuren en links volgen. Deze bots kunnen alleen pagina’s zien waar ze rechtstreeks bij kunnen. Zodra een pagina achter een formulier, zoekveld of login zit, houdt het op. Een zoekmachine kan zich niet zomaar aanmelden, inloggen of een wachtwoord raden.
Daarnaast worden veel gegevens pas geladen nadat een gebruiker een actie uitvoert, bijvoorbeeld een zoekopdracht in een database. Een zoekrobot voert zulke acties meestal niet uit en ziet daardoor alleen de ‘buitenkant’ van een site.
Bewuste afscherming door beheerders
Websitebeheerders kunnen er daarnaast bewust voor kiezen om pagina’s te verbergen voor zoekmachines. Dat kan via instellingen in het contentmanagementsysteem of via bestanden zoals robots.txt. Zo kunnen conceptpagina’s, interne documentatie of testomgevingen bestaan op het web, maar toch onzichtbaar blijven in de zoekresultaten.
Voorbeelden van deep web inhoud
Persoonlijke en afgeschermde informatie
Een groot deel van het deep web bestaat uit persoonlijke gegevens. Denk aan je medische dossiers in een patiëntenportaal, de berichten in je sociale media-inbox of de cijfers in je studieomgeving. Deze data zijn heel bewust niet vindbaar via Google, omdat privacy hier voorop staat.
Ook betaalde krantenarchieven, onderzoeksdatabanken en professionele tools vallen vaak onder het deep web. Je hebt een abonnement nodig om erbij te kunnen, en zonder inlog kom je niet verder dan een aanmeldpagina.
Specialistische databanken en tools
Daarnaast zijn er talloze gespecialiseerde databanken die via een webinterface werken, maar niet open worden aangeboden aan zoekmachines. Wetenschappelijke literatuurzoekmachines, juridische databanken of catalogi van bibliotheken vragen bijna altijd om een zoekopdracht binnen de site zelf. De inhoud is dus aanwezig op het internet, maar niet indexeerbaar als losse pagina’s.
Verschil tussen deep web en dark web
Het dark web is een klein, bewust verborgen deel van het deep web dat alleen toegankelijk is met speciale software, zoals de Tor-browser. Daar vind je zowel legale als illegale activiteiten, maar het is qua omvang veel kleiner dan het gewone deep web. Het deep web als geheel is juist vooral functioneel en noodzakelijk voor privacy, beveiliging en afgeschermde informatie.