Lesezeichen
‹ Alle Einträge

Googles neue Datenstaubsauger

 

Suchmaschinen kommen nicht überall hin, auch die mächtigste Suchmaschine der Welt nicht. Juwelen wie, sagen wir mal, der Fahrplan des Berliner Nahverkehrs stehen zwar im Netz, aber man muss ein Formular ausfüllen, um zu wissen, wann der Bus kommt. Solche Formulare sind Suchmaschinen-Hindernisse, bislang jedenfalls. Hinter ihnen beginnt das so genannte „deep web“ – Daten, so tief, dass man sie als einfache Suchmaschine niemals erreicht.

Es sei denn, man tut so, als wäre man Kunde des Berliner Nahverkehrs, fragt alle möglichen Verbindungen nacheinander ab, und merkt sich die Antworten. Hört sich irre an. Aber genau das plant Google:

Deep web content is surfaced by simulating form submissions, retrieving answer pages, and putting them into the web index.

[Via Geeking with Greg: Google and the deep web ]

Mal schauen, ob sich das alle gefallen lassen. Beim Bücher einlesen hat man ja schon gesehen, wie schlecht Googles Speicherwut bisweilen ankommt.