Stellen Sie sich vor, Sie begegnen einem alten Bekannten auf der Strasse, aber können sich nicht mehr an dessen Namen erinnern. Um peinlichen Nachfragen zu entgehen, richten Sie einfach dezent die Kamera ihres Handys auf sein Gesicht.
Schon erscheinen – oh Wunder – Name und Profil Ihres Gegenübers auf dem Display. Das klingt befremdlich, ist aber in Ansätzen schon heute Realität. So brachte die Foto-Seite Riya im Herbst 2006 eine neue Suchmaschine auf den Markt, die allein anhand von Gesichtszügen Personen erkennen kann. Riya setzt dabei auf einen Algorithmus, der über mathematische Gleichungen zwischen 2.000 und 4.000 Messpunkte in menschlichen Gesichtern analysiert, darunter die Charakteristika der Nase, des Kinns, der Stirn oder den Abstand zwischen dem Haaransatz und den Augenbrauen. Die Software erkennt auch Textzüge auf Fotos, z.B. auf T-Shirts oder Werbeplakaten im Hintergrund.
Bereits seit März 2006 nutzt Riya diese Technik auf seiner Foto-Website Riya.com. Seit dem Launch haben Riya-Nutzer mehr als 7 Millionen Fotos auf den Servern hochgeladen und die darauf enthaltenen Gesichter mit “Namenstags” versehen. Der Vorteil für den Nutzer: Ist das System einmal trainiert, werden künftige Familienfotos und Schnappschüsse automatisch nach Personen katalogisiert, ohne dass dazu eine manuelle Intervention notwendig wäre. Der Vorteil für Riya: Die katalogisierten “Gesichtszüge” können für ein neuartiges Suchangebot genutzt werden, dass Personen allein durch den Upload von Fotos identifiziert.
Ähnlich macht es die Firma Polar Rose, die ein Browser-Plug-in anbietet, der bei der Einblendung von Fotos auf Webseiten automatisch Informationen zu den jeweils abgebildeten Personen zeigt. Ist eine Person auf einem Foto unbekannt, fordert Polar Rose seine Nutzer zur Verschlagwortung dieser Person auf – und „trainiert“ damit die eigene Datenbank.
Nachdem die Netzwelt lange Zeit über eine Übernahme Riyas durch Google spekulierte, ist Google nun mit der Übernahme von NevenVision in den Markt der Bilderkennung eingestiegen. Künftig soll die Fotoerkennung von NevenVision in die Photosoftware Picasa integriert werden, eine spätere Ausweitung der NevenVision-Technologie auf die Google-Suchapplikationen für Fotos und Videos dürfte wohl nur eine Frage der Zeit sein.
Marktpotentiale für die automatisierte Bildanalyse ergeben sich auch im Umfeld der Produktsuche. Auf der Produkt-Suchmaschine Like.com können Nutzer (z.B.) Kleidungsstücke, Uhren oder Schmuck von Prominenten abrufen und sich zu diesen ähnliche verfügbare Produkte im Web zeigen lassen. Dabei „arbeitet“ Like.com mit der „künstlichen Intelligenz“ einer automatisierten Bilderkennungssoftware, die zu einem Bild automatisch ähnliche Produkte aus dem Netz filtern kann. Zu einem späteren Zeitpunkt könnte diese Produktsuche auch in Videos eingeblendet werden, so dass der Nutzer per Klick das Hemd von Brad Pitt (etwa aus einer Filmszene) erwerben könnte.
Die Software ist noch im Beta-Stadium, aber schon jetzt äußerst eindrucksvoll. Wer beispielsweise ein paar Schuhe auf Like.com findet, kann sich automatisch ähnliche Modelle aus dem Netz anzeigen lassen. Zudem ist es möglich, die „Kriterien“ der Ähnlichkeit verändern, (z.B. Form, Farbe, Material) - und sich etwa einen roten Schuh in gelb zeigen zu lassen
Geld verdienen möchte Like.com mit Provisionen für Produktreferenzen (alle Produkte sind mit eCommere-Anbieteren wie Amazon verlinkt). Programmiert wurde Like.com auf der Basis von Riya (s.o.).
Angesichts der Leistungsfähigkeit der Software in der Beta-Version stellt sich die Frage, wie lange es noch dauert, bis Suchmaschinen nach der Vorgabe eines Bildes (z.B. eines Produktfotos) sich automatisch „auf die Suche“ nach ähnlichen Produkten machen.
Auch die gesprochene Sprache ist bereits durchsuchbar. Die Audio- und Video-Suchmaschine Podzinger etwa durchsucht über eine Spracherkennungssoftware Podcasts und Videos auf YouTube, und blendet in diese kontextspezifische Werbung ein (vgl. Kap. X). Noch einen Schritt weiter geht die Audio- und Video-Suchmaschine Blinkx, die in ihrer Suche Sprach- und Bilderkennung sowie Nutzergenerierte Verschlagwortungen kombiniert.
Eine Suche nach „George W. Bush“ liefert auf Blinkx beispielsweise alle Videos, die mit diesem Namen verschlagwortet wurden, in denen der Name erwähnt wird oder in denen das Gesicht von Bush auftaucht, und verlinkt ggf. direkt auf die relevante Stelle innerhalb des Videos. Neben Internet-basierten Formaten indexiert Blinkx hierzu eine Reihe von terrestrischen Radio- und Videoprogrammen in den USA, insgesamt umfasste der Index von Blinkx Anfang 2007 rund 7 Millionen Stunden Video-Content.

