Visual Search: Die Zukunft ist jetzt

Originaltext: Edwin Toonen, Yoast / aus dem Englischen übersetzt: Karin Täschler, Complecta

Der Mensch orientiert sich hauptsächlich visuell. Er versteht ein Bild sofort. Im Vergleich dazu lesen wir unheimlich langsam und es dauert noch länger, bis wir das Gelesene verstehen. Ausserdem gibt es Personen, die auch in Bildern denken. Unter Berücksichtigung dieser Tatsachen wundert es nicht, dass die visuelle Suche vermehrt an Bedeutung gewinnt. Ihre nächste Suchanfrage könnte also schon über die Kamera-App Ihres Smartphones erfolgen. Darf ich vorstellen, Visual Search.

Was ist Visual Search?

Als Visual Search gilt jede Suche, die reale Bilder wie Fotos oder Screenshots als Ausgangspunkt nutzt. Jedes Mal, wenn Sie Ihre Google Kameralinse auf ein Bekleidungsstück richten oder über Pinterest einen Style Match veranlassen, führen Sie eine visuelle Suche durch. Visual Search beantwortet Fragen wie: „Zeige mir etwas, das ähnlich ist, aber anders“, oder „Ich weiss nicht genau, was ich will, aber ich werde es wissen, wenn ich es sehe“.

Visual Search ist nicht nur praktisch für einen Style Match oder auch, um herauszufinden, um welchen Stuhl es sich handelt, den Sie in einer trendigen Möbelausstellung gesehen haben. Es geht viel weiter – und doch stehen wir erst am Anfang. Es gibt Foto-Apps, die einen Text auf Bildern erkennen und lesen können. Computer Vision kann Unmengen von Einheiten richtig zuordnen, von berühmten Persönlichkeiten bis zu Logos und von Sehenswürdigkeiten bis zu Handschriften. Zurzeit schlägt Visual Search hohe Wellen im Mode- und Dekobereich, vor allem bedeutende Marken wie Amazon, Macy´s, ASOS und Wayfair gelten hier als Vorreiter.

Die Forschung zeigt, dass Konsumenten sehr daran interessiert sind, Visual Search als Teil ihres Einkaufserlebnisses zu nutzen. Nach einem aktuellen Bericht von Sparktoro ist die Bildersuche von Google der zweitgrösste Player bei den Suchmaschinen, 21% der Suchanfragen starten hier.

Bilder sind wichtig und werden es auch bleiben. Viele Internetnutzer in den USA würden die visuelle Suche als Standard begrüssen:

 

 

 

 

 

 

 

 

 

Heutzutage wird alles fotografiert. Nicht nur schöne Landschaften oder Schnappschüsse von Abenteuern, es werden auch Fotos gemacht, die als Erinnerungsstütze oder als To-do-Listen dienen. Es ist bereits möglich, dass Sie eine Visitenkarte fotografieren und die Kontaktdaten automatisch in Ihr Adressbuch übertragen werden. Oder Sie machen ein Foto Ihrer Einkaufsliste und fügen diese in den Einkaufswagen Ihres bevorzugten Supermarkts ein. Alles ist machbar.

Visual Search unterscheidet sich von der Bild-Suche

Visual Search ist ein Teil der sogenannten sensorischen Suche. Diese beinhaltet die Suche via Text, Stimme oder Bildern. Früher wurde fast jede Internetsuche über einen eingetippten Begriff gestartet. Inzwischen wird zunehmend via Stimme oder via Kamera-App gesucht. Da die visuelle Suche eine interessante Ergänzung zu Suchanfragen via Text und Sprachbefehl darstellt, werden sich diese drei Möglichkeiten laufend weiterentwickeln.

Visual Search spielt bei Google Lens eine wichtige Rolle.

Google Lens erkennt den Hund sofort als Shiba Inu.

Visual Search nimmt das Gesehene als Ausgangspunkt der Suche, der Bildersuchdienst von Google Image funktioniert anders. Die klassische Bildersuche startet mit der Eingabe eines Suchbegriffs, anhand dessen die Suchmaschine (SERP) diverse Bilder auflistet, die damit in Zusammenhang stehen. Die Suchergebnisse können mit dem Smart-Filter aus der Menüleiste eingegrenzt werden.

Die vielen Vorschläge, die Google Image macht, können ohne Probleme gefiltert und eingegrenzt werden.

Wie funktioniert Visual Search?

Über Visual Search wird schon lange geredet, aber so richtig Fahrt aufgenommen hat das Thema erst in den vergangenen Jahren. Smartphones mit ausserordentlicher Leistung, raffinierte Entwicklungen bei der künstlichen Intelligenz (AI) und Konsumentenwünsche treiben das Wachstum in diesem Sektor voran. Aber wie funktioniert Visual Search überhaupt?

Visual Search wird durch maschinelles Sehen (Computer Vision) angetrieben und durch maschinelles Lernen trainiert. Maschinelles Sehen kann als eine Technologie verstanden werden, die es einem Computer ermöglicht zu sehen. Er sieht aber nicht nur, er kann das Gesehene auch verstehen und etwas Sinnvolles damit anfangen. Maschinelles Sehen zielt in gewisser Weise also darauf ab, dass Computer die Welt so verstehen wie wir Menschen.

Maschinelles Sehen gibt es schon seit vielen Jahren. Dank der Entwicklung in der Computerhardware und den neuen Erkenntnissen im Bereich des maschinellen Lernens (Machine Learning), kommt die Technologie mit Riesenschritten voran. Um Bilder zu erkennen, greift die Maschine auf Algorithmen aus der Bildverarbeitung zurück. Für eine Maschine sind Bilder jedoch nur eine Menge zufälliger Zahlen – es braucht einen Kontext, um ein Bild auch nur ansatzweise zu verstehen. Durch maschinelles Lernen kann dieser Zusammenhang hergestellt werden.

Dem Computer das Sehen beibringen

Mit dem Einsatz des maschinellen Lernens kann man buchstäblich einem Computer neues Wissen beibringen – man fängt mit wenigen Daten an und steigert die Menge zunehmend. Füttert man den Computer mit genügend Daten, erkennt er bereits minimale Unterschiede. Um das Wissen weiter auszubauen, benutzt Google Querverweise und seine Wissenskurve. Damit wird es für den Computer immer einfacher, im übertragenen als auch im buchstäblichen Sinn, einzelne Puzzleteile zu einem Gesamtbild zusammenzusetzen. Viele Anbieter versehen ihre Computer mit OCR-Fähigkeiten (optische Zeichenerkennung). Damit sind Computer in der Lage, Texte innerhalb von Bildern zu erkennen und zu verstehen.

Es gibt auch viele Drittanbieter, die diese Technologie in eine bereits bestehende Software integrieren. Zusätzlich bieten Plattformen wie Cloud Vision von Google und Visual Search Developer Platform von Bing mehrere Optionen, die in Anwendungen und Websites integriert werden können.

Bing Visual Search vergleicht die Suchabsichten mit den Skills.

Anwendungsmöglichkeiten von Visual Search

Wenn Sie jetzt denken, Visual Search bringe dem durchschnittlichen Website-Eigentümer nicht viel, dann irren Sie sich vermutlich. Falls Sie denken, es wäre für die Suchmaschinenoptimierung (SEO) unbedeutend, dann liegen Sie falsch. Bekannte Marken testen dies und animieren ihre Kunden dazu, Visual Search anzuwenden. Wenn Sie im Handel tätig sind, sollten Sie diese Entwicklung im Auge behalten. Wir werden noch viele Unternehmen sehen, die in den Internethandel einsteigen und dort ganz schnell ihre Präsenz und ihren Markterfolg erhöhen werden, so wie es Pinterest macht mit seiner neuen Funktion Automating Shop the Look. Es ist schon viel los, dennoch steht Visual Search erst am Anfang.

Im Vordergrund steht derzeit, dass Computer Bilder verstehen und sie nützlich verwenden. Aber schon bald wird die visuelle Suche mit der erweiterten Realität (Augmented Reality AR) verbunden werden, vielleicht sogar mit der virtuellen Realität (VR). Während AR und VR inzwischen schon beinahe zu Tode „gehyped“ wurden, muss die Top-Anwendung der technologischen Entwicklung von Visual Search allerdings erst noch gefunden werden. Möglicherweise ist die Erweiterung der realen Welt in visuelle Suchergebnisse die Lösung?

Visual Search kann für viele Dinge genutzt werden. Sie kann bei der Suche nach einer Sehenswürdigkeit in einer fremden Stadt behilflich sein, die Produktivität verbessern oder Schuhe finden, die perfekt zum neuen Kleid passen. Sie kann Sie bei der Identifizierung von Pflanzen oder Tieren unterstützen und Ihnen helfen, alltägliche Probleme zu lösen. Die Möglichkeiten sind vielfältig.

Einige Anwendungen von Visual Search

Wer sich mit der visuellen Suche beschäftigt, trifft immer wieder auf die gleichen Anbieter. Es ist nicht aussergewöhnlich, dass fast alle grossen Marken mit Visual Search experimentieren oder daran forschen um herauszufinden, welche Vorteile maschinelles Sehen und maschinelles Lernen ihren Plattform verschaffen.

Facebook zum Beispiel arbeitet an einer mit AI (künstlicher Intelligenz) gesteuerten Version für ihren Markt. Dazu hat Facebook GrokStyle erworben, ein Technologie-Start-up für die visuelle Suche, das diese Entwicklung vorantreiben könnte. Apple hat auch einige Unternehmen aufgekauft, die aktiv sind im Bereich Visual Search – hauptsächlich, um ihre Foto-Apps zu verbessern, aber auch das Entwicklerprogramm ARKit, das sehr interessante Optionen zur Anwendung von Grafikfunktionen bietet. Zudem kann man über Snapchat und Instagram auf Amazon einkaufen, indem man seine Fotokamera auf ein entsprechendes Produkt richten.

Hier einige der aktuell am meisten genutzten Tools für Visual Search:

Pinterest Lens

Visual Search gibt es schon eine ganze Weile, aber eine Plattform hat sie deutlich ins Rampenlicht gerückt: Pinterest. Pinterest ist quasi der Ursprung. Grundsätzlich ist es eine visuelle Plattform, die es den Nutzern ermöglicht, Bilder auf eigenen virtuellen Pinnwänden zu sammeln. Anderen Nutzern dienen diese Pinnwände wiederum als Inspirationsquelle. Das ist zwar hilfreich und interessant, aber relativ statisch.

Vor ein paar Jahren fing das Unternehmen an, in Computer Vision, in künstliche Intelligenz und in Machine Learning zu investieren, was letztendlich zu einer App namens Lens führte. Durch Weiterentwicklungen entstanden Dienste wie z.B. Shop the Look Pins, das erste visuelle Shopping-Tool dieser Art. Damit startete Pinterest richtig durch.

Im Jahr 2018, ein Jahr nach der Lancierung von Lens, verzeichnete die App über 600 Millionen visuelle Suchanfragen monatlich. Das ist eine Zunahme von 140% pro Jahr.

Dies deutet auf einen kometenhaften Aufstieg hin. Wegen der Abhängigkeit zur Plattform ist diese Funktion jedoch in sich zu geschlossen, um eine kritisches Masse zu erreichen. Zudem holt die Konkurrenz auf.

Shop the Look hilft Ihnen, ähnliche Artikel zu entdecken.

Google Lens

Mit Google Lens wird das Smartphone zur visuellen Suchmaschine. Mit dieser App können Sie Ihre Kamera auf ein Objekt richten und – voilà – Sie erfahren, worum es sich dabei handelt. Google schiebt die Entwicklung von Lens ordentlich voran. Man entdeckt die Funktion bereits überall: In der Foto-App, auf Google Search und im Google Assistant.

Letzteres ist interessant: Google Assistant kann Fotos, die Sie selbst aufnehmen, weiterverarbeiten. Beispielsweise legt die Funktion ein Foto von einem Rezept automatisch in Ihrem Rezeptbuch ab. Oder er übersetzt via Google Translate die in einer Fremdsprache verfasste Schrift im Bild – live, wenn Sie möchten.

Google Lens arbeitet in Echtzeit und erkennt über eine Milliarde Produkte. Am Ende des letzten Jahres gab Google bekannt, dass Lens neu auch für die normale Bildersuche zur Verfügung steht. Vorerst nur in den USA, man kann jedoch davon ausgehen, dass sich Google Lens noch in diesem Jahr weltweit verbreitet.

Bing Visual Search

Die Internet-Suchmaschine Bing von Microsoft ist sehr wirksam im visuellen Suchraum. Microsoft betreibt viel Forschung und stellt ihr frei zur Verfügung. Das Unternehmen hat nicht nur seine visuelle Suchmaschine in eine sehr coole Mobile App integriert, sondern auch eine eigene Online-Plattform dafür verfügbar gemacht. Die Webseite zeigt die vielen Möglichkeiten der visuellen Bing-Suche. Damit Sie schnell eine eigene Vorstellung davon bekommen, wie gut es funktioniert, laden Sie am besten einfach ein Bild hoch und sehen Sie, was Bing daraus macht. Oder versuchen Sie es einfach mit einem Bildvorschlag.

Bing Mobile kann zwar ähnliches wie die anderen visuellen Suchmaschinen – Kamera auf ein Objekt richten um herauszufinden, um was es sich dabei handelt – die App hat aber ein enormes Unterscheidungsmerkmal: ihre Skills (Fertigkeiten).

Entwickler können sich damit Visual Search zu Nutze machen und einem Bild eine passende Funktion beziehungsweise den entsprechenden Skill hinzufügen. Sollten Sie eine ganze Menge Produkte haben, die Bing erkennt, dann können Sie definieren, welche Möglichkeiten Sie einem User für ein ausgewertetes Bild zur Verfügung stellen möchten. Dazu identifiziert die visuelle Suchmaschine die Absicht hinter einer Suchanfrage und verlangt nach den entsprechenden Skills. Danach verbindet Bing die Skills und sendet diese an die App. Wenn Sie einen einen Laden für Wohndekor besitzen, dann wird die Suche womöglich nicht nur eine Einkaufsfunktion enthalten, sondern auch eine für DIY (Do it yourself). Diese Skills können Sie unter Bing Visual Search Development Platform selbst erstellen. Probieren Sie es aus.

Erstellen Sie Ihre eigenen Skills für Bing Visual Search.

Amazon

Amazon nutzt die Technologie von Visual Search vor allem dazu, anderen Plattformen das visuelle Shopping beziehungsweise das Einkaufen via Kamerafunktion anzubieten. Wie ich bereits erwähnt habe, arbeitet Amazon entsprechend mit Snapchat und Instagram zusammen. Für Amazon ist die Visual Search sehr wichtig, da es die User anderer Plattformen zum eigenen Onlineshop leitet. Wenn Sie in einem Laden einen Artikel sehen, können Sie davon aber auch ein Foto mit der integrierten CamFind-Funktion der Amazon-App machen. Diese zeigt Ihnen dann sämtliche relevante Produkte auf, die auf Amazon erhältlich sind. Die Suchresultate lassen sich über visuelle Eigenschaften noch verfeinern.

Bisher schien es so, dass Amazon an einer mit AI gesteuerten Plattform namens Scout arbeitete. Letzten Monat hat Amazon jedoch bekannt gegeben, dass sie einen neuen Versand-Roboter mit dem Namen Scout entwickelt haben. Bis jetzt ist unklar, was mit dem alten Scout-Produkt passiert ist. Dieses sollte es den Usern ermöglichen, eine Art Geschmacksdatenbank aufzubauen, je nachdem, welche Produkte oder Geschmacksrichtungen Sie Liken oder eben nicht. Dies würde letztlich dazu führen, die Anzahl der Vorschläge individuell einzugrenzen und gezielt Produkte aufzuzeigen, die dem persönlichen Geschmack entsprechen.

Eine weitere interessanten Sache, an der Amazon arbeitet, ist die Verbindung von Visual Search mit der Sprachsuchanfrage. Mit Geräten wie Echo Show und Echo Spot bringt Amazon einen Sprachassistenten in Ihr Heim, die Suchresultate in Bildern anzeigt. Im Web Service gibt Amazon einen vertieften Einblick zur Anwendung von Visual Search und zeigt, wie Sie Ihre eigene Visual Search App aufbauen können.

Aber wie verbindet Google Image all dies?

Wenn Sie bis hierher gelesen haben, ist vielleicht der Eindruck entstanden, dass der Bildersuchdienst von Google abgelöst geworden ist. Falsch gedacht. Ein grosser Teil der Suchanfragen findet über die Bildersuche statt. Visual Search ist kein Ersatz dafür sondern eine Art Add-On.

Man verwendet dies in verschiedenen Situationen. Entsprechend sind auch die Resultate unterschiedlich. Wenn Sie beispielsweise wissen, was Sie brauchen, werden Sie gezielt danach im Bildersuchdienst suchen. Wenn Sie jedoch etwas Interessantes auf einem Bild sehen, von dem Sie aber nicht so recht wissen, was es ist, dann können Sie einfach auf das Bild klicken und Visual Search die Arbeit machen lassen.

Google Image hat in diesem Jahr ein Makeover erhalten. In fast monatlichen Abständen wurde etwas angepasst oder mit neuen Features erweitert. Wie schon erwähnt, ist Google Lens in den Bildergebnissen auf dem Mobiltelefon bereits integriert. Klicken Sie einfach ein Bild an und schon erfahren Sie, ob Lens es erkennen kann. Die Bildersuche wartet jetzt auch mit Filteroptionen auf, mit deren Hilfe Sie Ihr Thema gründlich erforschen und eingrenzen können, oder deckt verwandte Artikel auf, an die Sie selbst nie gedacht hätten. Jetzt gibt es auch Badges, die erkennen, ob ein Produkt direkt erwerbbar ist.

Das sind nur einige Änderungen von Google Image. Oh, habe ich erwähnt, dass Sie auch nur „flauschiger japanischer Hund“ eintippen können und der süsse Shiba Inu, den Sie vorher in diesem Beitrag gesehen haben, als Suchergebnis angezeigt wird? Dies dank semantischer Entitäten und der Wissensdatenbank von Google.

Bilder SEO: wichtiger denn je

Da wir immer häufiger Bilder als Ausgangslage für die Suche nach Produkten verwenden, sollten wir uns intensiver mit der Bilder SEO befassen. Bilder SEO spielt für viele seit jeher eine eher untergeordnete Rolle, aber bitte denken Sie nicht so. Verwenden Sie Bilder mit hoher Qualität und Relevanz und auch noch gründlich optimiert, können Sie davon richtig profitieren. Google hat das gewaltige Potenzial erkannt und engagiert sich vermehrt in diesem Bereich. Gary Illyes von Google hat kürzlich an einer AMA on Reddit gesagt:

 „Wir wissen sehr wohl, dass Mediensuchmaschinen noch viel zu wenig beachtet werden in Anbetracht der Möglichkeiten, die sie Medienhäusern bieten. Deshalb setzen wir noch mehr Ingenieure ein, um daran zu arbeiten und zudem wird unsere Öffentlichkeitsarbeit weiter ausgebaut.“

 Für die aktuellsten algorithmischen Entwicklungen der Bildersuche hat sich Google im letzten Jahr auf folgendes fokussiert:

  • Suchergebnisse basierend auf tollen Bildern und Inhalten
  • Eingabe
  • Relevanz
  • Neuheit
  • Ort
  • Zusammenhang

Dabei ist es nicht schwer, Ihre Bilder für die Bildersuche startklar zu machen. Wenn Sie mehr darüber erfahren möchten, lesen Sie auch unseren umfassenden Post unter image SEO. Hier eine kurze Zusammenfassung:

  • Wo es relevant ist, strukturierte Daten verwenden: Bilder markieren
  • Bild mit einem ALT-Attribut hinterlegen
  • Einzigartige Bilder verwenden – keine Archivbilder
  • Weisen die Bilder eine hohe Qualität auf, werden sie von der AI schnell erkannt
  • Das Bild an der richtigen Stelle im Text einführen, um ihn zu ergänzen
  • Geben Sie der Bilddatei einen Namen, nicht IMG168393.jpg
  • Beschriften Sie wenn nötig das Bild
  • Richtige Bildgrösse wählen
  • Bilder immer komprimieren!

Unsere Welt ist visuell: Jetzt können Sie auch visuell suchen

Im letzten Jahr haben wir gesehen, wie die sensorische Suche immer mehr an Bedeutung gewonnen hat. Erst war vor allem von der Suche via Sprachbefehl die Rede. Visual Search eröffnet eine nützliche neue Dimension.

Oftmals ist eine visuelle Suche viel sinnvoller als die Sucheingabe via Stimme. Manchmal ist es auch umgekehrt. Deshalb werden visuelle Suchmaschinen und solche, die mit Stimmerkennung arbeiten, auch nicht zum alleinigen Standard werden: Denn sie bauen auf den Stärken und Schwächen des anderen auf. Zusammen mit der altbewährten Textsuche haben Sie als Anwender nun verschiedene Möglichkeiten, um ganz nach Bedarf Ihre Suchanfrage zu starten.

Nun …, wo bleibt der Gedankenleser?