Blog der Bildagentur F1online

Ein Interview mit Prof. Dr. Kai U. Barthel zu den Schwierigkeiten und Lösungsansätzen bei der computergestützten Ähnlichkeitssuche von Bildern.

Woher soll ein Computer wissen, wann Bilder aus einer Masse von mehreren Millionen, ähnlich sind? Welche Parameter kann man nutzen, um ein Suchergebnis zu erhalten, dass sich wirklich sehen lassen kann? Angetrieben von diesen beiden Kernfragen entwickelte Prof. Dr. Barthel mit seinem Team aus Spezialisten für Bildverarbeitung und Bildkompression ein Suchprinzip, welches außergewöhnlich gut zu funktionieren scheint. F1online hat die Neuentwicklung von Pixolution aus Berlin als erste digitale Bildagentur in ihre Bildsuche implementiert.

(A) Die Ähnlichkeit beider Bilder ist eindeutig.

 

 

Welche Bilder sind für einen Mensch ähnlich, welche für einen Computer?

Menschen beschreiben Bilder nach ihrem Inhalt nach dem „Sinn“ des Bildes. Computer hingegen sind aktuell noch weit davon entfernt, Bilder inhaltlich zu verstehen. Bis jetzt ist es nur möglich, Bilder mit ähnlichen Farbverteilungen, Texturen oder Kantenverläufen etc. zu finden. Die Bildsuchfähigkeiten eines Computers sind in etwa so gut ausgeprägt wie die eines stark kurzsichtigen Bildredakteurs, der ohne Brille ins Archiv geht, um Bilder zu suchen. Bilder, die von ihrem Aussehen her eindeutig sind, lassen sich recht gut finden (A). Häufig werden allerdings auch Bilder gefunden, die zwar ähnlich aussehen, aber unterschiedliche Dinge darstellen (B). Bilder, die unterschiedlich aussehen, aber ähnliche Dinge zeigen, werden vom Computer nicht gefunden (C).

 


(B) Ähnliches Aussehen, unterschiedliche Dinge.

 

 

Warum gestaltet sich die Suche nach ähnlichen Bildern so schwierig?

Die Menge an digitalen Bildern steigt permanent, Agenturen bieten Millionen von Bildern an, die niemand mehr vollständig überblicken kann. Sucht man dann nach einem bestimmten Bild, so erfolgt dies meist mit Schlagwörtern. Dabei gibt es folgendes Problem: Wird nur ein einziges Schlagwort verwendet, erhält man meist eine extrem große Ergebnismenge. Verwendet man dagegen mehrere Schlagwörter, so werden häufig nur noch sehr wenige Bilder gefunden. Grundsätzlich gibt es solche Bilder natürlich, jedoch sind sie nicht exakt mit den Begriffen dieser Suchanfrage verschlagwortet. Dies ist das eigentliche Problem der Bildsuche mit Schlagwörtern: Man findet entweder fast alle Bilder oder gar keine!


(C) Ähnliche Dinge mit unterschiedlichem Aussehen.

 


Was macht ihre Technologie für F1online so interessant?

Pixolution hat eine sehr leistungsfähige visuelle Bildsuche entwickelt, die als einzigartige Besonderheit die Kombination von visueller Bildsuche und Schlagwortanalyse hat. Dadurch werden die Vorteile beider Verfahren vereint: Es werden visuell ähnliche Bilder gefunden, und durch die Analyse der Schlagwörter kann sichergestellt werden, dass die gefundenen Bilder nicht nur ähnlich aussehen, sondern auch passenden Inhalt haben. Grundsätzlich funktioniert dieses Verfahren sehr gut. Es erfordert allerdings, dass die Verschlagwortung der Bilder angemessen erfolgt ist. Zu wenige oder zu viele bzw. falsche Schlagwörter können das Ergebnis verschlechtern.

 


Wie geht’s weiter, was können die Kunden noch erwarten?

Hier sind drei Entwicklungen zu nennen: Zum einen entwickeln wir unsere visuellen Bildsuchtechnologien permanent weiter, so dass diese immer präziser werden. Zum zweiten entwickeln wir Vorschlagsysteme. Unserer Bildsuchsystem lernt Beziehungen zwischen Bildern. Damit können dem Nutzer automatisch noch besser andere Bilder vorgeschlagen werden, die gut zu seiner Suchintention passen. Als drittes werden neue Präsentationsformen der Bilder entwickelt: Anstelle „langweiliger“ Bildlisten zum Scrollen, werden andere Visualisierungen ermöglicht. Mit sortierten Bildern in einem zwei- oder dreidimensionalen Raum können große Bildmengen gezielt erkundet werden.

+++

 

Zur Person Prof. Dr. Kai U. Barthel:
Er ist Professor für „Visual Computing“ an der HTW Berlin. Zuvor hat er sich in Berliner Firmen mit Bildverarbeitung beschäftigt. An der TU Berlin promovierte er über fraktale Bildkompression und am Institut für Nachrichtentechnik waren er und sein Team an der JPEG-Standardisierung beteiligt. Heute ist er, als Mitbegründer und Vordenker der Berliner Pixolution GmbH, einer der führenden Wissenschaftler im Bereich computergestützer Bildverarbeitung. Pixolution arbeitet eng mit dem HTW Berlin zusammen.

 

 

Von ,Funktionen



Kommentar
Pflichtfelder *