Logo
Kontakt

E-Mail: info(at)studio1.de
Telefon: 03606 67960
 

Kontakt­                   ­Newsletter

Support

Supportanfrage stellen im: 

IT Service Desk

Vektorbasierte Suche – die Revolution in der KI

15 Nov 2024

Wer forscht, muss investieren. Das gilt in jedem Fachgebiet. Umso schöner, dass der Freistaat Thüringen diese Arbeit fördert. Aus Mitteln des Europäischen Sozialfonds (ESF plus) unterstützt er Unternehmen dabei, Eigeninnovationen voranzutreiben. 

Da machen wir mit und haben unser Herz bereits seit einigen Jahren der „innovativen Sache“ verschrieben: mit mittlerweile drei Mitarbeitern, die sich neben dem Alltagsgeschäft mit Themen wie der künstlichen Intelligenz, der sprachbasierten Websuche oder der Optimierung von Datamanagementsystemen beschäftigen. Unser neuestes Forschungsfeld im Rahmen des oben genannten Förderprogramms (Vorhabensnummer: 2024 INP 087) ist die sogenannte vektorbasierte Suche. 

Mehr erfahren

Das Prinzip der vektorbasierten Suche ist eine Methode, mit der Computer Inhalte wie Texte, Bilder oder Musik nicht wortwörtlich, sondern inhaltlich vergleichen können.

Wie funktionieren Vektoren in der Suche?

Vektordatenbanken könnten die Nutzung von künstlicher Intelligenz revolutionieren, weil sie „anders suchen“. Im Gegensatz zur Volltextsuche, bei der Ergebnisse zurückgeliefert werden, die auf Worthäufigkeiten beruhen, verarbeitet die vektorbasierte Suche hochdimensionale Vektoren und vergleicht Daten hinsichtlich ihrer Ähnlichkeit.

So funktioniert's:

Umwandlung in Zahlen: Inhalte (z. B. ein Text oder ein Bild) werden in einen sogenannten Vektor umgewandelt. Das ist eine Liste von Zahlen, die die wichtigsten Eigenschaften des Inhalts beschreibt – wie eine Art Fingerabdruck.
Ähnlichkeiten messen: Wenn Sie etwas suchen, wird auch Ihr Suchbegriff oder Ihre Anfrage in einen Vektor umgewandelt und der Computer Ihren Vektor mit den Vektoren anderer Inhalte, indem er misst, wie „nah“ sie sich sind.
Treffer anzeigen: Inhalte, deren Vektoren Ihrem Vektor besonders ähnlich sind, werden als Suchergebnisse angezeigt.

Warum ist das nützlich?

  • Die Vektorsuche kann synonyme Begriffe erkennen (z. B. „Auto“ und „Fahrzeug“).
  • Sie funktioniert auch bei unscharfen oder ungenauen Eingaben, weil sie nicht nach exaktem Wortlaut, sondern „sinngemäß“ vergleicht.
  • Sie kann in Anwendungen wie Bilderkennung, Sprachverarbeitung oder Empfehlungssystemen genutzt werden.
Suche neu gedacht?

Vektorbasierte Suchen spielen in ganz verschiedenen Kontexten eine Rolle und werden auch die Arbeit der großen Suchmaschinen dieser Welt weiter optimieren. Vielleicht müssen wir uns bald gar keine Gedanken mehr über die richtigen Keywords in unseren Webtexten machen. Denn da die Vektorsuche ihre Ergebnisse mit Distanzberechnungen ermittelt, kann sie viel kontextbezogener arbeiten. Damit ist es nicht mehr notwendig, die richtigen Schlüsselbegriffe verwenden zu müssen. Gepaart mit KI ergeben sich deutlich bessere Suchergebnisse mit gezielter Kundenansprache, welche im Umfeld E-Commerce zu deutlich mehr Lead- und Umsatzsatzgenerierung führen können.

Einsatzfelder von Vektoren

KI-Anwendungen wie ChatGPT und Suchmaschinen arbeiten bereits mit dieser Art der Suche. Google beispielsweise hat seine klassische Schlüsselwort-basierte Suchmethode längst durch vektorbasierte Ansätze erweitert, insbesondere mit BERT (Bidirectional Encoder Representations from Transformers) und MUM (Multitask Unified Model). Diese Modelle verstehen die semantische Bedeutung von Suchanfragen besser, indem sie Texte in Vektoren umwandeln. 

Wo wir als Agentur mit der vektorbasierten Suche arbeiten möchten? Sie kann zum Beispiel helfen, die Suche innerhalb von PIM-MAM- oder E-Commerce-Systemen zu optimieren und bessere Treffer zu liefern. Durch eine Verknüpfung mit KI lassen sich die Ergebnisse sogar automatisiert anreichern, sodass auf Basis der Suchanfrage direkt Texte für Kommunikationsmittel generiert werden können.

Fazit 

Wir sind gespannt auf die Ergebnisse unserer Forschung und hoffen auf Erfolg, denn je mehr Arbeit auf diesem Gebiet stattfindet, desto geringer wird der Anteil an aufwendigen Eigenentwicklungen in der IT. Und je breiter das „Baukastensystem“ wird, desto mehr individuelle Anforderungen werden abgedeckt, desto schneller wird publiziert, desto besser wird letztlich verkauft.

Bildquelle: © adam121 / Fotolia.com