LEBEN-FĂśHREN

577🤖 Embeddings: Datensuche neu gedacht


Listen Later

Das Problem mit herkömmlichen Datenbanken

Stellen Sie sich vor: Sie suchen in Ihrer Buchhaltung nach “Reisekosten 2025” und bekommen nur die Hälfte der Ergebnisse. Warum? Weil Ihre Mitarbeiter die Daten unterschiedlich abgespeichert haben – mal “Reisekosten 25”, mal “Reisekosten ’25” oder “Reisekosten-5”. Herkömmliche SQL-Datenbanken arbeiten nach dem strikten If-Then-Prinzip und finden nur exakte Übereinstimmungen.

Large Language Models (LLMs) funktionieren jedoch völlig anders: Sie arbeiten mit Bedeutung, nicht mit exakten Suchbegriffen. Hier kommen Embeddings ins Spiel – eine revolutionäre Art, Daten zu speichern.

Was sind Embeddings?

Ein Embedding ist ein Zahlenvektor, der Bedeutungen in einem mehrdimensionalen Raum darstellt. Stellen Sie sich vor, wir haben einen dreidimensionalen Raum mit den Achsen:

  • Tot (0) bis Lebend (1)
  • Fest (1) bis FlĂĽssig (0)
  • Kalt (0) bis Warm (1)
  • Menschen hätten den Vektor [1, 0.1, 0.5] – sie leben, sind größtenteils nicht fest (viel Blut, Muskeln) und halbwarm. Landtiere bekämen den identischen Vektor. Insekten hingegen [1, 0.5, 0.1] – sie leben, sind durch ihren Chitinpanzer fester, aber kaltblĂĽtig.

    Wie funktioniert die Suche?

    Wenn Sie nach “Was lebt alles?” suchen, kommen Menschen, Landtiere, Insekten und Fische zurück – alle haben eine 1 bei “lebendig”. Pudding mit [0, 0.3, 0.5] fällt raus, da er nicht lebt.

    Bei einer Suche nach ähnlicher Konsistenz könnte Pudding jedoch zusammen mit Menschen auftauchen – beide haben ähnliche Werte bei “Konsistenz”.

    Die technische Realität

    In der Praxis verwenden Embeddings nicht drei, sondern bis zu 8.192 Dimensionen! Standard-Systeme arbeiten mit etwa 1.536 Dimensionen, wobei jede Dimension eine 32-Bit-Float-Zahl ist. Das ergibt pro Vektor etwa 6 Kilobyte Daten.

    Was diese einzelnen Dimensionen genau repräsentiren, bleibt jedoch ein Mysterium. Die Bedeutung entsteht erst durch den gesamten Vektorraum, nicht durch einzelne Dimensionen.

    Der Gamechanger fĂĽr Ihre Datensuche

    Embeddings lösen das Ausgangsproblem elegant: Suchen Sie nach “Reisekosten 2025”, findet das System alle Varianten – “Reisekosten ’25”, “Reisekosten 25” oder “Reisekosten-5”. Das System erkennt die gleiche Bedeutung und liefert vollständige Ergebnisse.

    Zusätzlich können Sie Metadaten anhängen: Wer hat den Eintrag erstellt? Welcher Betrag? Diese bleiben durchsuchbar via klassischem If-Then-Prinzip, während die Hauptsuche über Vektorähnlichkeit läuft

    Ausblick

    Embeddings sind die Grundlage für moderne KI-Anwendungen. Sie ermöglichen es Maschinen, mit Bedeutungen zu arbeiten statt nur mit exakten Begriffen. In der nächsten Episode schauen wir uns Vektordatenbanken an – die Speichersysteme für diese revolutionäre Technologie.

    Bleiben Sie in FĂĽhrung

    Ihr Olaf Kapinski

    -----------------------------------------------------------

    Lesen Sie den kompletten Beitrag: 577🤖 Embeddings: Datensuche neu gedacht
    -----------------------------------------------------------
    Hinweise zum Anmeldeverfahren, Versanddienstleister, statistischer Auswertung und Widerruf finden Sie in der Datenschutzerklärung.

    ...more
    View all episodesView all episodes
    Download on the App Store

    LEBEN-FĂśHRENBy Olaf Kapinski


    More shows like LEBEN-FĂśHREN

    View all
    IQ - Wissenschaft und Forschung by Bayerischer Rundfunk

    IQ - Wissenschaft und Forschung

    49 Listeners

    Der Dirk Kreuter Podcast by Dirk Kreuter: Unternehmer, Investor, Mentor, Bestseller Autor

    Der Dirk Kreuter Podcast

    8 Listeners

    Das Wissen | SWR by SWR

    Das Wissen | SWR

    115 Listeners

    IT’S IN YOU. Der Podcast mit Alexander Müller (ehemals Greator) by Greator

    IT’S IN YOU. Der Podcast mit Alexander Müller (ehemals Greator)

    9 Listeners

    No B-S Body | Klartext auf dem Weg zum Traumkörper mit Sjard Roscher by Sjard Roscher

    No B-S Body | Klartext auf dem Weg zum Traumkörper mit Sjard Roscher

    3 Listeners

    Der 7Mind Podcast by Achtsamkeit & Mentales Wohlbefinden

    Der 7Mind Podcast

    6 Listeners

    Handelsblatt Disrupt - Der Podcast ĂĽber die Zukunft der Wirtschaft by Larissa Holzki, Handelsblatt

    Handelsblatt Disrupt - Der Podcast ĂĽber die Zukunft der Wirtschaft

    15 Listeners

    Smarter leben by DER SPIEGEL

    Smarter leben

    41 Listeners

    Finanzfluss Podcast by Finanzfluss

    Finanzfluss Podcast

    29 Listeners

    Wegen guter FĂĽhrung - Der ehrliche FĂĽhrungspodcast by Harvard Business manager

    Wegen guter FĂĽhrung - Der ehrliche FĂĽhrungspodcast

    3 Listeners

    Aha! Zehn Minuten Alltags-Wissen by WELT

    Aha! Zehn Minuten Alltags-Wissen

    30 Listeners

    Der KI-Podcast by ARD

    Der KI-Podcast

    17 Listeners

    KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

    KI-Update – ein heise-Podcast

    4 Listeners

    Handelsblatt KI-Briefing - Das News-Update zu KĂĽnstlicher Intelligenz by Larissa Holzki

    Handelsblatt KI-Briefing - Das News-Update zu KĂĽnstlicher Intelligenz

    0 Listeners

    Wind und Wurzeln - mit Marina Weisband by Marina Weisband mit hauseins

    Wind und Wurzeln - mit Marina Weisband

    3 Listeners