In diesem Video zeige ich Euch (auch live), wie erstaunlich gut Googles multimodales KI-Modell Gamma 4 ist. Neben typischer KI-"Textverarbeitung" wie das Zusammenfassen von Texten, Erstellen von Videobeschreibungen oder -titeln, kann Gemma 4 auch mit Bildern und Audiodaten umgehen. Dazu lasse ich einige Bilder (z.B. das Foto eines TFTs, auf dem der BIOS-Einstelldialog zu sehen ist oder einen Comicstrip) analysieren, stelle Fragen dazu und bekomme ziemlich gute Bildbeschreibungen oder Übersetzungen der Sprechblasen. Um die Audiofähigkeit zu testen, lasse ich die Handlung eines 50-minütigen Hörspiels zusammenfassen, was im Großen und Ganzen ebenfalls gelingt.
Folien, Links, etc.: https://goos-habermann.de/weisheit-10272-KI-Modell-Gemma-4-angetestet-Was-kann-es-was-nicht00:51 Was ist Gemma 4? + Themenausblick
08:42 Gemma 4 starten
12:25 Selbstdarstellung Gemma 4: Was ist gut?
13:38 Selbstdarstellung Gemma 4: Was ist nicht so gut?
14:36 Wissensabfrage: 10 Interessante Fakten über Debian
15:34 Hörspiel zusammenfassen lassen
17:47 Bilder beschreiben lassen: Was ist das?
19:27 llama.cpp-Oberfläche
19:56 "Was ist das?": Bildschirmfoto
25:03 "Was ist das?": Aufgeklappter Drucker
25:43 "Was ist das?": GnuPfauZeh-Einhornzuckerware
27:08 "Was ist das?": Tux mit kleinen Pinguinen
31:14 "Was ist das?": Koreanische Getränkepackung
35:42 Suchbild: Wo ist der Frosch?
37:13 "Was steht in den Sprechblasen?": Comicstrip lesen
39:36 Programmieren: PHP-Skript + Caddy-Konfiguration
47:21 Programmieren nach Dokumentation
53:03 Erstellen: Video-Beschreibung, -Titel & -Tags
=== Dienstleistungen und Hilfe ===
Meine Arbeit unterstützen/Video sponsoren: https://goos-habermann.de/Sponsor
Beratung und Support zum Thema: https://goos-habermann.de/Videosupport
Workshops und Schulungen: https://goos-habermann.de/Schulung
Vortrag buchen: https://goos-habermann.de/Wunschvideo
Softwareentwicklung (z.B. zu m23): https://goos-habermann.de/Entwicklung
Dienstleistungen buchen und (Beratungs-)Terminvereinbarung: https://goos-habermann.de
Softwareverteilungssystem m23: https://m23.goos-habermann.de und http://m23.sf.net
=== Mehr zu "Nicht der Weisheit letzter Schluß" ===
Meine Arbeit unterstützen: https://weisheit.goos-habermann.de/Videosponsor
Projektseite: https://weisheit.goos-habermann.de
YouTube: https://youtube.com/@nichtderweisheit
PeerTube: https://tube.tchncs.de/c/ndwls
Mastodon: https://mastodon.social/@LinuxLeben
RSS: https://goos-habermann.de/ndwls-rss.xml
=== Mehr zu mir woanders ===
Kurzanleitungen und Howtos: https://goos-habermann.de/kurzanleitungen
Freie Projekte "Dodger Tools": https://goos-habermann.de/dodger-tools
Kieler Open Source und Linux Tage: https://www.kielux.de
Jean und Hauke Show: https://www.youtube.com/c/LinuxGuides
WARNUNG: Wie auch bei meinen Howtos/Kurzanleitungen gilt: Bei jedem Schritt kann es
zum kompletten Datenverlust und/oder Zerstörung Eurer Hardware kommen.
Alle Angaben ohne Gewähr! Haftung ausgeschlossen!