Schreibe uns einen Kommentar Diese Sendung soll nie aufhören?
Unterstütze die Metaebene
China — Schweden — Goatmire — Open Vehicle Control System — Sonic Pi — Nerves — Trellis — Tolino — Dithering — Applekram — LLMs und Halluzinationen AutoCodeBenchmark — Røde Call Me
Ralf ist verhindert und wir begrüßen dafür erneut Luka in unserer Runde. Roddi ist zurück aus China und berichtet von seiner Reise an die chinesische Ostküste. Tim und Luka wiederum waren in Schweden und erzählen von ihrer Teilnahme an der Goatmire-Konferenz.
Wir reden über das Open Vehicle Control System, einem zu einem Elektroauto umgebauten Verbrenner-Polo, der komplett durch Open Source Software gesteuert wird, über ein weiteres Computational Music System namens Sonic Pi, die IoT-Distributions- und Betriebsplattform Nerves des Elixir-Ökosystems und einen Badge-Prototyp für den 39C3, den Tolino-E-Reader, Dithering und ein wenig den in der letzten Woche vorgestellten Applekram.
Dann nehmen wir uns noch mal AI vor und schauen auf das Paper von OpenAI wie sie glauben das Halluzinationsproblem in den Griff bekommen zu können und den AutoCodeBenchmark bei dem Tencent 30 LLMs auffordert in 20 verschiedenen Programmiersprachenen 6800 Programmieraufgaben zu lösen und ihr werdet nicht glauben, was dabei am besten abgeschnitten hat.
Tim Pritlove
Website
Letterboxd
Bluesky
Amazon Wishlist
Liberapay
SEPA-Überweisung via Online-Banking-Software
Paypal
roddi
GitHub
Mastodon
Website
Amazon Wishlist
Luka Dornhecker
GitHub
Mastodon
Website
Linkedin
Letterboxd
Für diese Episode von Freak Show liegt auch ein vollständiges Transkript
mit Zeitmarken und Sprecheridentifikation vor.
Bitte beachten: das Transkript wurde automatisiert erzeugt und wurde nicht nachträglich gegengelesen oder korrigiert.
Dieser Prozess ist nicht sonderlich genau und das Ergebnis enthält daher mit Sicherheit eine Reihe von Fehlern.
Im Zweifel gilt immer das in der Sendung aufgezeichnete gesprochene Wort.
Formate:
HTML,
WEBVTT.
Shownotes
DeepL Übersetzer: Der präziseste Übersetzer der Welt
— deepl.com
WeChat
— de.wikipedia.org
Alipay
Nomad – Internationale Daten-eSIMs in 200 Zielen
— Nomad
Varberg
— de.wikipedia.org
Goatmire Elixir & NervesConf EU
— goatmire.com
Conference Report: Goatmire Elixir 2025
— Underjord
OVCS intro
— YouTube
OVCS
— GitHub
On-Board-Diagnose
— de.wikipedia.org
Strudel REPL
— strudel.cc
Nerves Project
— nerves-project.org
NervesHub
— nerves-hub.org
— Mastodon
Tolino
— de.wikipedia.org
tolino - Die eReading Marke der deutschen Buchhändler
— MyTolino
GitHub - protolux-electronics/name_badge
— GitHub
GitHub - protolux-electronics/goatmire
— GitHub
GitHub - qpdf/qpdf: qpdf: A content-preserving PDF document transformer
— GitHub
Innsbruck, ich muss dich lassen
Innsbruck, ich muss Dich lassen - Die Singphoniker
— YouTube
Return of the Obra Dinn on Steam
— store.steampowered.com
Turning Images into Dots: The Magic of Dithering
— YouTube
Aluminium vs. Titan, was ist der Unterschied?
— Aria | Online Manufacturing For On-Demand Custom Services
Schwuppdizität | IT.Niedersachsen
— it.niedersachsen.de
— Mastodon
Warum Sprachmodelle halluzinieren
— openai.com
Why Language Models Hallucinate
— arxiv.org
Did OpenAI just solve hallucinations?
— YouTube
GitHub - Tencent-Hunyuan/AutoCodeBenchmark
— GitHub
AutoCodeBench: Large Language Models are Automatic Code Benchmark Generators
— autocodebench.github.io
AutoCodeBench: Large Language Models are Automatic Code Benchmark Generators
— arXiv.org
AutoCodeBenchmark/figures/exp_acb.png at main · Tencent-Hunyuan/AutoCodeBenchmark
— GitHub
RØDE CallMe
— RØDE Microphones
Blondie - Call me
— YouTube