Agili 的 Hacker Podcast

Agili 的 Hacker Podcast 2026-01-08


Listen Later

欢迎来到 Agili 的 Hacker Podcast,今天我们将一起探讨 Bose 如何用开源拯救旧音箱、一个逆向电磁感应绘图板的硬核项目、Linux 内核漏洞的惊人潜伏期、一张让基础设施"裸奔"的地图、委内瑞拉的 BGP 路由异常、大模型注意力机制的数学本质、拿破仑式拖延术、以及一系列复古计算的奇妙工具。

Bose 开源旧款智能音箱:体面退出的行业范式

音频巨头 Bose 近期做出了一个罕见的决定:与其让旗下 SoundTouch 智能音箱在云端服务关停后变成"电子砖头",不如开放 API 文档,让开发者社区接管这些设备的"第二次生命"。

Bose 将公开 SoundTouch 系统的完整 API 文档,同时发布最后一次固件更新,将控制逻辑从云端转向本地网络。更新后,蓝牙、AirPlay、Spotify Connect 等核心功能将继续可用,社区可以通过构建第三方服务器来替代官方云端。

技术社区对此反响热烈。虽然有人指出 Bose 实际上只是"开放了 API 文档"而非真正"开源固件",但大多数开发者认为这已经足够——只要能控制设备连接的 API 地址,社区就能构建类似 Pebble 手表"Rebble"项目的替代生态。

讨论中一个有趣的观点是:这种"体面退出"机制应该写入法律。当联网设备的官方支持终止时,法律应强制厂商解锁引导加载程序或公开通信协议,防止功能完好的设备沦为电子垃圾。更有意思的是,不少用户表示这一举动反而增强了他们对 Bose 品牌的信任,甚至开始在二手市场淘这些"可玩性极高且不会变砖"的硬件。

Project Patchouli:开源电磁感应绘图板的逆向工程

Project Patchouli 是一个致力于将电磁感应绘图板技术彻底透明化的开源硬件项目。长期以来,这类无源无线压感笔技术一直被 Wacom 等厂商通过专利和专用芯片垄断,而这个项目提供了一套完整的硬件参考设计和深度的逆向工程文档。

项目的技术亮点包括:基于通用元件的射频前端设计,兼容 Wacom、汉王、绘王等主流厂商的压感笔;覆盖从早期 Graphire 到现代 Intuos Pro 的完整协议分析;以及一个极具冲击力的实战演示——作者成功将这套模组移植到一台松下笔记本的屏幕背面,改造成了支持压感输入的定制设备。

讨论中引发了软件工程师对底层硬件的大量探讨。社区给出了从《电子学艺术》经典教材到拆解报废设备的进阶建议。有人还分享了将绘图板设为"鼠标模式"来替代传统鼠标的经验,认为压感笔在防止重复性劳损方面具有显著优势。

一个有趣的细分讨论涉及音游《osu!》的专用开源硬件 Pompyboard,使用霍尔效应传感器实现 8KHz 轮询率,反映出开源硬件社区正在根据极致需求进行技术分化。

Linux 内核漏洞平均潜伏 2 年,有些藏了 20 年

一项对 Linux 内核 20 年 Git 历史的深度分析揭示了一个令人不安的现实:通过追踪 12.5 万个带有 Fixes: 标签的漏洞修复提交,研究发现内核漏洞平均潜伏 2.1 年才被发现,而有些漏洞甚至能藏身超过 20 年。

不同子系统的表现差异巨大。CAN 总线驱动和 SCTP 网络协议是重灾区,平均潜伏期超过 4 年,主要因为这些利基协议的测试覆盖率较低。相比之下,BPF 和 GPU 驱动的漏洞发现速度最快,得益于更密集的模糊测试。历史最长记录是一个 ethtool 中的缓冲区溢出漏洞,潜伏了 20.7 年。

从漏洞类型来看,竞争条件最难抓,平均潜伏 5.1 年;空指针解引用和死锁相对容易发现。好消息是,2022 年引入的漏洞有 69% 在一年内被发现,而 2010 年这一比例几乎为零,这主要归功于 Syzkaller 模糊测试工具的普及。

研究者开发的 VulnBERT 模型通过结合神经网络模式识别与 51 个手工特征,将漏洞预测的误报率降至 1.2%,召回率达到 92.2%。

技术社区围绕 Rust 能否解决问题展开激烈辩论。支持者认为 Rust 可以消除 70% 的内存安全干扰项,让安全专家腾出精力处理更深层的逻辑漏洞;反对者则指出,许多长寿漏洞涉及复杂的并发状态机逻辑错误,超出了 Rust 借用检查器的能力范围。

Open Infrastructure Map:现代文明的"X光扫描"

Open Infrastructure Map 是一个基于 OpenStreetMap 数据构建的全球基础设施可视化项目。如果说普通地图让我们看清了世界的表面,这个项目则是为地球进行一次"X光扫描",将电力网络、通信电缆、石油天然气管道等支撑现代文明运行的隐秘脉络清晰呈现出来。

地图上最详尽的部分是电力系统,用户可以追踪从大型电厂出发的高压线路如何逐级降压接入城市。通信部分标注了全球关键数据中心和海底光缆。在比利时等数据极其精细的区域,你甚至能看到专门标注颜色的"啤酒管道"。

讨论的核心冲突点在于:极致的透明度究竟是提升了系统的韧性,还是为破坏者提供了指南?

担忧者指出,最近柏林发生的针对电缆桥架的蓄意破坏导致了大面积停电,而这类攻击所需的信息在这张地图上几乎"手到擒来"。

反驳者则认为,"隐性安全"在物理世界和软件世界一样是虚假幻象。如果一个系统的单点故障可以通过一张公开地图就轻易被锁定,问题出在基础设施的脆弱,而不是地图的精确。公开信息反而能逼迫运营商建设更具冗余性的系统。

委内瑞拉 BGP 异常:技术失误还是政治博弈?

近日,在委内瑞拉政局剧变的同时,互联网底层协议 BGP 也出现了一次显著的路由泄露。Cloudflare Radar 监测到委内瑞拉国有电信公司 CANTV 发生的这次路由波动,并发布了技术分析报告。

Cloudflare 提出了三个理由认为这更像是技术事故而非恶意窃听:自 12 月以来该 ISP 已经发生了 11 次类似的路由泄露,暗示其路由过滤策略极为松散;泄露的路由中使用了 AS 路径填充,这会使路径在导航中显得"昂贵"和"遥远",与截获流量的动机完全相反;CANTV 本身就是受影响前缀的直接供应商,如果想监听流量无需通过复杂的 BGP 泄露。

然而,技术社区对这一分析存在明显分歧。怀疑论者指出,考虑到历史上的 Stuxnet 或 Room 641A 事件,不能对美国科技巨头的分析完全听之任之。他们提出一个核心悖论:如果 Cloudflare 真的由于某种国家安全令参与了行动或被要求配合掩盖,根据法律,他们根本不可能在博客中承认这一点。

资深网络工程师试图将讨论拉回现实:这种路由泄露在实际操作中简直是"家常便饭"。想象中的场景可能只是一个工程师在混乱中搞砸了配置,没想到几小时后这个小失误就出现在了全球技术论坛的头条。

揭秘大模型的心脏:Q、K、V 矩阵

在大语言模型技术浪潮中,Transformer 架构的注意力机制是其绝对核心,而支撑这一机制运转的正是 Query、Key 和 Value 三个矩阵。

一个直观的比喻是将注意力机制看作数据库查询系统:Query 是"我想找什么",Key 是"我包含什么信息",Value 是"我具体承载的内容"。当模型处理一个词时,它发送一个 Query 去匹配序列中所有词的 Key,匹配度越高,模型就会分配越多的注意力给对应的 Value。

在实际运算中,Q、K、V 通过输入矩阵与三个可学习的权重矩阵相乘得到。这种设计的巧妙之处在于"功能分离"——即使输入相同,通过不同的权重投影,模型可以学习到词与词之间复杂的交互模式。

技术社区对这篇文章展开了深度讨论。有人指出,注意力机制本质上是统计学中核平滑或 Nadaraya-Watson 估计的重新发明。对于"数据库比喻",批判派认为这是教学上的简化,Q 和 K 在代数上高度对称,所谓的"查询"意义在训练过程中非常模糊;支持派则提出了更酷的"天体物理模型"比喻——Token 就像潜空间中的行星,注意力机制就像万有引力,每个 Token 都在推拉周围的 Token。

拿破仑技术:当"不做"成为生产力策略

"拿破仑技术"是一个听起来反直觉但对许多高产者极具诱惑力的概念:如果一件事很可能在不需要你即时干预的情况下自行解决,那就先放一放。

这个概念源于一个著名轶事:拿破仑会命令秘书将所有信件搁置三周不拆,三周后再打开时,大约五分之四的问题已经消失了——有的自行解决,有的请求已过时,有的随着新政令变得无关紧要。

在现代工作环境中,这种"战略性延迟"不仅节省时间精力,还能培养他人的独立性,避免过度优化,以及保护深度工作时间留给真正关键的决策。

然而讨论中也出现了尖锐的警示。多位管理者指出,这种技术最危险的地方在于它极易演变成摇摆不定的"华夫饼式"管理。引用安迪·格鲁夫的观点:一个错误的决策往往好过没有决策。团队最怕的不是任务延迟,而是领导者的"失踪"。

对于有拖延倾向的人来说,拿破仑技术就像"止痛药",会让拖延看起来正当,最终积累成巨大的压力。一个扎心的观点是:如果你对上级或客户使用这种技术,你可能会发现"问题确实消失了",但"你作为可靠伙伴的声誉"也随之消失了。

vamos:Amiga 的"Wine"运行时

vamos 是一个让老牌开发者眼前一亮的项目——在现代操作系统上直接运行 AmigaOS m68k 命令行二进制文件的运行时工具。它不是完整模拟 Amiga 硬件,而是从 API 层面实现兼容。

项目使用 Musashi 模拟器处理 m68k 指令集,通过 Python 拦截所有库调用。当程序调用 Exec 或 DOS 等核心系统库时,vamos 在 Python 中模拟这些函数的行为。它主要针对不依赖图形界面的控制台工具,最典型的使用场景是作为"交叉编译器"环境,直接在现代终端调用老牌的 Amiga 编译器。

讨论中有人对"Wine for Amiga"的类比提出质疑,因为 Wine 的全称是"Wine Is Not an Emulator",而 vamos 必须模拟 m68k CPU 指令。但其核心价值在于开发流程的无缝衔接——不需要启动整个虚拟机镜像,速度极快且能直接读取主机文件系统。

Musashi:用 C 语言写就的 68k 模拟器传奇

Musashi 是一个用 C 语言编写的 Motorola 680x0 系列处理器模拟器,支持从最初的 68000 到后期的 68040 全系列,是 MAME 项目的核心组件。

项目作者 Karl Stenerud 现身评论区分享了诞生故事:那是他在日本求职期间,挤在只有几平米的公寓里,坐在地板上靠一台电脑完成的。他的挑战目标是"能否用可移植的 C 语言超越 MAME 当时使用的汇编核心",答案是肯定的。项目以《五轮书》作者宫本武藏命名,体现了开发者在极致环境下对卓越技术的追求。

这个故事引发了关于"环境与生产力"的讨论。多位开发者认为,这种"被困在某地、只有一台电脑"的极简状态往往能催生出最伟大的项目——在长途火车上或断网环境下,大脑才能真正进入深度思考。

Aardwolf MUD:纯文字虚拟世界的不朽魅力

Aardwolf MUD 是互联网早期最著名的多用户地牢游戏之一,一个在图形技术日新月异的时代依然屹立不倒的纯文字虚拟世界。

它提供了一个极其复杂的模拟系统,28 种职业、数百个充满谜题的区域、实时地图系统、嵌入 Lua 解释器的可扩展性,直到 2025 年开发者仍在不断更新。

讨论区充满了怀旧的故事。有人分享了与妻子在 MUD 中相识的浪漫经历;有人回忆起 90 年代末为了玩 MUD 产生的巨额拨号上网账单;更多人感叹,正是因为痴迷于 MUD 的构建,才自学了 C 语言走上职业程序员之路。

围绕大语言模型是否应该介入 MUD 产生了激烈辩论。支持者认为 LLM 可以瞬间生成数千个房间和具有真实对话能力的 NPC;反对者则直言不讳地将 AI 生成的内容称为"AI 废料",坚持认为 MUD 的魅力在于创作者的手工打磨和玩家之间真实的人际互动。

相关链接:

  • Bose is open-sourcing its old smart speakers instead of bricking them
  • Project Patchouli: Open-source electromagnetic drawing tablet hardware
  • Kernel bugs hide for 2 years on average. Some hide for 20
  • Open Infrastructure Map
  • A closer look at a BGP anomaly in Venezuela
  • The Q, K, V Matrices
  • The Napoleon Technique: Postponing things to increase productivity
  • The virtual AmigaOS runtime (a.k.a. Wine for Amiga:)
  • Musashi: Motorola 680x0 emulator written in C
  • Play Aardwolf MUD
...more
View all episodesView all episodes
Download on the App Store

Agili 的 Hacker PodcastBy Agili 的 Hacker Podcast