Agili 的 Hacker Podcast

Hacker News 每日播报 2025-07-29


Listen Later

欢迎收看 Hacker News 每日播报!今天我们聊聊并发编程语言 Pony 的独特设计、能在旧笔记本上写游戏的本地大模型、让 LLM 犯错的“猫咪事实”、挑战硬件安全的 Volt Boot 攻击,以及从金融科技的批判到一支经典圆珠笔的魅力。

Pony:一门采用 Actor 模型、能力安全的高性能编程语言

在并发编程领域,Pony 语言以其独特的理念脱颖而出。它旨在通过创新的“Actor 模型”和“引用能力”(Reference Capabilities)系统,从根本上消除数据竞争、死锁和异常等传统并发编程的痛点。

核心特性
  • Actor 模型与并发安全:Pony 中所有的计算都发生在独立的 Actor 内部。Actor 之间通过异步消息传递通信,各自拥有私有状态,不共享内存。这种设计从源头上杜绝了数据竞争。
  • 能力安全 (Capabilities Security):这是 Pony 最强大的特性。它的类型系统不仅定义数据结构,还定义了对数据的“访问能力”。编译器通过静态分析,在编译时就能保证内存安全和并发安全,开发者无需手动管理锁。
  • 高性能:Pony 是一门编译型语言,能生成高效的机器码,性能接近 C/C++。其轻量级的运行时和独特的无暂停垃圾回收器(GC),使其在实时性要求高的场景中表现出色。
  • 社区洞察

    Pony 的创新设计引发了开发者们的热烈讨论,大家常将其与现有主流并发方案进行比较。

    • 与 Rust 和 Go 的比较:大家认为,Pony 和 Rust 都致力于在编译时保证安全,但实现路径不同。Rust 依靠所有权和借用检查,而 Pony 则通过 Actor 模型和引用能力。相比 Go 语言的 Goroutines 和 Channels,Pony 在不使用锁的情况下实现并发,其无暂停 GC 对延迟敏感的应用更具吸引力。
    • 学习曲线与生态:Pony 的“引用能力”概念虽然强大,但对新用户来说有一定学习门槛。同时,作为一个相对小众的语言,其生态系统(如 Web 框架、数据库驱动等)的成熟度也是开发者在选择技术栈时考量的关键因素。尽管如此,对于那些深受并发问题困扰的团队来说,Pony 提供了一个值得探索的、充满前景的解决方案。
    • 我那用了两年半的笔记本电脑,现在能用 GLM-4.5 Air 写出《太空侵略者》了

      开发者 Simon Willison 最近分享了一项惊人的成就:他在一台两年半前的 MacBook Pro M2 笔记本上,成功运行了一个 1060 亿参数的大型语言模型 GLM-4.5 Air,并用它生成了功能完整的 JavaScript 版《太空侵略者》游戏。

      本地 AI 的飞跃

      Simon 使用了 Z.ai 开源的 GLM-4.5 Air 模型的一个 3 比特量化版本,将模型大小从 200GB+ 压缩到了 44GB。结合 Apple 的 MLX 框架,他仅用一句简单的提示——“编写一个实现《太空侵略者》的 HTML 和 JavaScript 页面”,模型便生成了无需任何修改即可直接运行的完整代码。

      这一进展标志着本地运行的编码模型已经变得异常强大。在运行过程中,模型峰值内存占用约为 48GB,这对于一台拥有 64GB 内存的笔记本来说已经触手可及。

      社区反响

      这一成果在社区中激起了巨大的热情。

      • 惊叹与兴奋:许多开发者对个人设备能拥有如此强大的 AI 辅助开发能力感到兴奋,认为这极大地降低了 AI 实验的门槛。代码“一次性成功运行”这一点尤其令人震惊,这表明模型对逻辑和上下文的理解达到了新的高度。
      • 理性的分析:也有观点指出,《太空侵略者》的代码结构相对简单,是许多编程教程的入门案例,对于大模型来说可能并非最难的任务。同时,48GB 的内存占用对于大多数普通用户(16GB 或 32GB 内存)来说仍是一个不小的门槛。
      • 硬件与未来:大家普遍认为,Apple Silicon 芯片的统一内存架构是实现这一成就的关键。人们开始展望,随着模型优化和硬件发展,本地 AI 将如何改变软件开发流程,例如在离线环境中进行代码补全、重构甚至原型开发。
      • OpenAI 推出 ChatGPT“学习模式”

        OpenAI 近期为 ChatGPT 增加了一项新功能——“学习模式”(Study Mode),旨在帮助学生从单纯地寻求答案,转向更深层次的理解和知识构建。

        该模式的核心理念是提供循序渐进的指导,而非直接给出最终答案。它融合了教师和教育学专家的见解,通过引导性问题和互动式提示,鼓励学生主动学习和反思。

        主要特性
        • 互动式提示:采用苏格拉底式提问法,引导用户深入理解概念。
        • 支架式响应:将复杂信息分解成易于理解的部分,并突出知识点之间的联系。
        • 个性化支持:根据用户的技能水平和历史对话,量身定制教学内容。
        • 知识检查:通过测验和开放式问题巩固知识,并提供个性化反馈。
        • 灵活性:用户可以在对话中随时开启或关闭该模式。
        • OpenAI 表示,该功能主要面向大学生群体,早期测试反馈积极,有学生将其形容为“一个 24/7 全天候、无所不知的‘办公时间’”。未来,OpenAI 计划将这些行为直接训练到核心模型中,并探索更丰富的可视化、进度跟踪和个性化学习体验。

          维基媒体基金会挑战英国《在线安全法案》

          维基媒体基金会(Wikimedia Foundation)已对英国《在线安全法案》(Online Safety Act)中的部分规定提起法律挑战。他们并非反对整个法案,而是担忧其中的“分类条例”可能将维基百科归为监管最严格的“第一类”服务,从而危及这个全球知识共享平台的运作模式。

          基金会认为,如果维基百科被强制执行“第一类”义务(例如要求验证大量贡献者的身份),将严重损害全球近 26 万名志愿者的隐私和安全,甚至可能使他们面临数据泄露、跟踪或被威权政权报复的风险。

          维基百科作为全球排名前十的网站中唯一的非营利项目,其内容由全球志愿者共同创建和维护,是重要的“数字公共产品”。基金会强调,他们支持促进网络安全,但认为这些为商业风险网站设计的严苛规则,不应错误地适用于维基百科这种独特的非营利知识平台。此案的结果可能为保护全球在线公共利益项目树立重要先例。

          SRAM Has No Chill:利用电源域分离窃取片上机密

          一篇名为《SRAM Has No Chill》的论文揭示了一种名为 Volt Boot 的新型硬件攻击方式,它挑战了我们对片上内存(SRAM)安全性的传统认知。

          过去,SRAM 因其断电后数据迅速丢失的特性,被认为是存储加密密钥等敏感信息的安全堡垒,能有效抵御“冷启动攻击”。然而,Volt Boot 攻击利用了现代片上系统(SoC)中普遍存在的“电源域分离”特性。

          攻击原理

          现代 SoC 为了功耗管理,会将 CPU、内存等模块划分到独立的电压域。攻击者通过操纵这些电源域,制造出“不对称电源状态”,从而强制 SRAM 在电源重启后依然保留其数据。

          更令人担忧的是,这种攻击无需极低温度,并且研究人员在商用 ARM 芯片上演示时,成功以 100% 的准确率恢复了缓存和寄存器中的数据。

          这一发现对许多依赖片上内存进行安全防护的方案(如 TRESOR、Sentry)构成了直接威胁,警示我们即使数据从未离开芯片,也可能通过物理手段被窃取。这促使安全社区重新审视硬件信任根和安全飞地等技术的底层安全性,并思考新的缓解措施。

          经典之选:红环 600 圆珠笔

          今天我们来欣赏一件设计精良的日常工具——红环(Rotring)600 圆珠笔。一篇详细的评测文章探讨了这款经典绘图工具的魅力所在。

          它继承了 Rotring 600 系列一贯的精密仪器风格,采用全金属笔身,手感扎实,坚固耐用。其清脆的点击机制令人满意,但声音较大,可能不适合在安静的环境中频繁把玩。

          这款笔最大的优点在于其兼容标准的 Parker-style 笔芯,这意味着用户可以根据自己的书写偏好,自由更换市面上各种品牌的圆珠笔或中性笔芯,极大地提升了其灵活性。

          在技术爱好者社区,这样一件设计精良、经久耐用的“买断式”产品总能引起共鸣。大家普遍认为,它的价值更多体现在高品质的笔身和“一次购买,终身使用”的理念上。对于那些每天与代码和屏幕打交道的人来说,拥有一件触感良好、设计经典的物理工具,或许能为工作和生活增添一份独特的仪式感和乐趣。

          Truchet Tiles:简单规则生成无限图案

          Truchet Tiles 是一种图案本身不具备旋转对称性的方形瓷砖,当它们以不同方向随机或有序排列时,能够生成各种复杂而迷人的图案。这一概念最早由法国数学家塞巴斯蒂安·特鲁谢在 18 世纪提出。

          主要变体
          • 对比三角形:瓷砖沿对角线分为两种对比色,有四种方向。
          • 四分之一圆:瓷砖上画有两个连接相邻边中点的四分之一圆,有两种方向。
          • 对角线:白色方块上带有一条黑色对角线,同样有两种方向。这种瓷砖可以生成迷宫般的图案,其连通性甚至可以用渗流理论进行数学分析。
          • 开发者眼中的魅力

            对于开发者和科技爱好者来说,Truchet Tiles 是数学、艺术和计算机科学交叉点上的一个迷人例子。

            • 生成艺术与编程:用代码实现 Truchet Tiles 的渲染是一个有趣的编程练习,可以用于生成独特的背景、纹理或艺术作品。
            • 数据可视化:瓷砖的方向可以用来编码信息,例如表示数据网格中的梯度或向量场。
            • 游戏开发:在游戏中,它可以用于程序化生成地图、迷宫或装饰性图案,为游戏世界增添多样性。
            • 最令人称奇的是,在 Commodore 64 上,仅用一行 BASIC 代码 10 PRINT CHR$(205.5+RND(1)); : GOTO 10 就能生成这种图案,堪称一首优雅的“代码诗”。

              在数学问题中加入无关的猫咪事实,LLM 错误率飙升 300%

              一项最新研究发现,大型语言模型(LLM)在处理需要精确逻辑推理的任务时,抗干扰能力非常脆弱。当研究人员在标准的数学应用题中混入一些与问题无关的“猫咪事实”(如“猫有九条命”)时,LLM 的解题错误率竟然飙升了 300%。

              这个惊人的结果揭示了当前 LLM 的一个深层局限性:它们可能更多地依赖于模式匹配和表面关联,而不是真正地理解问题并过滤无关信息。这些“噪声”数据似乎会分散模型的“注意力”,导致其做出错误的推理。

              社区的思考

              这一发现引发了社区对 LLM 核心能力的深入探讨。

              • 对 LLM 能力的再认识:许多人认为,这再次印证了 LLM 在逻辑推理和常识理解方面的固有弱点,它们更像是“语言模仿大师”而非“逻辑推理家”。
              • 提示工程的重要性:这凸显了“提示工程”(Prompt Engineering)的价值。在构建应用时,需要精心设计提示,或对输入数据进行预处理,以剔除噪声,从而提高模型的准确性。
              • AI 安全与可靠性:如果 LLM 如此容易被无关信息“欺骗”,那么在医疗、金融等关键应用场景中,如何确保其可靠性?这促使人们思考,未来的 LLM 必须在“抗干扰能力”上有显著提升,才能胜任高风险任务。
              • 环法自行车赛的新威胁:车手是否在使用微型电机?

                《华盛顿邮报》最近的一篇文章将目光投向了环法自行车赛中一个潜在的技术作弊问题——在自行车中隐藏微型电机,即所谓的“机械兴奋剂”。文章描述了赛事官员在赛后对自行车进行检查,以应对这一“新威胁”。

                然而,在技术爱好者社区,人们对此却有截然不同的看法。许多人认为,这篇文章可能基于过时的信息,并且缺乏足够的证据。他们指出,针对隐藏电机的检测在职业自行车运动中早已是常态,检测技术也相当成熟,因此这并非什么“新”威胁。

                这种视角差异非常有趣。主流媒体可能倾向于强调潜在的丑闻以吸引眼球,而更了解技术现状的社区则认为,这更像是一场早已开始的、永无止境的技术“猫鼠游戏”。作弊者利用技术寻找漏洞,而反作弊机构则必须不断升级检测手段。这不仅是体育界的问题,也是所有依赖技术进行公平竞争的领域所面临的共同挑战。

                金融科技的反乌托邦:对技术解决方案主义的批判

                一本书籍介绍《Fintech Dystopia》在社区引发了热议。该书对当前金融科技(FinTech)、加密货币和区块链领域盛行的“技术解决方案主义”提出了尖锐的批判。

                作者 Hilary J. Allen 认为,许多被大肆宣传的金融科技创新,并非解决社会问题的良药,反而常常是干扰,甚至有害。她主张,真正的财务福祉改善需要的是缓慢、民主的解决方案,而非依赖于快速、高科技的“万能药”。

                核心批判
                • “民主化金融”的假象:许多金融科技公司利用“炫目的技术创新”来掩盖高成本和有问题的商业实践,并在监管介入时指责其“反创新”。
                • 稳定币的悖论:稳定币声称服务于无银行账户者,但其主要用途是投机交易,且其稳定性依赖于对现有银行系统的“搭便车”。
                • 区块链的空洞:区块链被描述为一种“笨拙的数据库”,是“技术解决方案主义”空洞性的完美例证,除了帮助少数人赚钱外,缺乏明确的实际用例。
                • 社区观点碰撞

                  这本书的观点在社区中引发了激烈的思想碰撞。

                  • 支持与共鸣:许多人认同作者的看法,认为金融科技和加密领域充斥着过度炒作和“为了技术而技术”的现象。
                  • 反驳与辩护:另一部分人则认为观点过于偏激,忽视了技术带来的真实效率提升和创新。他们主张应将技术本身(如区块链)与其具体的投机应用区分开来。
                  • 深层反思:更深入的讨论延伸至金融不平等、监管与创新的平衡等社会经济问题。大家普遍认为,技术本身无法解决结构性问题,关键在于如何使用技术,以及如何建立有效的监管框架来引导其健康发展。
                  • 相关链接:

                    • Pony: An actor-model, capabilities-secure, high-performance programming language
                    • My 2.5 year old laptop can write Space Invaders in JavaScript now (GLM-4.5 Air)
                    • Study mode
                    • Wikimedia Foundation Challenges UK Online Safety Act Regulations
                    • SRAM Has No Chill: Exploiting Power Domain Separation to Steal On-Chip Secrets
                    • Rotring 600 Ballpoint Pen
                    • Truchet Tiles
                    • Irrelevant facts about cats added to math problems increase LLM errors by 300%
                    • Tour de France confronts a new threat: Are cyclists using tiny motors?
                    • Fintech dystopia
                    ...more
                    View all episodesView all episodes
                    Download on the App Store

                    Agili 的 Hacker PodcastBy Agili 的 Hacker Podcast