Agili 的 Hacker Podcast

Hacker News 每日播报 2025-10-16


Listen Later

欢迎收看 Hacker News 每日播报,今天我们将探讨 Windows 11 引发的隐私担忧、从零开始训练 LLM 的激动人心时刻、TurboTax 如何阻碍免费报税、Zed 编辑器登陆 Windows 的得与失,以及食蚜蝇的迁徙如何引发了关于星际旅行的遐想。

告别 Windows 10:微软正走向“监控国家”吗?

随着 Windows 10 即将退役,一篇措辞严厉的文章指出,微软正通过 Windows 11 将用户推向一个“监控国家”。文章作者认为,Windows 11 在设计上对数据隐私构成了前所未有的威胁,现在是个人和企业用户认真考虑转向 Linux 的时候了。

文章列举了 Windows 11 的几大“罪状”:

  • 强制硬件升级:通过 TPM 和安全启动等要求,迫使用户购买新硬件,从而将用户锁定在其生态系统中。
  • 误导性安装选项:默认设置诱导用户将数据同步到 OneDrive,且难以撤销。
  • 强制安装 AI 工具:AI 工具 Co-pilot 在未经用户同意的情况下被安装并启用,且难以移除。
  • 侵入性“Recall”功能:即将推出的“Recall”功能会将用户活动快照保存到云端,进一步加剧了监控担忧。
  • 强制使用 Edge 浏览器:通过各种“暗模式”设计,强迫用户使用自家的 Edge 浏览器。
  • 鉴于这些问题,作者强烈建议客户转向 Linux,并推荐了 Zorin OS、PopOS、Ubuntu 等多个发行版。

    围绕这一话题,技术社区展开了热烈讨论。许多人对作者的观点表示赞同,认为 Windows 11 的隐私问题和强制性功能确实令人不安。大家积极分享转向 Linux 的经验和建议,其中 Linux Mint 因其与 Windows 相似的用户体验而被誉为最平稳的过渡选择,而 Debian Stable 与 Cinnamon 桌面环境的组合也备受推崇。

    对于游戏玩家这一特殊群体,大家指出,得益于 Valve 的 Proton 技术和 Steam Flatpak,如今在 Linux 上玩游戏已不再是难题,大多数非内核级反作弊的游戏都能良好运行。

    不过,讨论也触及了 Linux 推广的现实挑战。有人提醒,普通用户可能并不像技术爱好者那样关心隐私问题,因此在推广时应更关注用户的实际需求,如速度、无广告和成本节约。此外,硬件兼容性仍是一个不容忽视的障碍,例如有用户就遇到了 AMD 显卡在 Linux 下的随机闪烁问题。

    有趣的是,关于 TPM 和安全启动的看法也出现了分歧。一些人认为,这些技术本身具有安全价值,许多 Linux 发行版也能很好地支持它们;问题在于微软将其作为“强制性”的最低要求,限制了用户的选择自由。

    从零编写 LLM(二十二):亲手训练自己的大语言模型

    Giles Thomas 的“从零开始编写 LLM”系列迎来了激动人心的第 22 部分——模型训练。经过漫长的铺垫,作者终于将所有组件整合,亲眼见证了自己搭建的 LLM 开始生成文本。

    文章的亮点在于,在一个仅有 2 万字符的小数据集上,模型在 RTX 3090 上训练短短十秒,就能生成初步连贯的文本。更令人振奋的是,当加载 OpenAI 原始 GPT-2 模型的权重后,模型立刻展现出惊人的能力,这直观地展示了预训练模型的强大威力。

    在技术细节上,作者分享了实践中的挑战。例如,由于代码中存在大量随机性,完全复现书中的结果变得异常困难。他还介绍了超越传统 SGD 的 AdamW 优化器,并形象地将其比喻为给梯度下降的“球”赋予动量,使其能越过局部最优解。为了避免模型简单地“鹦鹉学舌”般重复训练数据,文章还介绍了温度(temperature)和 Top-K 采样等技术,以增加生成文本的多样性和质量。

    这篇文章在社区中引发了对学习方法和实践成本的深入探讨。许多人将这个系列与 Andrej Karpathy 的 nanogpt 等项目相提并论,认为这种从底层构建 AI 的方式极具教育意义。

    关于如何更好地学习 LLM,社区出现了有趣的观点碰撞。有人认为,像 Sebastian Raschka 的《从零开始构建大型语言模型》这类书籍虽然代码详尽,但在“建立直觉”方面有所欠缺。另一些人则反驳称,在机器学习领域,理解背后的数学原理比模糊的“直觉”更重要。不过,Karpathy 的“Zero to Hero”系列视频因其在构建直觉方面的出色表现而备受推崇。

    此外,关于训练成本的讨论也从理论走向了实践。有经验的开发者指出,在比较本地 GPU 与云端集群的成本时,绝不能只看硬件费用,还必须考虑数据传输、环境调试等“隐藏开销”,这些因素在实际项目中可能显著影响总成本和效率。

    TurboTax 如何在 20 年间阻止美国人免费报税 (2019)

    这篇来自 ProPublica 在 2019 年的深度调查报道,至今仍在技术社区中反复被提及。它揭露了 TurboTax 的母公司 Intuit 如何通过长达二十年的游说和商业策略,成功阻止美国政府为公民提供免费、简化的报税服务——而这种服务在许多发达国家早已是标配。

    报道的核心观点是,Intuit 的商业帝国建立在美国税收制度的复杂性之上。为了维护这一模式,该公司采取了多种手段:

    • 强大的游说攻势:投入巨资游说国会,甚至推动立法,明确禁止美国国税局(IRS)开发自己的免费报税系统。
    • 操纵“Free File”计划:作为与政府协议的一部分,Intuit 承诺为低收入人群提供免费报税服务,以换取 IRS 不与自己竞争。然而,他们却通过技术手段(如在网页中添加代码阻止搜索引擎收录)来限制该计划的可见性。
    • “免费”的陷阱:Intuit 推出的商业“免费版”充满了欺骗性的设计(即“暗模式”),诱导用户在报税流程的最后一步才发现需要付费,让数百万本应符合免费条件的用户最终支付了费用。
    • 这篇报道的影响深远,每次报税季来临或有相关新闻出现时,它都会在 Hacker News 等社区被重新分享和讨论。这表明,大型科技公司如何利用其影响力操纵市场、阻止公共服务以及通过欺骗性营销牟利,是科技从业者持续关注的伦理焦点。这种反复的讨论也反映出社区对企业不当行为的普遍不满,以及对更公平、透明系统的持续呼吁。

      美国国税局(IRS)开源其“事实图谱”项目

      美国国税局(IRS)最近开源了一个名为“事实图谱”(Fact Graph)的项目,这是一个用于建模美国税法的知识图谱。该项目源自已被取消的 IRS Direct File(免费直接报税)计划,旨在提供一个标准化的工具来以声明方式处理复杂的税法逻辑。

      这个项目一经发布,便引发了社区的热烈讨论。首先,大家很快澄清了一个误解:这个 GitHub 仓库本身是知识图谱的引擎和工具,而实际的税法数据则存放在另一个相关的仓库中。

      然而,讨论的焦点迅速转向了 Direct File 项目被取消一事。许多人对此表示极度失望和愤怒,认为这是 TurboTax 等商业报税软件公司游说成功的恶果,直接损害了普通纳税人的利益。这种“愚蠢的政治操作”让大家对现有体系感到不满。

      在对商业软件的声讨中,许多用户开始积极推荐替代方案,其中 FreeTaxUSA 和 Cash App Taxes 因其更低廉的费用和更友好的用户体验而备受推崇。

      此外,这个开源项目也激发了人们对 AI 应用的想象。有人提出,将 Fact Graph 与大型语言模型(LLM)结合,或许能提供有趣的税务建议。但大家普遍认为,虽然 LLM 可以帮助发现潜在的抵扣项,但鉴于税法的复杂性和 LLM 的“幻觉”风险,所有建议都必须经过人工核实并参考官方说明,否则可能带来严重的法律后果。

      高性能代码编辑器 Zed 现已登陆 Windows 平台

      以高性能和原生体验著称的代码编辑器 Zed,在万众期待下终于正式登陆 Windows 平台。Zed 团队强调,其 Windows 版本并非简单的跨平台封装,而是通过直接调用 DirectX 和 DirectWrite 等底层 API 实现,旨在提供最原生的外观和性能。此外,它还深度集成了 WSL 和 SSH 远程开发功能,所有 AI 和扩展功能也已完全支持。

      然而,Zed 的 Windows 首秀在社区中引发了复杂而激烈的讨论,主要集中在以下几个方面:

      安装包体积之谜

      许多用户对 Zed 超过 400MB 的安装包大小感到震惊,这与大家对“高性能、轻量级”的期待相去甚远。深入探究后发现,这主要是由于 Rust 默认的静态链接方式以及庞大的依赖树(超过 2000 个 crate)所致,其中用于协作功能的 webrtc-sys 和 tree-sitter 语法解析器是主要的“重量级”组件。有人认为,与 Sublime Text(约 52MB)相比,这个体积“令人尴尬”;但也有人辩护称,考虑到 Zed 提供的丰富功能,应将其视为一个准 IDE,400MB 在当今环境下并非不可接受。

      性能与用户体验的细节问题

      尽管以性能著称,但有用户报告称 Zed 的冷启动时间长达数分钟,远逊于 VSCode。在用户体验方面,一些基本的操作系统级快捷键(如 ALT+F)不工作,文件操作缺乏撤销功能也引起了用户的担忧。对于现代开发者而言,DevContainer 支持的缺失更是一个关键痛点,阻碍了他们将其作为主力编辑器。

      字体渲染的老大难问题

      尽管 Zed 团队强调使用了原生渲染技术,但仍有用户抱怨在非 HiDPI(高分屏)显示器上字体模糊,甚至导致头痛。这再次引发了关于子像素渲染重要性的辩论。虽然高分屏日益普及,但许多开发者指出,1080p 显示器在全球范围内仍是主流,清晰的字体渲染至关重要。

      总而言之,Zed 登陆 Windows 备受关注,但要在竞争激烈的编辑器市场站稳脚跟,解决好社区反馈的这些实际问题将是关键。

      Liquibase 因许可证变更后仍自称“开源”而引发争议

      数据库迁移工具 Liquibase 最近将其许可证从传统的开源协议转向了功能源代码许可证(FSL),但其在宣传材料中仍继续使用“开源”标签,此举在社区引发了一场关于“开源”定义的大辩论。

      FSL 许可证的核心特点是限制“竞争性使用”,这直接违反了开源倡议组织(OSI)关于“不得歧视任何应用领域(包括商业用途)”的核心原则。因此,许多人坚持认为,无论其源代码是否公开,采用 FSL 的 Liquibase 都不能再被称为真正的“开源”软件。

      这场争议迅速演变成一场关于开源理念的深刻探讨:

      • 定义之争:一方认为,OSI 和自由软件基金会(FSF)的定义是判断软件是否开源的黄金标准,不容妥协。另一方则认为,这些定义已经过时,未能应对大型云服务商“搭便车”式地利用开源项目却不回馈社区的现代挑战。他们认为,像 FSL 这样的“源代码可用”(Source Available)许可证,是保护开发者利益的必要演变。
      • AGPL 的角色:在讨论如何应对云厂商时,AGPL 许可证被反复提及。支持者认为它是对抗 SaaS 模式下不回馈行为的有效武器,因为它要求通过网络提供服务的修改版也必须公开源码。但反对者则担忧其“传染性”和法律上的不确定性。
      • 对大型科技公司的批判:一些人认为,大型科技公司“劫持”了开源运动,将其从一个以用户自由为核心的哲学运动,转变为一个更注重商业利益的实用主义运动。他们推广宽松许可证,同时对 GPL/AGPL 等 copyleft 许可证散布负面信息,以服务于自己的商业目的。
      • 总而言之,Liquibase 事件再次点燃了关于开源核心原则的长期辩论,反映了在云计算时代,开发者如何在理想主义与商业现实之间寻求平衡的持续探索。

        Rust 语言为内核开发带来哪些新特性?

        Rust for Linux 项目不仅在推动 Rust 进入 Linux 内核,也在反向促进 Rust 语言本身的发展。一篇来自 LWN.net 的文章详细介绍了几个为满足内核开发需求而即将推出的 Rust 语言新特性,这些特性旨在提升系统级编程的安全性、可靠性和开发效率。

        • 字段投影 (Field Projections):这个特性将统一和简化对智能指针内部字段的访问语法,使得操作 Pin、Arc 或内核中自定义的复杂指针类型变得更加简洁和安全。这对于在内核中实现 RCU 这类高级同步机制至关重要。
        • 任意 self 类型 (Arbitrary Self Types):允许方法直接接受智能指针(如 Pin<&mut T>)作为 self 参数,从而可以使用更符合直觉的 .method() 语法,极大地改善了代码的人体工程学。
        • 原地初始化 (In-place Initialization):旨在将目前内核中通过宏实现的、用于创建固定在内存中结构体的模式,提升为语言级特性。这不仅能让内核代码更简洁,也能解决用户空间中创建大型异步任务时可能遇到的栈溢出问题。
        • 社区对这些进展的讨论,也深入到了 Rust 语言的核心特性和应用价值上。

          许多人承认 Rust 是一门复杂的语言,但其复杂性与 C++ 有着本质区别。大家普遍认为,Rust 的复杂性是“可控的”,因为编译器会强制执行规则,从而在编译时就消除大量的潜在错误,而不是像 C++ 那样将问题留到运行时。

          生命周期(Lifetimes)仍然是许多开发者学习过程中的一个痛点。一些人坦言,在面对复杂的生命周期问题时,会选择使用引用计数(Rc<>)来规避,认为在非极致性能场景下,这是一种务实的权衡。

          对于 Rust for Linux 项目的价值,尽管有人质疑其进展缓慢,但更多人通过实际案例证明了其重要性。例如,Asahi Linux 的 GPU 驱动就是用 Rust 编写的,其开发者表示 Rust 的安全特性帮助他们避免了大量的并发问题。这些成功的应用表明,Rust 正在为 Linux 内核带来实实在在的可靠性优势。

          Ollama 发布新编码模型,集成 VS Code、Zed 等工具

          Ollama 最近发布了一系列新的编码模型和工具集成,旨在提升 AI 辅助编程的体验。其中,新推出的 GLM-4.6 模型备受瞩目,同时,像 Qwen3-Coder-480B 这样的巨型模型也已上线,尽管其本地运行需要超过 300GB VRAM 的强大硬件。

          这次更新在社区中引发了多方面的讨论:

          • 模型性能广受好评:许多用户对 GLM-4.6 的表现赞不绝口,称其在处理需要“深度思考”的复杂编码任务时“绝对令人难以置信”,甚至在某些方面优于其他知名模型。
          • 对商业模式的担忧:Ollama 开始提供仅限其云服务使用的模型,这让一些用户感到失望。他们担心,在接受风险投资后,Ollama 可能会逐渐从一个纯粹的本地工具转向一个以盈利为导向、可能“锁定”用户的云平台,这种现象被形象地称为“enshittification”(平台逐渐变烂)。
          • 与上游项目的关系:有评论指出,Ollama 的核心技术基于开源项目 llama.cpp,但对其贡献和归属做得不够充分,这导致其在部分开发者社区中声誉受损。一些技术专家因此更倾向于直接使用 llama.cpp,以获得更大的控制权和更广泛的模型支持。
          • 硬件门槛依然高昂:巨型模型的本地运行要求凸显了当前 AI 应用的一个现实问题:对于普通开发者来说,在个人设备上流畅运行顶级大模型仍然是一个遥不可及的梦想。对于日常的编码辅助任务,一些人推荐使用更具成本效益的云端 API 服务。
          • 尽管存在争议,但 Ollama 在技术上仍在进步,例如实验性的 Vulkan 支持有望加速在更多类型 GPU 上的模型运行。

            北海油井上的神秘访客:迁徙的食蚜蝇与星际旅行的遐想

            一篇关于北海石油钻井平台上“苍蝇云”现象的科学文章,意外地在 Hacker News 社区引发了一场关于人类未来的深刻哲学思辨。

            文章揭示,这些神秘的访客其实是食蚜蝇(hoverflies),它们在从欧洲大陆到斯堪的纳维亚半岛的漫长迁徙途中,将钻井平台当作了至关重要的“休息站”。更令人惊讶的是,这种迁徙是跨越数代的壮举,每一代食蚜蝇都只完成了旅程的一部分,它们的后代则继续向着最终目的地前进。

            这个“跨越多代的旅程”瞬间点燃了社区的想象力,大家不约而同地联想到了人类探索宇宙的终极方式——“世代飞船”(generation ship)。

            • 目标与忠诚:一个核心问题被提出:在飞船上生活了几代人之后,后代们是否还会关心数百年前祖先设定的任务目标?意识形态的漂移和反叛是否会使飞船偏离航向?
            • 生存的本能:也有人认为,在浩瀚宇宙中别无选择,生存本身就是任务。只要“任务”是活下去,后代们就会继续前进,就像宗教和大型工程项目可以在数百年甚至数千年内维持一个大致相似的目标。
            • 费米悖论的新解释:有观点认为,这种“世代问题”可能是费米悖论的一个答案。如果一个文明很难投入资源进行跨世代的宏大项目,那么其扩张的脚步自然会受到限制。
            • 除了对星际旅行的遐想,讨论还涉及了石油钻井平台的意外生态价值(成为人工鱼礁)以及昆虫长距离飞行的惊人效率。这篇关于小昆虫的科学发现,最终变成了一场关于人类未来、社会演变和我们在宇宙中位置的广泛讨论。

              视频教程:从零开始构建一个超标量 8 位 CPU

              一个名为“构建一个超标量 8 位 CPU”的 YouTube 视频系列在 Hacker News 上引起了关注。这个系列的目标极具吸引力:将现代高性能 CPU 中的核心概念——超标量架构(即在单个时钟周期内并行执行多条指令),应用到一个相对简单的 8 位处理器设计中。

              对于希望深入理解计算机底层工作原理的软件开发者和硬件爱好者来说,这是一个绝佳的学习资源。它将带领观众从最基本的逻辑门开始,一步步构建出一个能够并行处理指令的复杂系统。

              这类实践性极强的教育内容,通常会在社区中引发热烈的技术交流。可以预见,讨论会围绕以下几个方面展开:

              • 教育价值:赞扬该系列为理解复杂 CPU 架构提供了一个直观且可操作的途径。
              • 技术细节:深入探讨视频中涉及的具体设计选择,如指令调度、数据依赖冲突的解决方案等。
              • 知识延伸:将这个 8 位 CPU 的设计与现代商业处理器进行比较,探讨计算机体系结构的演变。
              • 工具与资源分享:交流使用 FPGA、Verilog/VHDL 等工具进行硬件设计的经验,并推荐其他相关学习资源。
              • 相关链接:

                • Retiring Windows 10 and Microsoft's move towards a surveillance state
                • Writing an LLM from scratch, part 22 – training our LLM
                • TurboTax’s 20-year fight to stop Americans from filing taxes for free (2019)
                • IRS open sources its fact graph
                • Zed is now available on Windows
                • Liquibase continues to advertise itself as "open source" despite license switch
                • Upcoming Rust language features for kernel development
                • New coding models and integrations
                • Flies keep landing on North Sea oil rigs
                • Build a Superscalar 8-Bit CPU (YouTube Playlist) [video]
                ...more
                View all episodesView all episodes
                Download on the App Store

                Agili 的 Hacker PodcastBy Agili 的 Hacker Podcast