Hacker News 每日播报,今天我们关注将昆虫变为惊艳 3D 模型的 Macro Splats 技术、回顾温哥华证券交易所的“诈骗之都”历史、探索 macOS 新的平铺式窗口管理器 Rift、了解 LineageOS 23 的新特性与挑战、盘点那些“英年早逝”的经典项目、挑战烧脑的 Flummoxagon 拼图、学习 PostgreSQL 18 的查询流水线新功能、揭秘加速 LLM 推理的 ATLAS 系统、掌握 Anthropic 的官方提示工程教程,以及将科研论文自动生成视频的 Paper2Video 技术。
微距摄影与高斯泼溅的惊艳结合:Macro Splats 2025
一个名为“Macro Splats 2025”的项目,将高斯泼溅(Gaussian Splatting)技术与微距摄影相结合,创造出细节极其丰富的昆虫 3D 模型,其视觉效果令人叹为观止。项目作者 Dany Bittel 利用高斯泼溅技术,通过优化一系列带有视点相关颜色的模糊椭球体,将数百张昆虫照片转化为可以从任何角度自由查看的 3D 模型。
克服微距摄影的挑战
微距摄影极浅的景深是项目的一大挑战。为解决此问题,作者采用了摄影中常见的“焦点堆叠”(focus stacking)技术,将每个视角下拍摄的多张不同焦点的照片合成为一张完全清晰的图像。整个拍摄过程自动化程度很高,通过旋转盘和对焦导轨,从 111 个不同视角拍摄了总计 1776 张照片。这些照片经过批量处理和 3D 重建后,最终生成了精细的昆虫模型。
社区热议:潜力与局限
这项工作成果获得了社区的高度赞扬,许多人认为这些昆虫模型是他们见过的最令人印象深刻的实时计算机图形作品之一。讨论也延伸到了高斯泼溅技术在游戏和 3D 应用中的未来:
游戏应用的潜力: 有人畅想,如果将这类资产整合到未来的游戏主机(如 PS6)中,将是革命性的进步。然而,也有观点指出,高斯泼溅目前还不是真正的物理渲染(PBR),光照是“硬编码”的,难以进行绑定、动画和复杂的场景构建。技术难题与前沿研究: 尽管存在局限,但社区普遍持乐观态度,认为 PBR 属性恢复、绑定、动画等问题都在积极研究中。特别是动画,虽然是当前的一大障碍,但包含运动信息的 4D 泼溅技术可能成为未来的解决方案。技术细节与工作流程: 社区对作者的工作流程充满了好奇。有人提出是否可以直接建模景深,将未堆叠的原始照片输入模型。作者回应称,虽然有相关研究,但在微距场景下,对焦外图像的追踪非常困难。此外,大家还讨论了如何捕捉昆虫身体的虹彩反射效果,这得益于高斯泼溅技术中颜色与视点相关的特性。总而言之,这个项目不仅展示了高斯泼溅在微距摄影领域的巨大潜力,也引发了社区对这项技术未来在游戏、教育等领域应用的广泛讨论。
回顾温哥华证券交易所:世界诈骗之都 (1989)
一篇来自 1989 年的文章以幽默而尖锐的笔触,揭露了当时温哥华证券交易所(VSE)充斥着高风险、甚至欺诈性的“初级矿业公司”投资乱象。文章将这些公司比作精心编织的“小说”,指出投资者在这些公司中“有时会损失 84% 的资金,40% 的情况下会血本无归”,暗示了其中普遍存在的欺诈行为。
Bre-X 丑闻:一个时代的缩影
这篇文章引发了社区对 VSE 历史的深入探讨,其中 Bre-X 丑闻被反复提及。这家加拿大小型矿业公司通过伪造黄金储量,从公众手中募集大量资金,最终轰然倒塌。其核心地质学家在丑闻曝光之际离奇“坠机身亡”,尸体疑点重重,为这起金融诈骗案增添了更多戏剧性。这一事件重创了加拿大矿业投资行业,并直接促使了更严格的监管规则出台。
“诈骗文化”的延续
尽管 VSE 后来演变为今天的 TSX 创业板,但许多人认为,一种“VSE 遗留文化”仍在温哥华延续。一些投资者分享了亲身经历,描述了当地某些投资圈子更关心股价炒作而非公司基本面的现象。这种“拉高出货”(pump and dump)的模式,在矿业不景气时,会迅速转移到其他热门领域,如大麻、加密货币、NFTs,乃至最新的 AI 概念。这些投机者擅长的是推销和资本运作,而非真正的技术或产品创新。
监管与行业现实
讨论还深入到了初级矿业的艰难现实和加拿大的监管环境。一位有二十年经验的勘探地质师指出,矿产勘探本身就是一项极其困难且昂贵的业务,这为欺诈提供了土壤。同时,加拿大省级管辖的证券监管体系,也可能导致某些省份因资源不足而监管不力,从而成为“诈骗之都”。
尽管存在这些问题,温哥华的投资生态也并非铁板一块。社区也指出,当地存在另一批由真正科技创业者转型的投资者,他们更注重实际业务,并与全球科技圈保持着紧密联系。这篇旧文和今天的讨论,共同描绘了一幅高风险投机与欺诈行为交织的复杂图景。
Rift:为 macOS 打造的高性能平铺式窗口管理器
Rift 是一款专为 macOS 设计的全新平铺式窗口管理器,由 Rust 编写,旨在提供高性能和卓越的用户体验。它最大的亮点在于,无需禁用系统完整性保护(SIP),并且能很好地支持多显示器设置,解决了许多同类工具的痛点。
核心特性与优势
Rift 的设计哲学是利用 macOS 的私有 API 来实现更稳定、更流畅的窗口管理。它提供了多种布局风格,并设计了直观的菜单栏图标和类似“调度中心”的视图,方便用户在不同工作区之间导航。
无需禁用 SIP: Rift 采用“虚拟工作区”系统,将所有窗口都管理在 macOS 的一个原生空间内,从而避免了 SIP 的限制。流畅的交互体验: 支持“焦点跟随鼠标”、拖拽交换窗口位置,并集成了 macOS 原生的触控板手势,切换工作区时拥有流畅的动画效果。高度可配置与集成: 配置文件支持热重载,无需重启即可生效。同时提供命令行 API,可以与 Sketchybar 等第三方程序轻松集成。与现有工具的比较
社区将 Rift 与 Yabai、Aerospace 等知名工具进行了比较。Rift 的核心优势在于它在不牺牲性能的前提下,提供了更好的系统兼容性。与需要禁用 SIP 的 Yabai 不同,Rift 和 Aerospace 都采用了虚拟工作区方案。但 Rift 更进一步,像 Yabai 一样大量使用低级私有 API 以追求极致性能,同时专注于改善动画效果和多显示器全屏应用的使用体验。
对于那些寻求高性能、高兼容性且不愿禁用 SIP 的 macOS 用户来说,Rift 提供了一个极具吸引力的新选择。
LineageOS 23 发布:拥抱 Android 16,直面新挑战
LineageOS 团队正式发布了基于 Android 16 的 LineageOS 23。此次更新不仅带来了众多新功能,也坦诚地揭示了项目在适应 Google 不断变化的开源政策时所面临的挑战。
Google 政策变化带来的影响
公告指出,Google 的发布节奏和源代码开放策略发生了显著变化,给 LineageOS 带来了三大挑战:
源代码发布延迟: Google 不再及时向 AOSP 公开最新的季度平台版本(QPR)源代码,导致 LineageOS 23 只能基于较早的 Android 16 版本发布。安全补丁获取困难: 每月完整的安全补丁不再定期公开,部分补丁仅私下提供给合作方,这可能导致 LineageOS 的安全更新偶尔滞后。Pixel 设备支持难度增加: Google 减少了对 Pixel 设备源代码的公开,使得为 Pixel 提供支持的难度与其他 OEM 设备相当,失去了以往“首日支持”的优势。新功能与改进亮点
尽管面临挑战,LineageOS 23 依然带来了大量激动人心的更新:
全新应用 Catapult: 一款专为 Android TV 设计的自定义启动器,提供干净、无广告、以用户内容为中心的体验。相机应用 Aperture 重写: 彻底重构,支持 JPEG Ultra HDR、RAW 格式,并改进了 UI。内核与虚拟化支持增强: 改进了对运行 mainline Linux 内核设备的支持,有望延长设备生命周期。同时扩展了对 QEMU 等虚拟机的支持,方便开发者测试。开发工具与平台迁移: 项目已全面转向 Android.bp 构建系统,为未来做好了准备。用户体验改进: 下载门户和 Wiki 进行了重新设计,增加了暗模式、设备筛选等功能,并提供了更清晰的安装指南。LineageOS 团队表示将适应这些新常态,并继续为社区提供高质量的开源 Android 系统。
那些“英年早逝”的科技项目,你怀念哪一个?
Hacker News 上的一篇帖子引发了社区的热烈讨论,大家纷纷提名那些在它们时代到来之前就已消亡,却本应大放异彩的科技项目。这些项目涵盖了操作系统、网络服务、硬件等多个领域,它们的失败原因各不相同,但都留下了深刻的印记。
操作系统与底层技术的遗珠
Plan 9: 被誉为 Unix 的精神继承者,其“一切皆文件”的理念和分布式特性,在今天这个万物互联的时代本应大放异彩。然而,它最终因法律问题、糟糕的市场营销以及与当时计算潮流的背离而失败。Google Wave: 一个革命性的实时协作平台,技术理念超前,但因复杂的用户界面和市场接受度不足而夭折。其核心思想在今天的 Google Docs 等产品中得以延续。Optane (3D XPoint): 介于 RAM 和 SSD 之间的新型存储技术,承诺带来“即时启动”的体验。但高昂的成本和闪存技术的快速进步使其失去了竞争优势。令人惋惜的网络服务
Google Reader: 简洁高效的 RSS 阅读器,它的关闭被许多人视为谷歌历史上最糟糕的决策之一,严重损害了其在早期技术采纳者中的品牌信誉。Yahoo Pipes: 一个可视化的网络数据聚合工具,代表了早期互联网开放、互联的精神。它的消亡象征着互联网从个人创作向平台化、商业化的转变。Adobe Flash: 曾是互动内容创作的王者,因其易用性和性能而备受喜爱。但安全漏洞和苹果的抵制最终导致了它的衰落。许多人至今仍怀念那个非开发者也能轻松创作的时代。严格与宽容之争:XHTML 的失败
XHTML 旨在将 HTML 严格化为 XML 格式,其失败引发了激烈的辩论。支持者认为,严格的语法能促使开发者编写更高质量的代码;而反对者则认为,HTML 的宽容性才是其成功的关键,它降低了内容发布的门槛。最终,HTML5 选择了标准化的错误恢复机制,在严格与宽容之间找到了平衡。
这些项目的讨论不仅是对过去技术的一种怀旧,也引发了对技术发展方向、开放生态系统以及巨头公司产品策略的深刻反思。
Flummoxagon:挑战大脑极限的几何逻辑拼图
Nervous System 工作室推出了一款名为 Flummoxagon 的全新物理拼图游戏,它巧妙地将五格骨牌的形状填充与数独的逻辑约束相结合,为玩家带来极具挑战性的烧脑体验。
玩法与设计巧思
游戏的核心玩法是将 48 块由六边形组成的异形拼图块放入一个六边形框架中,同时必须遵守一个关键规则:相同颜色的拼图块不能相互接触。为了避免游戏沦为纯粹的暴力破解,设计师借鉴了数独的理念,为每个谜题提供一个部分填充的棋盘,并确保每个谜题都只有一个唯一解。这使得游戏从一个组合爆炸问题,转变为一个需要逻辑推理才能解决的有趣挑战。
背后的算法:精确覆盖问题
Flummoxagon 谜题的生成和求解,背后是计算机科学领域的经典问题——唐纳德·克努斯(Donald Knuth)提出的“精确覆盖问题”(Exact Cover Problem)及其高效的求解算法“跳舞链”(Dancing Links / Algorithm X)。文章详细解释了如何将拼图的几何约束和颜色约束建模为一个精确覆盖问题,并利用跳舞链算法高效地搜索解决方案。这个强大的算法不仅能生成唯一的谜题,还能评估其难度,省去了大量人工测试的麻烦。
社区反响热烈
这款拼图在社区中引发了热烈反响,许多人称其“非常巧妙”,并赞赏其避免纯粹“暴力破解”的设计。技术爱好者们对文章中关于精确覆盖问题和跳舞链算法的详细解释表现出浓厚兴趣。同时,Nervous System 团队也积极回应了社区关于网站兼容性和支付流程的反馈,甚至表示可以为有颜色识别困难的用户定制纯色版本,展现了良好的客户服务意识。
PostgreSQL 18 psql 新增查询流水线功能,大幅提升吞吐量
PostgreSQL 18 为其命令行客户端 psql 引入了查询流水线(Pipelining)支持,这一功能允许客户端在不等待前一个查询结果返回的情况下,连续发送多个查询,从而显著提升数据库操作的吞吐量,尤其是在高网络延迟环境下。
流水线如何工作?
通过在 SQL 脚本中使用 \startpipeline 和 \endpipeline 命令,psql 可以将多个独立的查询打包发送。这带来了两大好处:
并行处理: 客户端、网络和服务器可以同时工作,减少了等待时间。网络优化: 多个查询可以被放入同一个网络数据包中,减少了网络往返次数,这在高延迟网络中效果尤为明显。性能测试显示,在广域网环境中,使用流水线处理小批量查询,其速度提升可高达 71 倍。更棒的是,这个新功能是客户端特性,即使连接到旧版本的 PostgreSQL 服务器也能正常工作。
社区深入探讨
性能提升的本质: 有观点指出,性能提升的核心原因并非简单地打包数据,而是消除了每个查询之间等待确认的往返延迟(round-trip latency),这才是真正的瓶颈所在。被忽视的批处理: 许多开发者认为,批处理(包括流水线)在应用开发中常常被忽视。大多数应用仍采用交互式事务,逐个等待查询返回,导致性能低下。这与编程语言中默认的同步调用范式有关。生态系统支持现状: 讨论揭示了不同语言生态对流水线支持的现状。Python 的 psycopg3 和 JavaScript 的 postgres.js 等现代驱动已支持此功能,并有用户分享了性能提升 3-6 倍的实际案例。然而,像 node-pg 和 Ruby on Rails 的 ActiveRecord 等主流工具尚未原生支持,这与它们需要兼容缺乏类似功能的其他数据库(如 MySQL)有关。总而言之,psql 的流水线功能为优化数据库脚本提供了一个简单而强大的工具,也再次引发了社区对批处理重要性的关注。
ATLAS:Together AI 推出自适应 LLM 推理加速系统
Together AI 发布了其最新的大型语言模型(LLM)推理加速技术——ATLAS(自适应学习推测系统),声称能够实现高达 4 倍的推理速度提升。
动态学习,持续优化
与传统的静态推测解码器不同,ATLAS 的核心创新在于它是一个“运行时学习加速器”。它能够根据历史模式和实时流量动态学习和调整,从而持续优化自身与目标大模型的行为一致性。这意味着,在多租户或工作负载多变的环境中,ATLAS 能够自适应地进行专业化,例如在编程场景下,它可以针对正在编辑的代码进行优化,从而提高解码速度。
ATLAS 系统由三个关键组件构成:一个强大的静态推测器作为性能保底,一个轻量级的自适应推测器用于实时学习,以及一个置信度感知控制器来动态选择最优的推测策略。
性能声明引发质疑
Together AI 声称,在完全适应的场景下,ATLAS 在某些模型上可以达到每秒 500 个 Token 的速度,甚至“超越了 Groq 等专用硬件”。
然而,社区很快对这一说法提出了质疑。有用户引用了第三方平台 OpenRouter.ai 的数据指出,在同一模型上,Groq 的平均速度远高于 Together AI 的表现(1086 TPS vs 59 TPS)。
这场争论凸显了 LLM 性能基准测试中的一个关键问题:测试条件和透明度。Together AI 的数据可能是在特定配置和批处理大小下的峰值性能,而 OpenRouter 的数据则反映了更广泛的平均使用情况。这提醒我们,在评估不同厂商的性能声明时,必须仔细审视其测试环境和指标定义,才能做出准确的判断。
Anthropic 发布官方交互式提示工程教程
Anthropic 公司发布了一份官方的《Prompt Engineering Interactive Tutorial》,旨在帮助开发者和用户系统地学习如何为 Claude 模型编写高效的提示词(prompt)。
教程内容概览
这份交互式教程内容全面,从初级到高级,循序渐进地介绍了提示工程的核心概念和实用技巧。
基础入门: 讲解了良好提示词的基本结构,强调指令要清晰直接,并介绍了如何通过“分配角色”来引导模型输出。中级技巧: 深入探讨了如何分离数据与指令、格式化输出、以及引导模型进行“逐步思考”(step-by-step thinking)来提高推理准确性。高级应用: 涵盖了如何避免模型产生“幻觉”(hallucinations)、构建针对特定行业的复杂提示词,以及工具使用、搜索与检索等前沿技术。教程主要基于 Claude 3 Haiku 模型进行教学,并提供了大量的练习机会,帮助用户将理论付诸实践。
社区观点与思考
社区对这份教程表现出浓厚兴趣,并提出了一些深刻的见解:
控制输出顺序的重要性: 有用户从教程中获得启发,认识到控制模型的输出顺序是一种强大的技巧。例如,在提问之前,先要求模型提供证据和指标,可以“预热”模型,利用其概率性补全的特性,从而获得更有根据的回答。提示工程的“保质期”: 也有观点指出,随着 LLM 模型能力的飞速发展,教程中的某些技巧可能会很快过时。例如,“分配角色”或“逐步思考”这类引导性指令,对于未来更智能、经过强化学习优化的模型来说,可能就不再是必需的。这引发了一个有趣的思考:在模型能力不断提升的背景下,哪些提示工程原则是永恒的,哪些又是暂时的?这提醒我们,学习提示工程不仅要掌握具体技巧,更要理解其背后的原理,以适应技术的不断演进。
Paper2Video:将科研论文自动生成演示视频
一篇来自 arXiv 的新论文介绍了一个名为 Paper2Video 的项目,旨在解决学术界一个普遍存在的痛点:制作演示视频耗时耗力。该项目提出了一个名为 PaperTalker 的多智能体框架,能够将科学论文自动转化为包含幻灯片、语音、字幕和虚拟演讲者的演示视频。
技术框架与创新
为了实现这一目标,研究团队首先构建了一个包含 101 篇论文及其对应视频的基准数据集。PaperTalker 框架则集成了多项功能,包括:
智能幻灯片生成: 从论文中提取关键信息并生成幻灯片。布局优化: 通过新颖的树搜索算法优化幻灯片上的视觉元素布局。多通道协调: 同步生成光标移动、字幕、合成语音和虚拟人头渲染。实验结果表明,PaperTalker 生成的视频比现有方案更能忠实地传达原文信息。该项目的数据集、代码均已开源。
社区观点:潜力与槽点并存
社区对这个项目表现出浓厚兴趣,但观点也呈现两极分化:
对质量的担忧: 不少人认为,当前 AI 生成的视频质量堪忧,听起来像是“单调的 AI 语音念稿”,缺乏人类演讲的吸引力和洞察力。有人甚至开玩笑说,这让他们足不出户就能体验到一场糟糕的学术会议。对潜力的看好: 另一方面,也有许多人看到了其巨大潜力。他们认为,即使是目前的水平,也可能比许多人类制作的糟糕演示要好。更重要的是,这项技术有望极大地拓宽科学知识的传播渠道,让更多无法亲临现场的人受益。技术亮点与改进空间: 有技术背景的用户赞扬了框架中用于确保布局正确的“画家-评论员”反馈循环,以及让语音听起来更自然的重新措辞技术。但也有人指出,文本转语音(TTS)在语调上仍有不自然的停顿。脑洞大开的建议: 评论区还充满了各种幽默的建议,比如让“精致的 AI 虚拟人”来演讲,甚至提议加入互动游戏元素,让观众用虚拟武器“攻击”关键概念以深入了解,为这个严肃的学术项目增添了不少趣味。总而言之,Paper2Video 是一项非常有前景的技术,虽然在提升“人性化”方面仍有很长的路要走,但其在自动化科学传播方面的潜力已获得广泛认可。
相关链接:
- Macro Splats 2025
- Vancouver Stock Exchange: Scam capital of the world (1989) [pdf]
- Show HN: Rift – A tiling window manager for macOS
- LineageOS 23
- Ask HN: Abandoned/dead projects you think died before their time and why?
- The Flummoxagon
- Pipelining in psql (PostgreSQL 18)
- AdapTive-LeArning Speculator System (ATLAS): Faster LLM inference
- Anthropic's Prompt Engineering Tutorial (2024)
- Paper2video: Automatic video generation from scientific papers