August 23, 2025

流媒体Sortformer：基于到达顺序的说话人缓存实时说话人识别

8 minutes

本期节目深入探讨了NVIDIA最新发布的“流媒体Sortformer”技术，这是一种基于说话人到达时间顺序的实时说话人识别框架。我们将详细解析其核心创新——“到达顺序说话人缓存”（AOSC），以及它如何突破传统离线方法的局限，实现高效、低延迟的实时多说话人追踪。从Sortformer的诞生到流媒体扩展的精妙设计，再到在DIHARD III和CALLHOME等基准数据集上的卓越表现，我们将为您揭示这一技术如何为实时字幕、虚拟会议和对话分析等应用带来革命性变革。

...more

View all episodes

By weedge

August 23, 2025

流媒体Sortformer：基于到达顺序的说话人缓存实时说话人识别

8 minutes

...more

Share 流媒体Sortformer：基于到达顺序的说话人缓存实时说话人识别

Sign up to save your podcasts

流媒体Sortformer：基于到达顺序的说话人缓存实时说话人识别

流媒体Sortformer：基于到达顺序的说话人缓存实时说话人识别