Share 【第297期】（中文）AgentA/B：基于LLM的自动化可扩展网页A/B测试

Copy link

July 24, 2025

【第297期】（中文）AgentA/B：基于LLM的自动化可扩展网页A/B测试

11 minutes

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。

今天的主题是：AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents

Summary

该论文介绍了 AgentA/B，这是一个利用 大型语言模型（LLM）驱动的自主代理 的新颖系统，旨在革新网络 A/B 测试。传统 A/B 测试依赖大量人工流量且耗时，而 AgentA/B 通过 模拟用户行为 克服了这些限制。该系统能 生成具有不同虚拟用户身份的 LLM 代理，使其与真实网页进行交互，并提供 快速、可扩展且经济高效的用户体验评估。通过在 Amazon.com 上的案例研究，作者表明 AgentA/B 可以有效地模拟类似人类的购物行为，并区分细微的界面设计差异。

原文链接：https://arxiv.org/abs/2504.09723

...more

View all episodes

By 任雨山