February 25, 2026

Google：让多Agents默契合作

23 minutes

这项研究探讨了如何通过上下文学习（in-context learning）在多智能体交互中实现自发合作。作者发现，当序列模型智能体在多样化的对手池中进行训练时，它们会自然演化出推断对手策略并实时调整自身行为的能力。这种机制使智能体在单局博弈内表现得像“朴素学习者”，从而变得容易被勒索，而这种被剥削的压力反过来促使多方通过相互塑造（mutual shaping）达成互利的合作均衡。研究证明，无需复杂的元梯度计算或硬编码假设，仅依靠标准的分散式强化学习和对手多样性，即可让自私的智能体在博弈中学会协作。这种方法不仅为多智能体系统的合作演化提供了可扩展的路径，也揭示了现代大语言模型通过上下文推理产生社会性行为的潜能。

...more

View all episodes

By 每日新闻

February 25, 2026

Google：让多Agents默契合作

23 minutes

...more

Share Google：让多Agents默契合作

Sign up to save your podcasts

Google：让多Agents默契合作

Google：让多Agents默契合作