July 17, 2025

【第290期】（中文）PLAY2PROMPT：LLM零样本优化

8 minutes

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。

今天的主题是：PLAY2PROMPT: Zero-shot Tool Instruction Optimization for LLM Agents via Tool Play

Summary

此文档介绍了 PLAY2PROMPT，这是一个旨在优化大型语言模型（LLMs）工具使用能力的新型自动化框架。该框架通过模拟工具交互的试错过程来学习，从而在没有预先标记数据的情况下，自动生成高质量的工具文档和使用示例。PLAY2PROMPT采用束搜索框架，并结合自反思机制，迭代地完善工具文档并创建演示，从而显著提升LLMs在各种真实世界任务中的零样本工具使用性能，尤其在处理不完整或嘈杂的工具信息时表现出色。

原文链接：https://arxiv.org/abs/2503.14432

...more