Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:Chain-of-Tools: Utilizing Massive Unseen Tools in the CoT Reasoning ofFrozen Language Models
Summary
本论文介绍了一种名为 Chain-of-Tools (CoTools) 的新型工具学习方法,旨在提升大型语言模型 (LLMs) 在 链式思维 (CoT) 推理过程中使用工具的能力。CoTools 克服了现有方法在处理 大量未见工具 和 效率 方面的局限性,通过利用 冻结 LLM 的强大 语义表示能力 来判断何时调用工具并选择合适的工具。研究人员构建了一个名为 SimpleToolQuestions (STQuestions) 的新数据集来验证其方法在处理大量未见工具场景下的有效性,并在 数值推理 和 基于知识的问答 任务上进行了实验,结果表明 CoTools 优于基线方法,并有助于提升模型的可解释性。该研究还深入分析了 数据合成、工具数量 和 未见工具 对模型性能的影响,并探讨了 隐藏状态的关键维度 在工具选择中的作用。
原文链接:https://arxiv.org/abs/2503.16779