# 背景
- Retrieval-augmented generation (RAG)システムは、複雑なユーザーリクエストに対応するために、クエリをサブクエリに分解し、それぞれに対して関連文書を取得し、最終的に回答を生成する。
- 効率的な文書選択には、関連情報を広く取得することと、ノイズや計算コストを避けることのバランスを取る必要がある。
# 課題
- サブクエリごとに文書を一つずつ取得することで、情報の有用性に関する信念を構築し、次に続けるべきか、別の選択肢を探るべきかの決定を行う必要がある。
# 手法
- クエリ分解と文書取得を、探索と活用の設定で定式化。
- 様々なバンディット学習手法を用いて、最も情報価値の高いサブクエリを動的に選択する実験を実施。
# 結果
- 文書の関連性をランク情報と人間の判断を用いて推定することで、文書レベルの精度が35%向上。
- {\alpha}-nDCGが15%向上し、長文生成の下流タスクにおいてもパフォーマンスが改善。
# 限界 / 今後の展望
- 本研究は特定のデータセットに基づいているため、他のドメインやデータセットへの適用性についてはさらなる検証が必要。
- 将来的には、より多様な情報源を取り入れたクエリ分解手法の開発や、リアルタイムでの文書選択の最適化が求められる。