タイトル: Programming with Data: Test-Driven Data Engineering for Self-Improving LLMs from Raw Corpora著者: Chenkai Pan, Xinglong Xu, Yuhang Xu et al.(浙江大学ほか)発表: 2026年4月(arXiv)AIの学習データ作りを「テスト→デバッグ→修正」のサイクルで行う方法論を提案知識を3階層(概念・関係・推論チェーン)に整理し、間違いの原因をピンポイントで診断わずか1,000サンプルの修正で、従来の10倍のデータを使った手法を上回る成果を達成ファインチューニング: 学習済みのAIに、特定分野のデータを追加で学ばせて専門家に育てる工程ですベンチマーク: AIの能力を測るためのテスト問題集のこと概念ギャップと推論不足: AIが間違える原因を「知識自体がない」のか「知識はあるけど組み合わせられない」のかに分けた考え方破滅的忘却: 新しいことを学ばせると、前に覚えていたことを忘れてしまうAIの困った現象L1/L2/L3知識構造: 「概念→関係→推論チェーン」と3層に知識を整理した地図のような仕組み論文URL: https://arxiv.org/abs/2604.24819