AURA:面向复合 AI 系统的反射式自适应自动研究
受卡帕西 (Andrej Karpathy) 的 *autoresearch* 思路启发,AURA 是一个面向复合 AI 系统的样本高效提示优化器:每次 rollout 后把完整轨迹交回 LLM,并要求它对自身 prompt 提出一处具名的修改。在多跳问答、指令跟随、AIME 数学等任务上,AURA 用最多减少 35× 的 rollout 追平 GRPO,并在聚合指标上比 MIPROv2 高约 10 个点。
- LLM
- Prompt Optimization
- Compound AI
- Reflection
- Autoresearch