OpenRLHF - yuuk1's Digital Garden

# OpenRLHF RLHF(reinforcement learning from human feedback)向けの「使いやすく・スケーラブルで・高性能な」訓練フレームワーク(Hu+ 2024, arXiv:2405.11143)。 [[@2026__arXiv__Towards Robust LLM Post-Training - Automatic Failure Management for Reinforcement Fine-Tuning]] では [[RFT-FaultBench]] の構築基盤として用いられ、制御された算術的推論タスクの上で 16 種の障害を訓練ループにオンライン注入する土台となった。本 wiki では同論文の参照(参考文献 [23])として記録する。 ## 関連 - 本ソース: [[@2026__arXiv__Towards Robust LLM Post-Training - Automatic Failure Management for Reinforcement Fine-Tuning]] - 利用先: [[RFT-FaultBench]](構築基盤) - 関連概念: [[強化ファインチューニング]]