そもそも何が違うのか
ざっくり——
- RAG:モデルは変えず、外部の知識を都度プロンプトに足す。
- FT(ファインチューニング):モデルそのものを追加学習で書き換える。
- LoRA / PEFT:モデルの一部だけを軽量に追加学習する。
判断のための7つの問い
Q1. 情報が頻繁に更新されるか?
YES → RAG。 社内規程・マニュアル・FAQ は週単位で更新されます。FTし直すコストとリードタイムは現実的でない。
Q2. 出典・根拠の表示が必要か?
YES → RAG。 FTは知識をモデル内部に溶かしてしまうので、回答の出典をピンポイントで示すのが難しい。業務RAGでは出典表示は必須要件です。
Q3. データ量はどのくらいか?
数百〜数万件の文書 → RAG。数十万件以上の"スタイル"を学ばせたい → LoRA / FT。「知識」を増やすより「話し方・出力フォーマット」を学習させたい時こそFTの出番。
Q4. 出力フォーマットが厳格か?
「医療カルテの記録フォーマット」「契約書ドラフトの定型」など、出力の構造が厳格な場合は LoRA/FT がハマることがあります。プロンプトだけでは安定しにくい。
Q5. レイテンシの制約は?
応答速度が厳しい → 小型モデル+FT が有効なケースあり。RAGは検索のステップが入る分、レイテンシは増える。
Q6. 機密性・データ所有権の要件は?
「学習データを外に出せない」場合、オンプレで動くオープンモデルにLoRAをかけるアプローチが有力。逆に学習データの管理が難しい場合はRAGで素直にやる。
Q7. PoC段階か、本番か?
PoCならまずRAG一択。FTは「RAGで限界が見えてから」検討する順序が現実的。
判断ヒューリスティクス
"知識"を扱うなら RAG、"スタイル"を学ばせるなら FT。両方欲しいなら、RAG + LoRA の組み合わせがバランス良い選択肢になります。
RAGとFTを組み合わせるケース
実務では「RAG+LoRA」が選ばれるシーンが増えています。
- 業務文書の"知識"はRAGで都度参照
- 業界特有の"出力フォーマット"はLoRAで学習
例:建設業の点検レポートを生成するAI。事例知識はRAGで取得し、レポート様式(章立て・必須項目)はLoRAで学習。これでハルシネーションが大幅に減り、レポート品質が安定します。
"安易なFT"のリスク
初手でFTに走ると、下記のような問題が出ます。
- データキュレーション地獄:FT用学習データの品質を担保するのは想像以上に重労働。
- カタストロフィック・フォーゲッティング:追加学習で元のモデルが"忘れる"。
- 運用が硬直化:業務変更のたびに再学習が必要に。
FTは効くと爆発的に効きますが、運用負荷も同じくらい重い。「PoC失敗の対症療法」としてFTに走るパターンは、ほぼ確実に頓挫します。
結論 — 業務適用での判断ライン
- 「社内ナレッジを引きたい」→ RAG
- 「決まった様式で書かせたい」→ LoRA / FT
- 「両方欲しい」→ RAG + LoRA
- 「PoC段階」→ まずRAG。FTは後で検討
MU AI事業部では、案件のフェーズと要件に応じて RAG / LoRA / FT を組み合わせて設計します。「うちのデータで、RAGとFTどっちが効くか」のお見立てもヒアリングからご相談ください。