RAG / アーキ

RAG と ファインチューニング、どっちを選ぶ?業務適用での判断基準

「ファインチューニング(FT)しないと業務には使えないですよね?」——お客様との打ち合わせで定期的にぶつかる問いです。結論から言うと、業務適用ではRAGで十分なケースが圧倒的多数。ただし、FTやLoRAが効くシーンもはっきりあります。判断基準を整理します。

そもそも何が違うのか

ざっくり——

  • RAG:モデルは変えず、外部の知識を都度プロンプトに足す。
  • FT(ファインチューニング):モデルそのものを追加学習で書き換える。
  • LoRA / PEFT:モデルの一部だけを軽量に追加学習する。

判断のための7つの問い

Q1. 情報が頻繁に更新されるか?

YES → RAG。 社内規程・マニュアル・FAQ は週単位で更新されます。FTし直すコストとリードタイムは現実的でない。

Q2. 出典・根拠の表示が必要か?

YES → RAG。 FTは知識をモデル内部に溶かしてしまうので、回答の出典をピンポイントで示すのが難しい。業務RAGでは出典表示は必須要件です。

Q3. データ量はどのくらいか?

数百〜数万件の文書 → RAG。数十万件以上の"スタイル"を学ばせたい → LoRA / FT。「知識」を増やすより「話し方・出力フォーマット」を学習させたい時こそFTの出番。

Q4. 出力フォーマットが厳格か?

「医療カルテの記録フォーマット」「契約書ドラフトの定型」など、出力の構造が厳格な場合は LoRA/FT がハマることがあります。プロンプトだけでは安定しにくい。

Q5. レイテンシの制約は?

応答速度が厳しい → 小型モデル+FT が有効なケースあり。RAGは検索のステップが入る分、レイテンシは増える。

Q6. 機密性・データ所有権の要件は?

「学習データを外に出せない」場合、オンプレで動くオープンモデルにLoRAをかけるアプローチが有力。逆に学習データの管理が難しい場合はRAGで素直にやる。

Q7. PoC段階か、本番か?

PoCならまずRAG一択。FTは「RAGで限界が見えてから」検討する順序が現実的。

判断ヒューリスティクス

"知識"を扱うなら RAG、"スタイル"を学ばせるなら FT。両方欲しいなら、RAG + LoRA の組み合わせがバランス良い選択肢になります。

RAGとFTを組み合わせるケース

実務では「RAG+LoRA」が選ばれるシーンが増えています。

  • 業務文書の"知識"はRAGで都度参照
  • 業界特有の"出力フォーマット"はLoRAで学習

例:建設業の点検レポートを生成するAI。事例知識はRAGで取得し、レポート様式(章立て・必須項目)はLoRAで学習。これでハルシネーションが大幅に減り、レポート品質が安定します。

"安易なFT"のリスク

初手でFTに走ると、下記のような問題が出ます。

  1. データキュレーション地獄:FT用学習データの品質を担保するのは想像以上に重労働。
  2. カタストロフィック・フォーゲッティング:追加学習で元のモデルが"忘れる"。
  3. 運用が硬直化:業務変更のたびに再学習が必要に。
FTは効くと爆発的に効きますが、運用負荷も同じくらい重い。「PoC失敗の対症療法」としてFTに走るパターンは、ほぼ確実に頓挫します。

結論 — 業務適用での判断ライン

  • 「社内ナレッジを引きたい」→ RAG
  • 「決まった様式で書かせたい」→ LoRA / FT
  • 「両方欲しい」→ RAG + LoRA
  • 「PoC段階」→ まずRAG。FTは後で検討

MU AI事業部では、案件のフェーズと要件に応じて RAG / LoRA / FT を組み合わせて設計します。「うちのデータで、RAGとFTどっちが効くか」のお見立てもヒアリングからご相談ください。

OK

岡田 / AIエンジニア

AI · RAG ARCH

機械学習・NLP出身。RAGアーキテクチャの設計、Vector DB・Reranker・評価設計を担当。

RAGかFTか、判断のお見立てを無料で。

御社の業務とデータの状況から、最適なアーキテクチャを初回ヒアリングでフィードバックします。

無料相談を申し込む
無料相談を申し込む →