RAG / アーキ

RAG とファインチューニング、どっちを選ぶ？業務適用での判断基準

岡田
AIエンジニア / RAG ARCH

·公開 2026.04.14·読了約7分

「ファインチューニング（FT）しないと業務には使えないですよね？」——お客様との打ち合わせで定期的にぶつかる問いです。結論から言うと、業務適用ではRAGで十分なケースが圧倒的多数。ただし、FTやLoRAが効くシーンもはっきりあります。判断基準を整理します。

そもそも何が違うのか

ざっくり——

YES → RAG。 社内規程・マニュアル・FAQ は週単位で更新されます。FTし直すコストとリードタイムは現実的でない。

YES → RAG。 FTは知識をモデル内部に溶かしてしまうので、回答の出典をピンポイントで示すのが難しい。業務RAGでは出典表示は必須要件です。

数百〜数万件の文書 → RAG。数十万件以上の"スタイル"を学ばせたい → LoRA / FT。「知識」を増やすより「話し方・出力フォーマット」を学習させたい時こそFTの出番。

「医療カルテの記録フォーマット」「契約書ドラフトの定型」など、出力の構造が厳格な場合は LoRA／FT がハマることがあります。プロンプトだけでは安定しにくい。

応答速度が厳しい → 小型モデル＋FT が有効なケースあり。RAGは検索のステップが入る分、レイテンシは増える。

「学習データを外に出せない」場合、オンプレで動くオープンモデルにLoRAをかけるアプローチが有力。逆に学習データの管理が難しい場合はRAGで素直にやる。

PoCならまずRAG一択。FTは「RAGで限界が見えてから」検討する順序が現実的。

"知識"を扱うなら RAG、"スタイル"を学ばせるなら FT。両方欲しいなら、RAG + LoRA の組み合わせがバランス良い選択肢になります。

実務では「RAG+LoRA」が選ばれるシーンが増えています。

例：建設業の点検レポートを生成するAI。事例知識はRAGで取得し、レポート様式（章立て・必須項目）はLoRAで学習。これでハルシネーションが大幅に減り、レポート品質が安定します。

初手でFTに走ると、下記のような問題が出ます。

FTは効くと爆発的に効きますが、運用負荷も同じくらい重い。「PoC失敗の対症療法」としてFTに走るパターンは、ほぼ確実に頓挫します。

MU AI事業部では、案件のフェーズと要件に応じて RAG / LoRA / FT を組み合わせて設計します。「うちのデータで、RAGとFTどっちが効くか」のお見立てもヒアリングからご相談ください。

AI · RAG ARCH

機械学習・NLP出身。RAGアーキテクチャの設計、Vector DB・Reranker・評価設計を担当。

御社の業務とデータの状況から、最適なアーキテクチャを初回ヒアリングでフィードバックします。