Harry&

コスト相場

RAG構築の費用相場と内訳 社内データ検索AIにいくらかかるか

RAG構築の費用相場と内訳 社内データ検索AIにいくらかかるか

RAG構築は小規模PoCで50〜150万円、本番運用までで300〜800万円が目安。費用の正体と上下要因を分解する。

無料相談無料相談受付中

いきなり作らない。AIで何がどう変わるかを、先に見極める。

  • ノーコードの卒業先、AIネイティブ受託。事業の文脈で要件から実装まで伴走
  • 45分・Web。検討段階のご相談・資料だけでも歓迎。しつこい追客はしません

RAG構築の費用相場と内訳 社内データ検索AIにいくらかかるか

RAG構築は小規模PoCで50〜150万円、本番運用までで300〜800万円が中心帯。費用の半分以上は「データ整備」に消えるため、見積りはAPI料金より工数の置き場で見るのが実務的だ。

社内ドキュメント検索AI(RAG)を検討すると、ベンダーから出てくる見積りが100万円から1,000万円超まで一桁違うことが珍しくない。なぜここまで開くのか。理由はシンプルで、RAGの費用はLLM API利用料ではなく「社内ドキュメントをAIが読める状態に整える工数」が主役だからだ。本稿では、PoCから本番運用までのフェーズ別相場、内訳の中身、見積りが膨らむ変動要因、そして実務的な圧縮策まで分解する。中小企業の情シス担当が、社内決裁と相見積もり比較で迷わなくなることが目的だ。

RAG構築費用の全体像|PoCから本番運用までの相場マップ

検証PoC(50〜150万円)→ 限定本番(150〜400万円)→ 全社本番(300〜800万円)の3段が中心帯。一気に最終形を作らず段階を切るのが事故率を下げる。

RAG構築費用は、対象とする業務範囲と社内ドキュメントの母数によって階段状に増える。最初に押さえるべきは、PoC(概念検証)と本番運用が地続きでない、という点だ。PoCで動いた構成をそのまま本番にスケールさせるとコストが想定の2〜3倍に膨らむケースが多く、フェーズごとに切って見積るのが現実的だ。

実勢として中小企業(社員30〜300名)で確認できる費用帯を整理すると、おおむね次の通りになる。なお自社価格ではなく、複数ベンダーの提案書とWeb上の事例を突合した目安だ。

フェーズ規模開発費用(一時)月額運用期間
検証PoC数百〜1,000ファイル・1部門50〜150万円5〜15万円1〜2ヶ月
限定本番数千ファイル・2〜3部門150〜400万円15〜40万円3〜4ヶ月
全社本番数万ファイル・全社300〜800万円30〜100万円6〜12ヶ月

この相場は、ベクトルDB(PineconeやWeaviate相当)と汎用LLM API(GPT-4o / Claude Sonnet 4 相当)の組み合わせを前提にしている。オンプレ要件や独自LLM・ファインチューニングが入る案件はこの帯から大きく外れる。

階段の境界を作る変数は3つ。①対象ドキュメントの種類(PDF・Word・Wiki・図表混在)、②同時利用ユーザー数(10名と500名で月額が桁違いになる)、③要求される回答精度(社内Q&Aなら70%でよいが、契約書・規程の参照には95%以上を求められる)。この3つを最初に定義しないまま見積りを取ると、ベンダーが「全部入り」で組んできて費用が膨らむ。

RAG構築費用のフェーズ別相場マップ

自社のどのフェーズから始めるべきかは、対象ドキュメントの母数と現場の運用力で決まる。判断軸の整理に迷う場合は、初月無料の経営AI診断で社内の状況を一緒に棚卸しすることもできる。

費用の内訳を分解する|なぜ「データ整備」が半分以上を占めるのか

RAG開発費の40〜60%はドキュメント前処理・チャンク分割設計・評価データ作成の工数。LLM API利用料は10〜20%しか占めない。

「RAGはLLMを呼ぶだけだから安いはず」という前提で見積りを見ると、内訳の配分に違和感を持つことが多い。実際の費用構造を分解すると、開発費の半分以上は人件費、それも「社内のドキュメントをAIが扱える状態に整える工数」に集中している。

300〜500万円規模の中小企業向けRAG案件で、よく見る費用配分は次のようになる。

費用項目構成比内容
ドキュメント前処理・構造化30〜40%PDF/Word/Wikiのクリーニング、表・図の扱い、チャンク分割の設計
評価データ作成・チューニング15〜25%業務質問100〜300件の正解データ作成、精度測定、検索パラメータ調整
アプリ開発(UI・認証・API)15〜25%社内システム連携、Slack/Teams連携、権限制御の組込み
インフラ構築・運用設計10〜15%ベクトルDB構築、CI/CD、ログ・監視、定期再インデックス
LLM API利用料(開発期間中)5〜10%OpenAI/Anthropic API、ベクトル化API
プロジェクト管理・要件定義5〜10%ヒアリング、要件整理、進行管理

ドキュメント前処理が膨らむ理由はシンプルだ。社内文書は人が読む前提で作られており、AIにとって扱いにくい構造をしている。複数列のPDF、結合セルだらけのExcel、改ページで分断された表、画像で貼り付けられた組織図、フォルダ階層と命名規則のばらつき。これらを「同じ意味の塊」に切り直す作業がRAG精度の大半を決める。チャンク分割は機械的に文字数で切ればよさそうに見えるが、契約書の条項を途中で切ると検索精度が落ちる、といった業務ロジックの判断が必要になる。

評価データ作成も軽視されがちな項目だ。「社内のよくある質問100問とその正解」を作る工数は、現場担当者と1〜2週間並走しないと出てこない。ここを省くと、PoCのデモは動いてもいざ全社展開した瞬間「期待した回答が返ってこない」と現場から突き返される事故が起きる。

逆にLLM API利用料は、開発期間中で月数万円〜十数万円、本番運用でも月数万円〜数十万円の範囲に収まることが多い。「APIが高い」という直感は、検証段階では大抵あてはまらない。

RAG構築費用の内訳とAPI利用料の比率

見積りを左右する変動要因|なぜ100万円と1,000万円で開くのか

同じ「社内検索AI」でもドキュメント種類・利用者数・精度要件・既存システム連携の4つで費用は5〜10倍動く。要件定義の粒度がそのまま費用に直結する。

ベンダーAが120万円、ベンダーBが850万円という見積り差を見たことがあるなら、両者は「同じものを作ろうとしていない」可能性が高い。RAG構築費用を5〜10倍動かす変動要因は、おおむね次の4つに集約される。

①対象ドキュメントの種類と状態

  • テキスト中心のWiki・議事録のみ:前処理工数が低く、PoC50〜80万円で動く
  • PDF・Word混在で表が多い:前処理工数が膨らみ、PoC100〜150万円に上振れ
  • 紙の手書き・古いExcel・図面が混在:OCR・構造化に追加工数が必要で、PoC段階から200万円超
  • 機密度別の権限管理が必要:ベクトルDB側でテナント分離・行レベル権限が必要になり、本番で+100〜300万円

②同時利用ユーザー数とリクエスト頻度

  • 10〜30名・1日100クエリ程度:月額5〜15万円
  • 50〜100名・1日500クエリ:月額15〜40万円
  • 200名以上・1日2,000クエリ超:月額50〜150万円(API利用料がスケール)

③要求される回答精度

社内FAQで「だいたい合っていればよい」なら、汎用LLM+シンプルRAGで70〜80%の正答率が出る。一方で、規程・契約書・診療記録のように「間違ったら業務影響が大きい」用途では、re-ranking・ハイブリッド検索・LLMの後段検証を組み込み、評価データセットを300〜500件単位で作り込む必要がある。この差で開発工数が2〜3倍動く。

④既存システム連携

社内のActive Directory、SharePoint、kintone、Salesforce、独自業務システムと連携する場合、API設計・権限同期・データ取込パイプラインに追加で50〜200万円かかる。スタンドアロンのWebアプリだけで完結するか、業務システムに組み込むかで2倍違う、と覚えておくとよい。

RAG構築費用を左右する4つの変動要因

つまり、見積りの妥当性を判断する第一歩は金額の絶対値を比較することではなく、「自社の①〜④を要件として明示できているか」を確認することだ。要件が曖昧な状態で複数ベンダーに投げると、各社が違う前提で見積もり、比較不能な金額が並ぶ。

ベンダー見積りの読み方|どこを削ると事故るか

削ってよいのはUI装飾・初期データ量・対象ユーザー範囲。削ってはいけないのは評価データ作成・運用設計・前処理の人月。

費用を抑えたいとき、見積り上のどの項目を削るかで、PoCの成否が分かれる。「LLM API利用料を半額にしてください」と交渉しても効果は限定的で、削るべきは別の場所にある。

削っても影響が小さい項目

  • UI・デザイン:社内利用ならSlack BotやTeamsアプリで十分。専用Web UIを作ると50〜100万円増える
  • 初期ドキュメント量:全社1万ファイルを一度に入れるのではなく、1部門500ファイルから始めれば前処理工数が1/10に
  • 対象ユーザー範囲:全社100名同時利用ではなく、まず1部門10名で運用知見を貯める

削ると事故る項目

  • 評価データ作成:これを省くとPoCのデモは動くが、本番で「期待した答えが返らない」と現場が離反する
  • 運用設計(再インデックス・ログ・監視):ドキュメント更新時に検索結果が古いまま、という事故が起きる
  • ドキュメント前処理の人月:表・図を雑に扱うと検索精度が10〜20ポイント落ち、結局やり直しになる

中小企業がRAG導入で躓く典型は、「LLMが高いから安いベンダーに」と価格だけで選び、結果として前処理と評価設計が薄い見積りに飛びついてしまうパターンだ。AI導入全般のコスト感を整理したい場合は、関連記事の費用相場ガイドも合わせて参照してほしい。

ベンダー見積りで削ってよい項目と事故る項目

圧縮策の選択肢|PoC費用を半分にする3つの実務的アプローチ

マネージドサービスの活用・段階的スコープ・補助金の3点で、初期費用は実際に30〜50%圧縮できる。ただし圧縮策にはトレードオフがある。

「相場は分かったが、その金額を稟議で通せない」という現実的な制約に対して、PoC費用を半分にする現場的な手立てを3つ紹介する。いずれも事業のスケールと社内体制次第でトレードオフがあるため、自社状況に合わせて選ぶ。

①マネージドサービスを最大限活用する

ベクトルDBを自前構築するのではなく、PineconeやAmazon Bedrock Knowledge Bases、Azure AI Searchなどのマネージドサービスを使えば、インフラ構築費用30〜50万円が削れる。LLMはOpenAI API・Anthropic APIをそのまま使い、フロントエンドはStreamlitやSlack Boltで簡易に組む。これでPoC期間の開発費用を50〜80万円に抑えられる事例がある。

トレードオフは、本番運用時にベンダーロックインのリスクと月額従量課金が積み上がる点だ。月100名以上の利用が見込まれる場合は、後で自前構築に切り替える前提でPoCを設計する。

②スコープを段階的に切る

「全社1万ファイル・全部門」を最初から狙わず、「1部門・500ファイル・10名」のPoCから始める。これで前処理工数が1/10、評価データ作成も1/5、合計150〜200万円の節約になる。3ヶ月の運用で精度と利用率が証明できれば、社内決裁で次フェーズの予算を取りに行きやすくなる。

注意点として、「PoCで動いたら本番にスケールできる」とは限らない。スケール時の追加コスト(前処理の自動化、権限制御、運用体制)を最初の見積りに織り込んでおく。

③デジタル化・AI導入補助金・ものづくり補助金を活用する

中小企業のAI導入は、2026年度から名称が変わったデジタル化・AI導入補助金(旧IT導入補助金)やものづくり補助金の対象になるケースがある。デジタル化・AI導入補助金2026の通常枠は補助率1/2以内(最低賃金近傍の事業者は2/3以内)が基準で、RAG導入は「業務効率化」「DX推進」の枠組みに合致しやすい。補助率・補助上限・申請枠は年度ごとに変動するため、申請時に必ず公式の公募要領で最新値を確認する。

ただし補助金申請は事業計画書の作成に1〜2ヶ月かかり、採択後も実績報告など事務工数が発生する。300万円以下の小規模PoCでは費用対効果が薄いことがあるため、本番スケール時に検討するのが現実的だ。

RAG構築費用を圧縮する3つのアプローチとトレードオフ

RAG導入を進める実務的な3ステップ|中小企業の情シスが社内決裁を通すために

①対象業務の絞り込み(1部門・500ファイル)→ ②2〜3社相見積もり(要件4軸を統一)→ ③PoC契約(評価データ作成を必須化)の順で動くと、稟議が通り事故が減る。

費用相場と内訳を理解したうえで、社内決裁と相見積もり比較を実際に動かすには次の3ステップが現実的だ。

Step 1: 対象業務と要件を1ページにまとめる(社内2週間)

  • 対象部門と業務(例:法務部・契約書の条項検索)
  • 想定利用者数とリクエスト頻度
  • 対象ドキュメントの種類・概算ファイル数
  • 期待する回答精度(80% / 90% / 95%)と業務影響

このシートを作らずに相見積もりを取ると、各社が違う前提で見積もって比較不能になる。逆にこの1枚があれば、ベンダー側も的確に提案でき、見積り精度が上がる。

Step 2: 2〜3社から相見積もりを取る(社外3〜4週間)

価格比較ではなく、ドキュメント前処理・評価データ作成・運用設計の人月配分を比較する。各社の見積り内訳で「データ整備に何人月使うか」「評価データを何件作るか」を必ず明示してもらう。LLM API利用料の差は本質ではない。

Step 3: PoC契約と評価ゲートを設計する(プロジェクト開始時)

PoC契約には「評価データ100件以上で精度80%超」のような明確な合格ライン(評価ゲート)を入れる。これがないと「動きました」だけで本番判断ができず、追加発注で費用が膨らむ。

自社の業務に合わせた具体的な見積り読み解きや、評価ゲートの設計で迷う場合は、初月無料の経営AI診断で実際の見積書とRFPを一緒に整理することができる。ベンダー選定の前段階で社内の課題と相場感を可視化しておくと、その後の意思決定が早くなる。

RAG導入の実務3ステップ

まとめ|RAG構築費用の正体は「データ整備の人月」

RAG構築費用は、PoCで50〜150万円、限定本番で150〜400万円、全社本番で300〜800万円が中心帯。費用の正体はLLM API料金ではなく、ドキュメント前処理・評価データ作成・運用設計の人月だ。見積りを比較する際は金額ではなく、これらの人月配分を確認するのが実務的な判断軸になる。圧縮策は、マネージドサービス活用・段階的スコープ・補助金活用の3点。ただし評価データ作成や前処理を削ると、PoCで動いても本番で精度が出ず作り直しになる。中小企業の情シスが社内決裁を通すには、対象業務の1枚要件定義 → 相見積もり → 評価ゲート付きPoC契約の3ステップが現実的な進め方だ。

関連記事

「まず費用感だけ知りたい」という方へ。
1分で概算費用がわかるシミュレーターをご用意しています。

1分で見積りを試す →

よくある質問

Q. RAG構築は最低いくらから始められますか
A. 社内ドキュメント数百〜1,000ファイル程度の検証PoCであれば、50〜150万円規模が実勢の目安です。ベクトルDBはマネージドの無料枠やローカル運用、LLMはAPI従量課金(月数万円〜)で抑えれば、初期費用を下げられます。ただし数百万円規模の見積りが出てくる場合、その多くはドキュメント前処理と評価設計の工数で、ここを削ると精度が出ず再構築になりやすい点には注意が必要です。
Q. 費用の内訳でいちばん大きいのはどこですか
A. 多くの場合、開発費用全体の4〜6割がドキュメント前処理(クリーニング・構造化・チャンク分割の設計)に充てられます。表や図が混じったPDF、紙の手書きから起こしたWord、社内Wikiの古いページなどが混在する現場では、ここの工数が膨らみがちです。LLM API利用料そのものは、検証段階では月数万円〜十数万円に収まるケースが大半で、初期費用に比べれば小さい比率です。
Q. ベンダーから出てくる見積りの妥当性はどう判断すればいいですか
A. 金額の絶対値ではなく、内訳のうちドキュメント前処理・評価データ作成・運用設計に何人月割り当てているかを確認するのが実務的です。これらが薄い見積りは、PoCは動いても本番で精度が出ず作り直しになりがちです。逆にLLM API利用料を月数十万円と高く見積もる業者は、想定リクエスト数の根拠を確認した方が安全です。判断軸を整理したい場合は、初月無料の経営AI診断で実際の見積書を一緒に読み解くことも可能です。
Q. クラウド型のSaaS(ChatGPT Enterpriseなど)と内製RAGはどう違いますか
A. SaaS型は1ユーザー月数千円〜数万円から始められる代わりに、社内データの取り込み範囲や検索精度のチューニング自由度が限定されます。内製RAGは初期300〜800万円程度が必要ですが、自社固有の業務文脈や独自分類に合わせて精度を上げられます。社員50名未満かつ社内データが汎用業務(議事録・規程)中心ならSaaSで足り、専門業務(設計図書・症例・契約書)が多い現場では内製の優位性が出ます。

あわせて読みたい

この記事をシェア

Next Step

「とりあえず相談」が、
一番の近道です。

いきなり作りません。投資対効果を見極めてから進めるので、ムダな開発を防げます。
検討段階のご相談・資料だけでも歓迎。しつこい追客はしません。

※ 精密な見極めをご希望の方へ:有料診断(¥100,000・充当なし)も。無料相談のあとにご案内します。

Harry&がわかる3点セット — サービス概要・導入事例・料金体系

無料資料

Harry&がわかる3点セット

サービス概要・導入事例・料金体系をまとめた資料を無料でお届けします。

資料をダウンロード
無料相談 — 45分・Web。検討段階のご相談も歓迎

無料相談

いきなり作らない。
先に見極めてから進める。

45分・Web。検討段階のご相談・資料だけでも歓迎。しつこい追客はしません。

無料で相談する
1分で見積り — かんたんな質問に答えるだけで費用の目安がわかる

無料シミュレーター

1分で費用の目安を確認

かんたんな質問に答えるだけ。まず費用感だけ知りたい方にどうぞ。

1分で見積りを試す →