生成AIの登場から数年が経過し、多くの企業にとってその活用は概念実証(PoC)の段階を終え、事業変革の中核を担う本格導入のフェーズへと移行しつつあります。この大きな潮流は、AIの能力に注目が集まる一方で、これまで経営の中心的な議題とはなりにくかった「AIを安定稼働させるためのインフラ構築」という課題を、避けて通れない現実として突き付けています。本レポートは、まさにこの喫緊の経営課題に対し、グローバルなコンピューティング市場動向を提示するものです。AIの活用はクラウドをはじめとするあらゆるプラットフォームのコンピューティング需要を押し上げています。特に、生成AIの本格活用に伴う学習・推論ワークロードの急増は、クラウドコストの想定外の増加をもたらし、経営に影響を与え始めています。デロイトの調査では、実に55%の企業がコストを主たる動機としてクラウドからのワークロード移行を検討しています。
AIコストを見極めるには、GPUやCPUの利用料だけでは全体像を捉えることが出来ません。AI活用の総所有コスト(TCO)は、モデル利用量に応じた「AIトークン」のコストや、大量のデータ転送に伴うネットワークコストなど、より複雑な要素で構成されているからです。
これからのAIインフラ戦略は、単なるIT部門のコスト最適化活動ではなく、イノベーションとリスク管理のバランスを取る「経営戦略」として捉え直すべきだと我々は考えています。その核心となるのが、本レポートでも提示されている「データの重心(data gravity)」という概念です。企業の最も価値ある資産であるデータをどこに配置し、その周辺でいかに効率的にAIワークロードを処理させるか。この戦略的決定が、今後のAI活用の俊敏性、パフォーマンス、そしてコスト効率のすべてを規定すると言っても過言ではありません。
本レポートは、こうした複雑な意思決定を行うための具体的な羅針盤を提供します。
AIのポテンシャルを真に引き出すには、優れたAIアプリケーションという「知能」と、それを支える強靭かつ経済的なインフラ基盤という「心臓部」の両輪が不可欠です。
今後、日本国内でも急増が見込まれるAIファクトリーやデータセンターは、データ・電力・冷却・ネットワーク・セキュリティ・運用を垂直統合したAI専用の生産設備として、知能を継続的に生み出す拠点となります。自社の競争力の中核として内製するモデル、外販や共同運営モデルなど、資本効率とリスク許容度に応じた選択肢が広がります。
産業設備の観点では、既存データセンターのAIレディ化(液冷・配電・高帯域ネットワーク)やマイクロAIファクトリーの新設、工場・物流など現場近接の環境整備が進み、高圧受変電、液冷ソリューション、データセンターインフラ管理(DCIM)・監視、保守運用まで幅広い領域で継続的な投資需要が生まれることが見込まれます。また、系統接続の制約や電力単価、脱炭素要請に応えるため、再エネPPAや蓄電池によるピークカット、排熱の地域還元といったエネルギー統合の知見が鍵となります。用地・電源・人材の制約を踏まえ、自治体・産業クラスターと連携した人材育成・地域共創を図ることで、日本発のAIファクトリーやデータセンタービジネスを持続的に育てていくことが肝要となります。
本レポートが、AI時代の競争優位を築こうとする日本の企業にとって、自社のインフラ戦略を再定義し、未来への一歩を踏み出す一助となることを、心より期待しています。
合同会社デロイト トーマツ
執行役員
水野 梨津子
企業が人工知能(Artificial Intelligence:以下「AI」)の能力強化を加速させ続ける中、変動するコンピューティング需要に対応するため、データセンター戦略は急速に進化している。デロイトの調査(詳細は過去の記事“Is your organization’s infrastructure ready for the new hybrid cloud?”で解説)によると、企業はコスト、レイテンシー、ハードウェアの要件といった要因に基づき、さまざまなインフラアプローチを検討している。それらは、メインフレームからの脱却、新たなハイブリッドクラウド戦略の策定、AIファクトリーという新たな市場の確立まで、多岐にわたる。特に、AIファクトリーは、標準的な推論から高性能コンピューティングまで、極めて大規模なタスクを処理できる1。
しかし、多くのビジネスリーダーは、AI時代に対応できるレジリエントな事業と技術インフラを構築する上で、多くの難題に直面するだろう。AIシステムは、大量の高品質なデータと、多くの相互依存するコンポーネントから成る複雑な分散アーキテクチャに依存している。特に、攻撃対象領域が拡大し、低レイテンシーの応答が求められる状況では、正確な予測と効果的な耐障害性を実現するために、データの可用性や整合性、リアルタイムでの障害検知、堅牢なランタイムセキュリティ、そして迅速な復旧を確保することが重要である。
オンプレミス、クラウド、その他のハイパフォーマンスコンピューティング(High-Performance Computing:以下「HPC」)ソリューションの間で、いかに適切なバランスを取るべきか。AIワークロードが、オーケストレーション層を横断する同期的・非同期的な連携に対応できるよう拡張していく中で、技術インフラにはどの程度の適応性が求められるのか。AIの利用と活用のパターンは依然として大部分が未知の領域であるため、企業(および事業者)は需要の予測や確信を持った計画立案に苦慮している。
デロイトは、メインフレーム、クラウド、企業内オンプレミス、エッジコンピューティング、そして新興技術といった各種インフラの変化予測を把握するための調査を過去に実施した。(2025年3月~4月)調査対象は、データセンタープロバイダー、エネルギー供給事業者、販売事業者など120の市場事業者とした(調査手法参照)。本分析では、AIワークロードがもたらすコンピューティング需要予測の変化、異なるインフラ間でワークロードを移行する際の意思決定に影響を与える主要因、そして、進化するHPCのニーズに対応するためのコンピューティングインフラ拡張という課題にビジネスリーダーが講じている措置を考察する。
我々の調査では、ビジネスリーダーたちに対し、今後12ヶ月およびそれ以降に、各技術インフラ上でコンピューティングワークロードがどのように変化するかを尋ねた(図1)。
データからは明確な傾向が見て取れる。ビジネスリーダーたちは、多様な処理能力が求められるAI主導のワークロードが、幅広いプラットフォームでコンピューティング需要を増加させると予測している。調査対象となったすべての技術インフラにおいて、今後12カ月でワークロードが20%以上増加すると見込まれている。AIワークロードには、事前学習モデルの作成、強化学習や「思考の連鎖(Chain-of-Thought:CoT)」「推論(Reasoning)」といった学習後の技術によるモデル改善、そして特にエージェントAIのようなAIを大規模に展開する際の推論タスクでのモデル利用が含まれる。
短期的に最も急増が見込まれるのは、新興AIクラウドプロバイダー(87%)とエッジコンピューティングプラットフォーム(78%)であるとされ、その成長ペースはオンプレミスのデータセンターと比べて、それぞれ約10倍、6倍に達するとみられている。パブリッククラウドとプライベートクラウドも、ともに顕著な増加が見込まれており、メインフレームとオンプレミスのデータセンターのワークロードも来年には増加すると予測されている。一方で、ビジネスリーダーたちは他のインフラでキャパシティを増強したり、既存の非AI向けオンプレミスソリューションをAIに最適化された構成に変更したりすることで、これらのインフラへの依存度を減らしているようだ。回答者の3分の1は、今後12カ月でメインフレームとオンプレミスのワークロードを減少または大幅に減少させる予定であると述べている。
この動きは、デロイトが別途論じているメインフレームの廃止の潮流と一致する可能性がある。しかし、従来のデータセンターに目を向けると、企業はコンピューティング需要の増加に対処するために複数のアプローチを取っていることが我々の調査で明らかになっている。それらのアプローチには、既存のデータセンターの再構成、廃止されたデータセンターの再稼働、ハイパースケーラー・ニッチなプロバイダー・新規参入者とのAIインフラの再構想、そしてGPU・AIトークンの活用状況評価に基づく新規ソリューションへの投資などが挙げられる。
では、こうしたコンピューティング需要の変化は、ビジネスリーダーにとって何を意味するのだろうか。インフラ責任者は、よりスマートかつレジリエントで、効率的な環境を構築できるようにする必要がある。同時に、多くの企業が既に感じているだろう混乱を乗り切るためには、セキュリティ、ガバナンス、人材管理に対する新たなアプローチも求められる。AIの拡張によるワークロードの増加が予測される中、その増加分を適切なプラットフォームへ誘導し、ワークロードがメインフレームのようなインフラで拡大しないようにしつつ、レガシーな技術システムを段階的に廃止していくことが、潜在的な課題となる。
利用モデルの多様化は複雑さをもたらすが、多くの場合、以下の方法で対処される2。
これらのソリューションの中で、多様な利用パターンをサポートするための制御、ツール、管理計画を再考するエンジニアリング主導のアプローチを推進しているものもある。デロイトは、多くのクライアントとの経験を通じて、クラウド、エッジ、オンプレミスを組み合わせたハイブリッドモデルが、レジリエントなAI技術基盤を構築するためには有効であると考えている(これは、特定の顧客事例にとどまらず、ハイブリッドクラウドインフラの提供実績に基づく見解である)
AI需要が成長・拡大するにつれ、企業がワークロードをクラウドから移行する意思決定を促す要因はいくつかあるようだが、我々の調査で特定された最大の動機はコストである。ビジネスリーダーの大多数(55%)は、データホスティングとコンピューティングのコストが一定の閾値に達したら、段階的にワークロードをクラウドから移行する予定であると回答している。別の17%は、クラウドから移行する主な理由としてレイテンシーやセキュリティの要件を挙げている(図2)。
しかし、回答者の約3分の1(27%)は、たとえコストが高くてもクラウドに留まる予定である。AIワークロードが将来、脱クラウドを検討するほどの規模まで拡大することに懐疑的な企業もある。しかし、そのような視点では、コストの全体像を見誤る恐れがある。企業は、データストレージとコンピューティングのコスト(通常はGPUと中央処理装置(Central Processing Unit:以下「CPU」)で測定される)に加えて、モデル利用のコストと、推論から生じるコスト増も考慮すべきである。これは通常、AIトークンを使用して測定される4。
企業がAI活用の知見を深め、モデルが進化するにつれて、コストの力学を正しく理解する必要性を認識し始めているビジネスリーダーもいる。それは、単一のクラウドコストだけでなく、データとモデルのライフサイクル全体、すなわちハイブリッドインフラ全体にわたるデータホスティング、ネットワーキング、推論、そしてHPCのためのレイテンシーといったあらゆるコストを統合的に把握するという、より財務的な視点である。ソリューションが高度化するにつれて、これらの各要素に新たな選択肢が出現し、市場環境は急速に変化していく。このような状況下において、ビジネスリーダーには、将来の柔軟性を確保するための俊敏な意思決定が求められる。
AIインフラの構築、運用、実行のライフサイクル全体を通じて、技術のレジリエンスには以下の要素が関わる。
技術のレジリエンスとは、予期される変化と突発的な障害の双方に対応し、システムを継続的に稼働させる能力を指す。それは事業継続性という観点だけでなく、将来のインフラ変更を見越した事前の計画立案を行うことも重要だ。
AIによって、一部の企業ではこのインフラ課題がさらに深刻化している。AIシステムは単体で動くのではなく、複雑なデジタル環境に組み込まれて稼働するため、企業内でのAIの役割が大きくなるにつれて、そのスピードや負荷に追随できるインフラの必要性も高まる。
ビジネスリーダーが、ハイブリッドクラウド機械学習の俊敏性を強化するために講じることができる対策はいくつかある。そのためには、以下を検討することが推奨される。
AIインフラ全体の総所有コスト(Total Cost of Ownership:以下「TCO」)の計算には多くの経済的考慮事項(例:CPU、GPU、ネットワーキング、AIトークンコストなど)が含まれるべきである。我々の調査では、クラウドコンピューティングのコスト高を懸念する企業に対し、どの時点でクラウドからのワークロード移行と自社でのGPUラック導入を検討するかを尋ねた(図3)。
回答者の多く(30%)は、クラウドコストが代替案の1.5倍に達するまで移行を検討しないと述べている。これは、オンプレミスのGPUラックを導入すれば初日から50%のコスト削減が見込める、という明確な状況になるまで待つことを意味する。言い換えれば、彼らは確実なROIが見込めない限り、行動を起こさないということだ。しかし、この判断基準はAI技術スタック全体のTCOを構成する多様な要素の一つに過ぎず、これだけで判断することには懸念が残る6。
クラウドソリューションを利用すれば、企業はサブスクリプションモデルでオンデマンドアクセスが可能となり、初期投資のリスクを抑えつつ、需要の変動に合わせて迅速に規模を拡張できる。これには、AI、機械学習、HPC、可視化タスク向けの専用GPUといった最新ハードウェアへのアクセスも含まれる。また、クラウドソリューションにより、開発、テスト、学習用にGPUクラスタを迅速に構築することが可能で、実験的な取り組みを素早く行うこともできる。
しかし、ある段階に至ると、このアプローチにはコストが伴う。リスク回避的な企業は、設備投資を避け、低い事業費用での実験モデルを維持するために、パイロット推論にクラウドを利用することがある。しかし、こうした企業は、必要以上に高いクラウド費用を払い続けることになり、AIを競争力の中核とするための高性能インフラへの投資機会を逃している可能性がある。
我々の調査は、一部の企業がGPU指標に基づいて早期に行動を起こしている一方で、他の企業は総所有コストを考慮に入れる準備がより整っていることを示唆している。回答者の24%は、コストが代替案の相対コストの25%から50%に達した時点でクラウドから移行する予定だと述べている。
調査対象となったほとんどの企業にとってコストが最大の動機であることを踏まえると、ビジネスリーダーはいくつかの重要なアクションに目を向けるべきだろう。
企業が自社の技術インフラ全体の需要増加に対応する中、データセンターオペレーターもその課題を認識している。我々の調査によれば、回答者がコンピューティング需要の増大に関して最も懸念している2つの事項は、電力と送電網の容量制約(70%)、およびサイバーまたは物理的セキュリティ(63%)である8。
コンピューティングをめぐる状況が変化するにつれて、回答者の78%は、技術革新も解決の鍵になるとの見方を示している。
これらの需要と供給の力学を管理するために、企業はGPUをどのように消費するかを見直す必要がある。その方向性を決める重要な要因がいくつか挙げられる。
CPU/GPUの使用量管理や小型モデルの利用といったアプローチは有効であるが、それだけでは限定的な効果しか得られない場合もある。最終的に、企業は自社の将来を賭けた重大な問いに向き合わなければならない。すなわち、クラウド中心のアプローチに留まり、そこで求められるレジリエンスを追求し続けるのか。それとも、コンピューティングと推論双方のニーズを満たすべく、新たな代替案へ投資し、自社のデータとインフラの主導権を取り戻すべきなのか、というという問いである。
AIワークロードを拡張していく企業にとって、イノベーションとリスク管理のバランスを取ることは不可欠である。長期的な成功の鍵を握るのは、ワークロードの完全な可視化、高品質なデータ、そして堅牢なセキュリティ体制という3つの要素だ。これらの能力の構築を優先するビジネスリーダーは、コストのかさむ失敗を回避し、AIのポテンシャルを最大限に引き出す上で、他社よりも優位なポジションを確保できるだろう。
デロイト・エネルギー・産業調査センターは、米国のデータセンターおよび電力会社の課題、機会、戦略を特定し、そのインフラ開発をベンチマークするために、2025年4月に調査を実施した。調査の回答者120名には、データセンターのエグゼクティブ60名と電力会社のエグゼクティブ60名が含まれ、インフラ増設の課題、将来のエネルギー消費に対応するためのリソースミックス、労働力問題、AIワークロード計画、負荷増大の要因、投資の優先順位に関する質問が含まれた。統合調査センターは、60名のデータセンター回答者に焦点を当て、これらのビジネスリーダーがAIワークロードに基づいて今後12ヶ月でコンピューティング需要がどのように増減すると予測しているか、彼らにクラウドからのワークロード移行を促す要因には何があるか、そして特定のGPUあたりのコストの変曲点に基づく代替案への移行を検討する具体的なコスト分布を分析した。
水野 梨津子
執行役員
合同会社デロイト トーマツ
金山 慎介
シニアコンサルタント
合同会社デロイト トーマツ
藤原 マリ子
コンサルタント
合同会社デロイト トーマツ
※上記の社名・役職・内容等は、掲載日時点のものとなります。
本稿は、デロイト ネットワークが発行した原著を合同会社デロイト トーマツが翻訳・加筆し、発行したものである。和訳版と原著「AI workloads are surging. What does that mean for computing?」の原文(英語)に差異が発生した場合には、原文を優先する。
Chris Thomas
United States
Ganesh Seetharaman
United States
Diana Kearns-Manolatos
United States
1. Kieran Norton, Tim Li, Tim Davis, Emily Mossburg, Diana Kearns-Manolatos, Saurabh Bansode, Chris Thomas, and Alfons Buxó Ferrer, “How can tech leaders manage emerging generative AI risks today while keeping the future in mind?” Deloitte Insights, Feb. 20, 2025.
2. Chris Thomas, Akash Tayal, Duncan Stewart, Diana Kearns-Manolatos, and Iram Parveen, “Is your organization’s infrastructure ready for the new hybrid cloud?” Deloitte Insights, June 30, 2025.
3. Ben Stanton, Paul Lee, Alfons Buxo Ferrer, Gillian Crossan, and Kevin Westcott, “Keeping it local: Cloud sovereignty a major focus of the future,” Deloitte Insights, Nov. 29, 2023.
4. David Linthicum, “Navigating the rising costs of AI inferencing,” InfoWorld, June 17, 2025.
5. Sebastian Moss, “Nvidia’s networking vision for training and inference,” Data Center Dynamics, May 13, 2025.
6. Dave Salvator, “Explaining tokens — the language and currency of AI,” NVIDIA blog, March 17, 2025.
7. Thomas, Tayal, Stewart, Kearns-Manolatos, and Parveen, “Is your organization’s infrastructure ready for the new hybrid cloud?”
8. Deloitte Center for Integrated Research analysis of survey responses from 60 data center leaders collected between March and April 2025 through a survey by the Deloitte Research Center for Energy & Industrials.
本レポートの執筆にあたり、有益な知見をご提供頂いた、Nikhil Roychowdhury、Brenna Snidermanの両氏に感謝いたします。
また、コアリサーチチームのメンバーとして貢献いただいた以下の皆様にも心より感謝の意を表します。
Duncan Stewart、Ahmed Alibage、Akash Chaterji Carolyn Amon、 David Levin、Kate Hardin、Saurabh Bansode。
加えて、制作およびマーケティングのサポートにご尽力頂いた以下の皆様にも、深く感謝申し上げます。
Corrie Commisso、Edith Martinez、Ireen Jose、Lisa Beauchamp、Negina Rood、Nicole Bostock、Prodyut Ranjan Borah、Saurabh Rijhwani。
カバーイメージ:Natalie Pfaff