メインコンテンツに移動する

急増するAIワークロード。それはコンピューティングにとって何を意味するのか?

デロイトの分析が、AIコンピューティング需要の今後の成長予測と、ビジネスリーダーが俊敏性を維持するための方策を読み解く

日本語版発行に寄せて

生成AIの登場から数年が経過し、多くの企業にとってその活用は概念実証(PoC)の段階を終え、事業変革の中核を担う本格導入のフェーズへと移行しつつあります。この大きな潮流は、AIの能力に注目が集まる一方で、これまで経営の中心的な議題とはなりにくかった「AIを安定稼働させるためのインフラ構築」という課題を、避けて通れない現実として突き付けています。本レポートは、まさにこの喫緊の経営課題に対し、グローバルなコンピューティング市場動向を提示するものです。AIの活用はクラウドをはじめとするあらゆるプラットフォームのコンピューティング需要を押し上げています。特に、生成AIの本格活用に伴う学習・推論ワークロードの急増は、クラウドコストの想定外の増加をもたらし、経営に影響を与え始めています。デロイトの調査では、実に55%の企業がコストを主たる動機としてクラウドからのワークロード移行を検討しています。

AIコストを見極めるには、GPUやCPUの利用料だけでは全体像を捉えることが出来ません。AI活用の総所有コスト(TCO)は、モデル利用量に応じた「AIトークン」のコストや、大量のデータ転送に伴うネットワークコストなど、より複雑な要素で構成されているからです。

これからのAIインフラ戦略は、単なるIT部門のコスト最適化活動ではなく、イノベーションとリスク管理のバランスを取る「経営戦略」として捉え直すべきだと我々は考えています。その核心となるのが、本レポートでも提示されている「データの重心(data gravity)」という概念です。企業の最も価値ある資産であるデータをどこに配置し、その周辺でいかに効率的にAIワークロードを処理させるか。この戦略的決定が、今後のAI活用の俊敏性、パフォーマンス、そしてコスト効率のすべてを規定すると言っても過言ではありません。

本レポートは、こうした複雑な意思決定を行うための具体的な羅針盤を提供します。

AIのポテンシャルを真に引き出すには、優れたAIアプリケーションという「知能」と、それを支える強靭かつ経済的なインフラ基盤という「心臓部」の両輪が不可欠です。

今後、日本国内でも急増が見込まれるAIファクトリーやデータセンターは、データ・電力・冷却・ネットワーク・セキュリティ・運用を垂直統合したAI専用の生産設備として、知能を継続的に生み出す拠点となります。自社の競争力の中核として内製するモデル、外販や共同運営モデルなど、資本効率とリスク許容度に応じた選択肢が広がります。

産業設備の観点では、既存データセンターのAIレディ化(液冷・配電・高帯域ネットワーク)やマイクロAIファクトリーの新設、工場・物流など現場近接の環境整備が進み、高圧受変電、液冷ソリューション、データセンターインフラ管理(DCIM)・監視、保守運用まで幅広い領域で継続的な投資需要が生まれることが見込まれます。また、系統接続の制約や電力単価、脱炭素要請に応えるため、再エネPPAや蓄電池によるピークカット、排熱の地域還元といったエネルギー統合の知見が鍵となります。用地・電源・人材の制約を踏まえ、自治体・産業クラスターと連携した人材育成・地域共創を図ることで、日本発のAIファクトリーやデータセンタービジネスを持続的に育てていくことが肝要となります。

本レポートが、AI時代の競争優位を築こうとする日本の企業にとって、自社のインフラ戦略を再定義し、未来への一歩を踏み出す一助となることを、心より期待しています。

合同会社デロイト トーマツ
執行役員
水野 梨津子

 

企業が人工知能(Artificial Intelligence:以下「AI」)の能力強化を加速させ続ける中、変動するコンピューティング需要に対応するため、データセンター戦略は急速に進化している。デロイトの調査(詳細は過去の記事“Is your organization’s infrastructure ready for the new hybrid cloud?”で解説)によると、企業はコスト、レイテンシー、ハードウェアの要件といった要因に基づき、さまざまなインフラアプローチを検討している。それらは、メインフレームからの脱却、新たなハイブリッドクラウド戦略の策定、AIファクトリーという新たな市場の確立まで、多岐にわたる。特に、AIファクトリーは、標準的な推論から高性能コンピューティングまで、極めて大規模なタスクを処理できる1

しかし、多くのビジネスリーダーは、AI時代に対応できるレジリエントな事業と技術インフラを構築する上で、多くの難題に直面するだろう。AIシステムは、大量の高品質なデータと、多くの相互依存するコンポーネントから成る複雑な分散アーキテクチャに依存している。特に、攻撃対象領域が拡大し、低レイテンシーの応答が求められる状況では、正確な予測と効果的な耐障害性を実現するために、データの可用性や整合性、リアルタイムでの障害検知、堅牢なランタイムセキュリティ、そして迅速な復旧を確保することが重要である。

オンプレミス、クラウド、その他のハイパフォーマンスコンピューティング(High-Performance Computing:以下「HPC」)ソリューションの間で、いかに適切なバランスを取るべきか。AIワークロードが、オーケストレーション層を横断する同期的・非同期的な連携に対応できるよう拡張していく中で、技術インフラにはどの程度の適応性が求められるのか。AIの利用と活用のパターンは依然として大部分が未知の領域であるため、企業(および事業者)は需要の予測や確信を持った計画立案に苦慮している。

デロイトは、メインフレーム、クラウド、企業内オンプレミス、エッジコンピューティング、そして新興技術といった各種インフラの変化予測を把握するための調査を過去に実施した。(2025年3月~4月)調査対象は、データセンタープロバイダー、エネルギー供給事業者、販売事業者など120の市場事業者とした(調査手法参照)。本分析では、AIワークロードがもたらすコンピューティング需要予測の変化、異なるインフラ間でワークロードを移行する際の意思決定に影響を与える主要因、そして、進化するHPCのニーズに対応するためのコンピューティングインフラ拡張という課題にビジネスリーダーが講じている措置を考察する。

AIは、あらゆる技術インフラにおいて、コンピューティング需要を押し上げるだろう

我々の調査では、ビジネスリーダーたちに対し、今後12ヶ月およびそれ以降に、各技術インフラ上でコンピューティングワークロードがどのように変化するかを尋ねた(図1)。

今後12ヶ月およびそれ以降に、各技術インフラ上でコンピューティングワークロードがどのように変化するかを尋ねた結果、ワークロードが20%以上増加することが見込まれていることがわかった。

データからは明確な傾向が見て取れる。ビジネスリーダーたちは、多様な処理能力が求められるAI主導のワークロードが、幅広いプラットフォームでコンピューティング需要を増加させると予測している。調査対象となったすべての技術インフラにおいて、今後12カ月でワークロードが20%以上増加すると見込まれている。AIワークロードには、事前学習モデルの作成、強化学習や「思考の連鎖(Chain-of-Thought:CoT)」「推論(Reasoning)」といった学習後の技術によるモデル改善、そして特にエージェントAIのようなAIを大規模に展開する際の推論タスクでのモデル利用が含まれる。

短期的に最も急増が見込まれるのは、新興AIクラウドプロバイダー(87%)とエッジコンピューティングプラットフォーム(78%)であるとされ、その成長ペースはオンプレミスのデータセンターと比べて、それぞれ約10倍、6倍に達するとみられている。パブリッククラウドとプライベートクラウドも、ともに顕著な増加が見込まれており、メインフレームとオンプレミスのデータセンターのワークロードも来年には増加すると予測されている。一方で、ビジネスリーダーたちは他のインフラでキャパシティを増強したり、既存の非AI向けオンプレミスソリューションをAIに最適化された構成に変更したりすることで、これらのインフラへの依存度を減らしているようだ。回答者の3分の1は、今後12カ月でメインフレームとオンプレミスのワークロードを減少または大幅に減少させる予定であると述べている。

この動きは、デロイトが別途論じているメインフレームの廃止の潮流と一致する可能性がある。しかし、従来のデータセンターに目を向けると、企業はコンピューティング需要の増加に対処するために複数のアプローチを取っていることが我々の調査で明らかになっている。それらのアプローチには、既存のデータセンターの再構成、廃止されたデータセンターの再稼働、ハイパースケーラー・ニッチなプロバイダー・新規参入者とのAIインフラの再構想、そしてGPU・AIトークンの活用状況評価に基づく新規ソリューションへの投資などが挙げられる。

では、こうしたコンピューティング需要の変化は、ビジネスリーダーにとって何を意味するのだろうか。インフラ責任者は、よりスマートかつレジリエントで、効率的な環境を構築できるようにする必要がある。同時に、多くの企業が既に感じているだろう混乱を乗り切るためには、セキュリティ、ガバナンス、人材管理に対する新たなアプローチも求められる。AIの拡張によるワークロードの増加が予測される中、その増加分を適切なプラットフォームへ誘導し、ワークロードがメインフレームのようなインフラで拡大しないようにしつつ、レガシーな技術システムを段階的に廃止していくことが、潜在的な課題となる。

利用モデルの多様化は複雑さをもたらすが、多くの場合、以下の方法で対処される2

  • 複数の(特にハイブリッド)クラウド環境でシームレスに動作するソリューションを設計する。この時、多くの場合で大規模な再設計が必要となる。
  • すべてのクラウドにわたり、障害をリアルタイムで検知・対応できるよう、一元的に可視化する。
  • クラウドプラットフォーム間で信頼性が高く高速な接続性を確保する。
  • 複数のプロバイダー間でセキュリティ管理とインシデント対応プロセスを統一させる。
  • 異なるインフラ環境間での安全かつ効率的なデータポータビリティを実現する。

これらのソリューションの中で、多様な利用パターンをサポートするための制御、ツール、管理計画を再考するエンジニアリング主導のアプローチを推進しているものもある。デロイトは、多くのクライアントとの経験を通じて、クラウド、エッジ、オンプレミスを組み合わせたハイブリッドモデルが、レジリエントなAI技術基盤を構築するためには有効であると考えている(これは、特定の顧客事例にとどまらず、ハイブリッドクラウドインフラの提供実績に基づく見解である)

  • まず試用し、購入は後回しに:企業は、共有プール型のスポット価格で提供されるクラウドベースGPUを使用して生成AIコパイロットを稼働させることができる。これにより、一貫した高い利用率を証明できるまで大規模なハードウェア投資を先送りし、初期投資を削減して、より迅速なテストを実現することができる。
  • 選択的マルチクラウド:企業が複数のパブリックまたはプライベートクラウドプロバイダーを利用する共通基盤の上に構築されるもので、AIモデルを複数のクラウドプロバイダーに展開する。最も重要なリアルタイムのAI対応モデルはクラウド間で展開しつつ、機密データと推論は単一のプラットフォーム上のオンプレミスに保持することができる。この方法では、AIのマルチクラウドワークロードを制限することでコスト管理をしている。
  • ハイブリッド・クラウドエッジ:デロイトでは、自動運転車、ヘルスケア、製造業といったセクターにおいて特徴的な動向の把握に努めている。これらの企業ではAIモデルの学習や更新のためにクラウドへ接続し続ける一方で、アプリケーションとモデル本体は分離し、高度なAIプロセッサーを備えたローカル環境で実行する傾向にある。これにより、企業はアプリケーションのパフォーマンスを落とすことなく、迅速な対応や柔軟なアップデートを両立している。
  • 垂直統合型のエアギャップ・ソリューション:金融サービスやライフサイエンスのような規制の厳しいセクターでは、エアギャップ構成のオンプレミスソリューション(インターネットのような安全でないネットワークから物理的または論理的に隔離されたシステムやネットワーク)を利用することで、クローズドループのAI開発・展開を安全に行うことが可能となる。これは、厳格なデータプライバシーとセキュリティ要件を持ち、プライベートクラウドの形態を重視する企業の間で支持を集めているアプローチであり、増大するソブリンAIの要件に対処するためにも利用される3

コストはクラウド代替策を検討する主な動機となるが、すべての企業に当てはまるわけではない

AI需要が成長・拡大するにつれ、企業がワークロードをクラウドから移行する意思決定を促す要因はいくつかあるようだが、我々の調査で特定された最大の動機はコストである。ビジネスリーダーの大多数(55%)は、データホスティングとコンピューティングのコストが一定の閾値に達したら、段階的にワークロードをクラウドから移行する予定であると回答している。別の17%は、クラウドから移行する主な理由としてレイテンシーやセキュリティの要件を挙げている(図2)。

AIワークロードをクラウドから移行する予定があるかを尋ねた結果、回答者の27%は、たとえコストが高くてもクラウドに留まる予定であると述べている。

しかし、回答者の約3分の1(27%)は、たとえコストが高くてもクラウドに留まる予定である。AIワークロードが将来、脱クラウドを検討するほどの規模まで拡大することに懐疑的な企業もある。しかし、そのような視点では、コストの全体像を見誤る恐れがある。企業は、データストレージとコンピューティングのコスト(通常はGPUと中央処理装置(Central Processing Unit:以下「CPU」)で測定される)に加えて、モデル利用のコストと、推論から生じるコスト増も考慮すべきである。これは通常、AIトークンを使用して測定される4

企業がAI活用の知見を深め、モデルが進化するにつれて、コストの力学を正しく理解する必要性を認識し始めているビジネスリーダーもいる。それは、単一のクラウドコストだけでなく、データとモデルのライフサイクル全体、すなわちハイブリッドインフラ全体にわたるデータホスティング、ネットワーキング、推論、そしてHPCのためのレイテンシーといったあらゆるコストを統合的に把握するという、より財務的な視点である。ソリューションが高度化するにつれて、これらの各要素に新たな選択肢が出現し、市場環境は急速に変化していく。このような状況下において、ビジネスリーダーには、将来の柔軟性を確保するための俊敏な意思決定が求められる。

AIインフラの構築、運用、実行のライフサイクル全体を通じて、技術のレジリエンスには以下の要素が関わる。

  • モジュール設計:コンポーネントを組み合わせ可能にすることで、障害の影響範囲を限定し、迅速な復旧や交換を実現する。
  • 堅牢なバージョン管理:開発や学習の過程で発生しうるデータ損失を防ぐ。
  • 継続的な監視:ハードウェアからデータパイプラインまでシステム全体を常時監視し、健全性のチェックと異常の兆候検知を自動で行う。
  • プロアクティブなセキュリティ:進化し続けるサイバーリスクに対し、リアルタイムの脅威検知と迅速なインシデント対応で先手を打ち、システムを保護する。
  • 動的な拡張性:予期せぬ需要の急増やワークロードの変化に対応するために、リソースをシームレスかつ自動的に拡張する。
  • レイテンシーとパフォーマンスの監視:スループットとコンピューティング速度を常に追跡し、レイテンシー要件が満たされていることを保証する。
  • ファイナンシャルオペレーショントランスフォーメーション:クラウドの機械学習特有のデータコールやモデル利用の増加を組み込むためにクラウドファイナンシャルオペレーションを再構築する。

技術のレジリエンスとは、予期される変化と突発的な障害の双方に対応し、システムを継続的に稼働させる能力を指す。それは事業継続性という観点だけでなく、将来のインフラ変更を見越した事前の計画立案を行うことも重要だ。

AIによって、一部の企業ではこのインフラ課題がさらに深刻化している。AIシステムは単体で動くのではなく、複雑なデジタル環境に組み込まれて稼働するため、企業内でのAIの役割が大きくなるにつれて、そのスピードや負荷に追随できるインフラの必要性も高まる。

ビジネスリーダーが、ハイブリッドクラウド機械学習の俊敏性を強化するために講じることができる対策はいくつかある。そのためには、以下を検討することが推奨される。

  • 企業の「データの重心(data gravity)」をどこに定めるかを決定する:AIの活用が拡大するにつれ、データの置き場所(安全性、アクセス性、性能をいかに確保するか)は、極めて重要な経営判断となる。なぜなら、最も頻繁にアクセスされるデータが存在する場所が、重力のようにアプリケーションやAIエージェントを引き寄せ、事実上のシステムの中心となるからだ。推論がどこで実行されるかにかかわらず、この原則は変わらない。データが複数の場所に散在すれば、たとえアプリケーションがそれらを連携させることができたとしても、システムの複雑化とコスト増大は避けられない。したがって、ビジネスリーダーは、「データの重心」をどこに再構築するのか、を戦略的に見極める必要がある。パブリッククラウドやプライベートクラウドにある既存データのうち、何を残し、何を追加し、何を移行させるのか。プライバシー、レイテンシー、ワークフロー、そしてソブリンティ(データ主権)といった要件を基に、データをプライベートクラウド、従来型のオンプレミス、あるいは専用のプライベートAIインフラに集約すべきかを判断しなければならない。さらに、接続性、相互運用性、レイテンシーといった要件から、パブリッククラウドのようなオープンなソリューションが必要になる場合がある点も、考慮する必要がある。
  • モデルの配置・移動を前提とした、相互運用性の高いネットワークを設計する:将来のニーズに適応できる強靭なハイブリッドインフラを構築する上での成功の鍵は、設計の初期段階から相互運用性を組み込んでおくことである。かつて、モデルの「学習」と本番環境での「推論」は、必要とされるネットワーク帯域や処理能力が全く異なると考えられていた。しかし、その常識は覆されつつある。現在の大規模AIアプリケーションでは、多数のユーザーに対して高いパフォーマンスを維持するために、推論の段階においても、学習時と同レベルの綿密なネットワーク戦略が不可欠であることが明らかになってきたのだ5

    具体的なアプローチは1つではない。例えば、学習と推論の両方を自社で賄うため、オンプレミスのGPUファームを構築する方法もあれば、オンプレミス環境を一切持たずにアプリケーション・プログラミング・インターフェース(Application Programming Interface:以下「API」)ベースのモデルを利用する方法もある。さらには、オンプレミスでファインチューニングが可能なオープンソースの大規模言語モデル(LLM)をプライベートクラスタで活用するといったハイブリッドな構成も考えられる。重要なのは、特定の方法論に固執せず、状況に応じた選択肢を持つことである。

    インフラを設計する上で重要なのは、適切なセキュリティとアクセス制御を担保しつつ、状況に応じてモデルやワークロードを柔軟に再配置できる構造にしておくことだ。そして、要件が明確化された段階で初めて、大規模クラスタのような専用ハードウェアへの投資を検討するのである。このように、最初からすべてを決め打ちせず、クラウドと他の選択肢を組み合わせながら段階的に最適化していくアプローチこそが、AIワークロードに求められる俊敏性、コスト効率、そしてガバナンスを実現する鍵となる。

クラウドに留まる企業たち―しかし、それは賢明な判断とは限らない

AIインフラ全体の総所有コスト(Total Cost of Ownership:以下「TCO」)の計算には多くの経済的考慮事項(例:CPU、GPU、ネットワーキング、AIトークンコストなど)が含まれるべきである。我々の調査では、クラウドコンピューティングのコスト高を懸念する企業に対し、どの時点でクラウドからのワークロード移行と自社でのGPUラック導入を検討するかを尋ねた(図3)。

クラウドからのワークロード移行と自社でのGPUラック導入を検討するかを尋ねた結果、回答者の30%は、クラウドコストが代替案の1.5倍に達するまで移行を検討しないと述べている。

回答者の多く(30%)は、クラウドコストが代替案の1.5倍に達するまで移行を検討しないと述べている。これは、オンプレミスのGPUラックを導入すれば初日から50%のコスト削減が見込める、という明確な状況になるまで待つことを意味する。言い換えれば、彼らは確実なROIが見込めない限り、行動を起こさないということだ。しかし、この判断基準はAI技術スタック全体のTCOを構成する多様な要素の一つに過ぎず、これだけで判断することには懸念が残る6

クラウドソリューションを利用すれば、企業はサブスクリプションモデルでオンデマンドアクセスが可能となり、初期投資のリスクを抑えつつ、需要の変動に合わせて迅速に規模を拡張できる。これには、AI、機械学習、HPC、可視化タスク向けの専用GPUといった最新ハードウェアへのアクセスも含まれる。また、クラウドソリューションにより、開発、テスト、学習用にGPUクラスタを迅速に構築することが可能で、実験的な取り組みを素早く行うこともできる。

しかし、ある段階に至ると、このアプローチにはコストが伴う。リスク回避的な企業は、設備投資を避け、低い事業費用での実験モデルを維持するために、パイロット推論にクラウドを利用することがある。しかし、こうした企業は、必要以上に高いクラウド費用を払い続けることになり、AIを競争力の中核とするための高性能インフラへの投資機会を逃している可能性がある。

我々の調査は、一部の企業がGPU指標に基づいて早期に行動を起こしている一方で、他の企業は総所有コストを考慮に入れる準備がより整っていることを示唆している。回答者の24%は、コストが代替案の相対コストの25%から50%に達した時点でクラウドから移行する予定だと述べている。

調査対象となったほとんどの企業にとってコストが最大の動機であることを踏まえると、ビジネスリーダーはいくつかの重要なアクションに目を向けるべきだろう。

  • インフラ全体のコスト状況を一元的に可視化する:多くの企業ではインフラがサイロ化しており、データホスティング、コンピューティング、推論、APIコールといったコストの全体像を把握することが困難になっている。企業のアーキテクチャとAIビジョンに基づき、将来のコスト増を予測し、状況を包括的に可視化することは、より戦略的な技術投資判断のために不可欠である。例えばデロイトは、ある金融企業のインフラ・運用部門責任者を支援し、ダッシュボードによる可視化を通じて、この課題に取り組んだ。各事業部門と連携して、ワークロードの活用状況からアプリケーションアーキテクチャに至るまでを詳細にマッピングすることで、将来の事業判断の指針となる全社的なコンピューティング状況の可視化を実現した。
  • 新たな推論コストの構造を考慮に入れる:CPU/GPU使用量に加え、AIトークンの使用量最適化による推論コストの管理も重要である。AIトークンは、データをトークンに分解するもので、これが大規模なAIモデルやアプリケーションの通貨として機能する。財務オペレーションチームとインフラ戦略チームは、コンピューティングと推論の利用指標を統合することで、AI投資のTCOをより深く理解できる。

    企業は、その規模やニーズに応じて、AIインフラに異なるアプローチを取る必要がある。極端なアプローチとしてAPIのみを利用するという考えがある。これは直接的な設備投資なしで高性能コンピューティングインフラにアクセスできる手軽さが魅力だが、ビジネスリーダーは依然としてモデルの利用コスト(APIコールごとの課金など)を考慮する必要がある。一方、より現実的なアプローチは、特定の単一技術に依存するのではなく、複数の要素を組み合わせたハイブリッドAIインフラへ投資することである。従来のオンプレミス、パブリック/プライベートクラウド、エッジ、さらにはネオクラウドや自社で所有・運用する専用AIクラスタまで、様々な選択肢を戦略的に統合していく。どのような構成が最適かは、企業が現在保有するインフラと、将来求められる要件によって千差万別となる。

    最も先端的なアプローチの1つとして、一部の大規模な企業では、AIワークロードの処理に最適化されたデータセンターである、独自のAIファクトリーを構築している。これらはより大きな初期投資を必要とするが、専用設計のハードウェアとモデルはライフタイムコストを低減し、新たな収益源を開拓することさえある7。例えば、2024年には十数カ国、15社のグローバル通信企業が新たにAIファクトリーを稼働させており、追随する企業もさらに増えているとデロイトのテクノロジー・メディア・テレコミュニケーションセンターは報告している。企業がAIを実験している段階か、大規模に運用している段階かに関わらず、インフラの意思決定はワークロードとパフォーマンスのニーズに合致させるべきである。

技術革新が、その答えとなるかもしれない

企業が自社の技術インフラ全体の需要増加に対応する中、データセンターオペレーターもその課題を認識している。我々の調査によれば、回答者がコンピューティング需要の増大に関して最も懸念している2つの事項は、電力と送電網の容量制約(70%)、およびサイバーまたは物理的セキュリティ(63%)である8

コンピューティングをめぐる状況が変化するにつれて、回答者の78%は、技術革新も解決の鍵になるとの見方を示している。

これらの需要と供給の力学を管理するために、企業はGPUをどのように消費するかを見直す必要がある。その方向性を決める重要な要因がいくつか挙げられる。

  • データ主権への要求の高まり:データレジデンシー(データ保管場所の指定)やプライバシー関連法の進化により、機密データを特定の地理的範囲内に留めることが求められ、企業はオンプレミスまたはハイブリッドモデルへと向かう可能性がある。
  • オンプレミスGPUの経済性向上:GPUハードウェアコストの低下に加え、仮想化や共有による利用率を向上させることで、オンプレミスでの導入がより魅力的となる。
  • 推論ワークロードの分散化:AI推論の利用拡大においては、必ずしも学習のようにGPUクラスタを集中させる必要はなく、複数の拠点に分散した小規模なGPUサーバーでも処理可能である。これらのサーバーは小さいため、大規模なGPUクラスタが必要とする液体冷却、特殊な電源設備、あるいは床の耐荷重強化といった大規模なアップグレードなしに、既存のデータセンターに収容できる。
  • 新たなセキュリティ脅威の発生:新たな脅威や侵害の発生は、企業に機密ワークロードの使用制限や方針変更を促す可能性がある。
  • IT専門人材の不足:熟練したIT人材の不足は、代替となる新たな導入モデルの採用を加速させる要因となりうる。
  • エッジコンピューティングの拡大:自動運転車やスマートシティといったエッジ側のニーズの増大は、データソースに近い場所でのGPU需要を高め、導入戦略の変更を促す可能性がある。
  • オーケストレーション技術の進化:ワークロードの可動性とオーケストレーションツールの進歩は、異なる環境間でのGPUワークロードの移動をより容易にする。

CPU/GPUの使用量管理や小型モデルの利用といったアプローチは有効であるが、それだけでは限定的な効果しか得られない場合もある。最終的に、企業は自社の将来を賭けた重大な問いに向き合わなければならない。すなわち、クラウド中心のアプローチに留まり、そこで求められるレジリエンスを追求し続けるのか。それとも、コンピューティングと推論双方のニーズを満たすべく、新たな代替案へ投資し、自社のデータとインフラの主導権を取り戻すべきなのか、というという問いである。

AIワークロードを拡張していく企業にとって、イノベーションとリスク管理のバランスを取ることは不可欠である。長期的な成功の鍵を握るのは、ワークロードの完全な可視化、高品質なデータ、そして堅牢なセキュリティ体制という3つの要素だ。これらの能力の構築を優先するビジネスリーダーは、コストのかさむ失敗を回避し、AIのポテンシャルを最大限に引き出す上で、他社よりも優位なポジションを確保できるだろう。

調査方法

デロイト・エネルギー・産業調査センターは、米国のデータセンターおよび電力会社の課題、機会、戦略を特定し、そのインフラ開発をベンチマークするために、2025年4月に調査を実施した。調査の回答者120名には、データセンターのエグゼクティブ60名と電力会社のエグゼクティブ60名が含まれ、インフラ増設の課題、将来のエネルギー消費に対応するためのリソースミックス、労働力問題、AIワークロード計画、負荷増大の要因、投資の優先順位に関する質問が含まれた。統合調査センターは、60名のデータセンター回答者に焦点を当て、これらのビジネスリーダーがAIワークロードに基づいて今後12ヶ月でコンピューティング需要がどのように増減すると予測しているか、彼らにクラウドからのワークロード移行を促す要因には何があるか、そして特定のGPUあたりのコストの変曲点に基づく代替案への移行を検討する具体的なコスト分布を分析した。

発行人

水野 梨津子
執行役員
合同会社デロイト トーマツ

金山 慎介
シニアコンサルタント
合同会社デロイト トーマツ

藤原 マリ子
コンサルタント
合同会社デロイト トーマツ

※上記の社名・役職・内容等は、掲載日時点のものとなります。

本稿は、デロイト ネットワークが発行した原著を合同会社デロイト トーマツが翻訳・加筆し、発行したものである。和訳版と原著「AI workloads are surging. What does that mean for computing?」の原文(英語)に差異が発生した場合には、原文を優先する。

執筆者

Chris Thomas
United States

Ganesh Seetharaman
United States

Diana Kearns-Manolatos
United States

文末脚注

1. Kieran Norton, Tim Li, Tim Davis, Emily Mossburg, Diana Kearns-Manolatos, Saurabh Bansode, Chris Thomas, and Alfons Buxó Ferrer, “How can tech leaders manage emerging generative AI risks today while keeping the future in mind?” Deloitte Insights, Feb. 20, 2025.

2. Chris Thomas, Akash Tayal, Duncan Stewart, Diana Kearns-Manolatos, and Iram Parveen, “Is your organization’s infrastructure ready for the new hybrid cloud?” Deloitte Insights, June 30, 2025.

3. Ben Stanton, Paul Lee, Alfons Buxo Ferrer, Gillian Crossan, and Kevin Westcott, “Keeping it local: Cloud sovereignty a major focus of the future,” Deloitte Insights, Nov. 29, 2023.

4. David Linthicum, “Navigating the rising costs of AI inferencing,” InfoWorld, June 17, 2025.

5. Sebastian Moss, “Nvidia’s networking vision for training and inference,” Data Center Dynamics, May 13, 2025.

6. Dave Salvator, “Explaining tokens — the language and currency of AI,” NVIDIA blog, March 17, 2025.

7. Thomas, Tayal, Stewart, Kearns-Manolatos, and Parveen, “Is your organization’s infrastructure ready for the new hybrid cloud?

8. Deloitte Center for Integrated Research analysis of survey responses from 60 data center leaders collected between March and April 2025 through a survey by the Deloitte Research Center for Energy & Industrials.

謝辞

本レポートの執筆にあたり、有益な知見をご提供頂いた、Nikhil RoychowdhuryBrenna Snidermanの両氏に感謝いたします。

また、コアリサーチチームのメンバーとして貢献いただいた以下の皆様にも心より感謝の意を表します。
Duncan StewartAhmed AlibageAkash Chaterji Carolyn AmonDavid LevinKate HardinSaurabh Bansode

加えて、制作およびマーケティングのサポートにご尽力頂いた以下の皆様にも、深く感謝申し上げます。
Corrie CommissoEdith MartinezIreen JoseLisa BeauchampNegina RoodNicole BostockProdyut Ranjan BorahSaurabh Rijhwani

カバーイメージ:Natalie Pfaff

このページはお役に立ちましたか?

ご協力ありがとうございました。