生成AIがビジネスにどのような影響を与えるかを理解するためには、それが何であり、何ができるのか、そしてまだできないことは何かを理解する必要があります。
生成AIは、テキスト、コード、音声、画像、動画、作業手順書や業務プロセス設計書、さらにはタンパク質の3D構造等の形式で、機械が新しいコンテンツを作成するというAIの一分野です。いくつかの種類の生成AI技術がこの10年間で確立されてきましたが、容易にアクセスできるチャットインターフェースを用いた大規模言語モデル(LLM)が生成AIのブレークスルーをもたらしました。
通常、従来のAIモデルが構築される際、学習と呼ばれる工程でアルゴリズムに大量の入力/出力のサンプル(学習データ)を投入し、入力データからパターンを抽出し、期待される出力に関する結論を導き出します。
例えば、Eメールのスパムフィルターは、これらのパターンを使用してスパムメールに見られる特徴との類似性を特定し、スパムフォルダにメールを振り分けます。
AIモデルの高度化とともに、入力データは単純な数値の配列から高解像度の写真に至るまでその複雑さが増してきましたが、モデルの出力側は「スパム」か「スパムではない」、「猫」や「犬」、「予測価格 $17,000」といったカテゴリーや数値にほとんど限定されていました。そのため、AIアプリケーションは単一の目的のためのタスクしか実行できませんでした。
しかし、生成AIは状況を一変させました。生成AIにおいては、ユーザーの入力内容に応じて、画像や新たに書かれたテキストなど自由度と可変性が高いアウトプットが「生成」されるようになりました。このアウトプットは、考えられる正解がいつも一つ以上存在するという新たな興味深い結果をもたらしました。
生成AIで用いるモデルは通常大規模であり、リソースを多く消費します。これらのモデルは多機能であり、特定のタスクに合わせて調整が可能なため、基盤モデル(Foundation Models)と呼ばれています。(大規模言語モデルは基盤モデルの一種です。)