2024年になってChatGPT(チャットジーピーティ)が大きな話題となっていますが、AI(人工知能)の領域が格段に拡大しました。チャットGPTは詩や歌詞を書いたりできるだけでなく、学校の小論文を書くこともでき、ユーザーと高度な会話をすることさえできます。ChatGPTの登場によって未来における私たちの仕事やAIの役割などに関する議論が急速に深まっています。
チャットGPTの凄みはソフトウェアの発表後幅広い分野で応用されていることです。この記事ではChatGPTの統計について見ていき、AIモデルの使われ方や仕組みについて解説していきます。
ChatGPT 主要な統計データ
- ChatGPTは世界で16億人のユーザーがいる。チャットGPTは史上最速で利用されているオンラインサービスで、発表からたったの5日でユーザー数100万人を突破した。
- マイクロソフト社はChatGPTを所有するOpenAI(オープンAI)に130億ドル(約1兆8500億円)の巨額投資。マイクロソフトはチャットGPTを稼働させるのに必要なコンピュータのインフラストラクチャーを提供しており、OpenAIの49%を取得している。
- GPT-4がおよそ100兆個ものパラメーターを用いてテキストや画像を生成することができる。旧モデルのGPT-3のパラメーター数は1750億個だったことから革新的に向上したことがわかる。
- チャットGPTは3000億もの単語を学習できる大規模言語モデルを搭載している。インターネット上に存在するテキストデータの45TB(テラバイト)分に相当する。データは2021年9月までしか遡っていない。
- ChatGPTにアクセスした69.43%がダイレクト検索によるもの。ほとんどの人はソーシャルメディアや外部の口コミサイトでチャットGPTにアクセスしているのではなく、直接検索して公式ウェブサイトにアクセスしている。
ChatGPTのユーザー統計
ChatGPT(チャットジーピーティ)は2023年3月、16億人ものユーザーが存在
この数値はOpenAIのChatGPTポータルにアクセスしたウェブブラウザやモバイルのユーザーも含みます。Bing(マイクロソフトの提供するポータルサイト)のサーチエンジンやChatGPTと統合したソフトウェアからアクセスしたユーザーは含みません。
ChatGPTは史上最速のペースで成長しているオンラインサービス
チャットGPTは2022年12月のサービス開始からたったの5日で100万人ものユーザーを獲得し、3ヶ月のうちにユーザー数10億人を突破しました。これまで急速に成長したソフトウェアの代表格としてインスタグラムがありましたが、インスタグラムでさえも100万人のユーザーを獲得するのに2ヶ月半かかっています。
年月 | 毎月のアクティブユーザー数 |
2022年12月 | 2億6600万人 |
2023年1月 | 6億1600万人 |
2023年2月 | 10億人 |
2023年3月 | 16億人 |
2023年1月に行われたYouGovのアンケートデータによると、12%のアメリカ人がチャットGPTを使ってテキスト生成をしたことがあると回答。
また、アンケートの38%の回答者がChatGPTを自分では使ったことはないが他人が使っているのを見たことがあると答えています。また、18歳から29歳の回答者の15%と30歳から44歳までの回答者の17%がチャットGPTを利用したことがあります。65歳以上の回答者で利用したことがあるのは5%のみでした。
18〜29歳 | 30〜44歳 | 45〜64歳 | 65歳以上 | |
実際にテキスト生成をしたことがある | 15% | 17% | 9% | 5% |
自分ではないが他者がするのを見たことがある | 48% | 46% | 27% | 30% |
利用したことも見たこともない | 20% | 31% | 55% | 59% |
不明 | 17% | 6% | 8% | 6% |
20%の人々がChatGPTで情報の検索をしたことがある
- 19%の利用者がソーシャルメディアの投稿などのコンテンツ生成のために利用
- 14%の利用者がチャットGPTを試してみるために使ったことがある
- 11%の利用者が学術的目的で使ったことがある
- 11%の利用者がおすすめされて使ったことがある
- 10%の利用者がコーディングのために使ったことがある
ChatGPTは185以上の国で利用できる
チャットGPTが使えない国は以下の通り
- 中国
- ロシア
- ベラルーシ
- 北朝鮮
- イラン
- アフガニスタン
- ベネズエラ
ChatGPTのウェブサイトには世界中からトラフィックがある。
- 米国:14.84%
- インド:6.23%
- 日本:3.63%
- コロンビア:3.19%
- カナダ:2.94%
- その他:69.18%
ChatGPTは95以上の言語で即座に返答してくれる
利用可能な言語
- 英語
- スペイン語
- フランス語
- 中国語(北京語)
- アラビア語
- ロシア語
- 日本語
- 韓国語
- ヒンドゥー語
- タイ語
など多数。
ChatGPTのモデルは主にPythonのプログラミング言語で書かれている。
ただ、チャットGPTは広く使われているプログラミング言語を理解しています。チャットGPTのプログラミング言語は以下の通り:
- Python
- Javaスクリプト
- C++
- C#
- Java
- Ruby
- PHP
- Go
- Swift
- TypeScript
- SQL
- シェル
投資
ChatGPTはOpenAIによって2015年に開発された
OpenAIは2015年に非営利団体として始動しました。資金はOpenAIのCEOであるサム・アルトマンやOpenAIの現社長であるグレッグ・ブロックマン、ベンチャー資本家でLinkedInの共同創業者でもあるリード・ホフマン、テスラ社のイーロン・マスクなどの投資家から調達された。
2019年にOpenAIが非営利団体から利益上限付き企業に変更
OpenAIの利益には上限が設定されているため、投資した人たちは最大100倍の投資リターンまでしか得られません。それ以上の利益はOpenAIの非営利部門に合算されます。
2019年にマイクロソフトがOpenAIに10億ドルの投資
この投資によりマイクロソフトがOpenAIの独占的クラウドサービスプロバイダーとなりました。これにはチャットGPTも含まれます。また、同社は2020年と2022年の間でOpenAIに20億ドル(約3000億円)の追加投資をしています。
2023年1月にマイクロソフトが100億ドルの追加投資
これにより同社がOpenAIの49%の所有権を得ることになりました。
ChatGPTの収益統計
OpenAIではChatGPTの収益は2023年までに2億ドル(約300億円)、2024年までには10億ドル(約1500億円)を見込んでいる
OpenAIは2022年の時点で10億ドル足らずの収益を上げています。
OpenAIの評価額
マイクロソフトは2023年1月の時点でOpenAIの評価額を290億ドル(約4兆円)としていた
チャットGPTの評価額は2021年の時点で140億ドル(約1兆9000億円)とされていました。
ChatGPTのソフトウェア、アルゴリズム、パラメーターの統計
ChatGPTは大規模言語モデル
チャットGPTはファインチューニングとRLHF(人間のフィードバックからの強化学習)によって開発されました。
ChatGPTは45TBのテキストデータで学習
テキストデータには本やウェブサイト、ウィキペディア、ニュース記事など幅広いものが含まれています。合計でチャットGPTの言語モデルは3000億個もの単語を学習しています。
ChatGPTの学習プロセスには1000 個のNVIDIA V100 GPUアクセラレータが必要
チャットGPTはMicrosoft Azure(アジュール)スーパーコンピュータ上で稼働します。学習モデルは24のレイヤーと96のアテンションヘッドを有しています。チャットジーピーティのモデルは数ギガバイトのデータを利用してファインチューニングが施されています。
ChatGPTの最新版であるGPT-4には100兆個以上ものパラメーターがある
GPT-3は1750億個のパラメーターであったことから桁違いであることが分かります。
ChatGPTは米国の司法試験も合格済み
アメリカの司法試験で60%のスコアを記録し合格しました。
ChatGPTのキーワードとトラフィックの統計データ
2023年3月にはChatGPTへの1日あたりのユニークユーザー数が5300万人を記録
同年1月のユニークユーザー数(一日あたり)が1300万人、2月には3500万人を記録していました。チャットGPTサイトへのトラフィックも2月から3月にかけて56%増加しました。
ChatGPTの利用者は平均8分44秒滞在している
ユーザーは平均で6.67ページ滞在していて、同年3月には直帰率が16.07%となっています。
ChatGPTのトラフィックは主にダイレクトのコネクション
他のウェブサイトからチャットGPTにアクセスする人は二番目の多さです。
ChatGPTへの主なトラフィックソース(到達経路) | 合計トラフィック(%) |
ダイレクト | 69.43% |
他のウェブサイトから | 19.97% |
検索エンジン | 4.37% |
ソーシャル | 3.87% |
eメール | 2.33% |
その他 | 0.03% |
ChatGPTのソーシャルメディア
上記の表の通り、およそ4%のユーザーがソーシャルメディアを経由して到達していることがわかります。
- 51.47%はYouTubeから
- 16.27%はTwitterから
- 11.75%はフェイスブックから
- 8.80%はWhatsAppから
- 3.93%はRedditから
- 11.71%はその他から
ChatGPTの運営コストと料金体系
ChatGPTの1日のコストは10万ドル
これは月に約300万ドル(約4億円)の運営コストになる計算です。コストの大部分がMicrosoft Azureのクラウドサービスによるものです。マイクロソフトが2019年にOpenAIに10億ドルの投資をした際、その資金の多くがAzureコンピューティングクレジットの形で融資されました。
マイクロソフトの契約の詳細は公になっていませんが、Azureは一般的に1GPUあたり1時間で3ドルの料金が発生します。そのためチャットGPTが生成する1単語のコストは0.0003ドルと言えます。
ChatGPT-3と3.5は大衆向けに無料で利用可能
しかし、今後需要が高まって来ればGPT-3などへの無料アクセスも終了する可能性があります。
OpenAIがChatGPTプラスを導入、サブスク料金は月20ドル
ChatGPTプラスではピーク時間にアクセスできるようになります。現在のところ、OpenAIの最新モデルであるGPT-4にアクセスできる唯一の方法がこの月額サブスクに登録することです。
ChatGPTに関する人々の見方に関する統計
70%の人がChatGPT(チャットジーピーティ)は人々の生活を良くしてくれると考えている
しかし87%の人がチャットGPTが企業や政府組織に使われると大衆をコントロールするために使われると危惧を抱いているとされています。
米国ではチャットGPTが社会にとって有益だと答えた人は13%しかいませんでした。
36%の人は社会にとって害だと考え、23%の人はどちらでもない、28%の人がわからないと回答しました。
63%のユーザーがChatGPT上で広告を出せるようにするべきだと考えている。
OpenAIではChatGPTの回答に広告機能を導入するかどうかは明言していません。
85%の人がChatGPTをセラピーに利用すると回答
60%の人がチャットGPTに医療に関する質問をするとし、13%の人がChatGPTと卑猥な話をするために使うと回答しました。
83%の人はChatGPTがマイノリティ(社会的少数者)に偏見を抱くのではと危惧している。
現在のAIモデルの問題点は、マイノリティの人に対する差別や偏見が非意図的に起こりうることです。例えば顔認証のアルゴリズムでマイノリティの人を人間として認識しないなどの問題が挙げられます。
50%の人がChatGPTに仕事を奪われると危惧を抱いている
ChatGPTに仕事が代わると考えられる職種は以下の通りです。
- ソフトウェア開発者
- データアナリスト
- カスタマーサービス
- コンテンツ制作者
- マーケティング
米国の14%の人がChatGPTによって仕事が増えると回答しています。
59%の教師がChatGPTを教育にとって良いツールだと考えている
38%の教師が生徒にチャットGPTの使用を許可しています。しかし25%の教師はChatGPTがカンニングに使われると考えています。
イーロン・マスクなど著名人のChatGPTに関する意見
イーロン・マスクはChatGPTのようなAI技術を「文明の未来に対する最大の危機」と発言
マスク氏はAIに有益な側面があるとも指摘していますが、使い方を誤れば核戦争になる危険性もあるとしています。
マイクロソフトの創業者であるビル・ゲイツ氏はChatGPTのようなAIを「半導体やパソコン、インターネット、携帯に並び社会の根幹となる」と表現
同氏はChatGPTは不完全だとしながらも、AIはこの10年で最高のテクノロジー革命だとしています。
Google社のサンダー・ピチャイCEOは生成AIを同社が現在開発している「最も深遠なテクノロジー」としている
同社は最近ChatGPTのライバルとなるBardを発表しました。チャットGPTのサービスが開始されてからピチャイCEOはチャットGPTに検索エンジン市場を奪われる危機感から“コードレッド”を発動しました。
マイクロソフトのサティア・ナデラCEOは、人類は「明らかに、間違いなく」AIのコントロール下に置かれると警笛を鳴らしている
しかしナデラ氏はマイクロソフトが開発を支援しているOpenAIがAIの開発競争を招いているという批判についてはコメントをしていません。
Appleのティム・クックCEOはChatGPTとAIモデルには大きなポテンシャルがあるとしており、「全ての製品やサービスに影響を及ぼす」と見ている
AppleはすでにAIアシスタントを同社の製品に導入しており、ChatGPTやその他のAIモデルが同社の製造ラインを最適化してくれる可能性もあります。
投資家のウォーレン・バフェット氏はChatGPTが仕事を減らすと見ており「ある特定の分野では劇的に雇用が減るだろう」と予見している
バフェット氏は経済にとって良いことではないとしながらも、人々が余暇を楽しむ時間が増えるともしています。ただ、短期的にはAIが社会に問題を起こすこともあり得ると見ています。
ChatGPTの歴史
2015年 ChatGPTの親会社であるOpenAIが創設
OpenAIはサンフランシスコで非営利団体として始動し、イーロン・マスクやサム・アルトマンなどが率いていました。OpenAIのゴールは社会にとって脅威となるAIではなく、人類がコントロールできる安全なものをつくることにありました。
2018年 OpenAIが最初のGPT(自然な文章が生成できる言語モデル)を廃発
最初のモデルは7000冊あまりの未出版の本で学習しました。
GPT-2が15億個のパラメーターを搭載
第2のGPTモデルは2018年に開発され、800万ものWebページの学習に成功しました。ただ、OpenAIはGPT-2が詐欺メールや偽の情報を拡散させるために使われることを危惧してサービス開始には至りませんでした。
2018年 イーロン・マスクがOpenAIを去る
マスク氏はOpenAIを創設する前に人工知能が文明の未来にとって最大の脅威となると話しており、同社がGPT-2の発表をしないと決めた頃と時期が重なります。
2019年 OpenAIが利益上限付き企業に変更
OpenIAは非営利から上限付きの営利企業に変更する決定をしました。ただ未来の利益に上限を設定するのは異例です。上限以上の利益はOpenAI社を所有しているOpenAI LPという非営利団体に流れます。
2021年 OpenAIがDALL-Eを発表
DALL-EはChatGPTと類似したニューラルネットワークのアーキテクチャを使用しているものの、テキストではなくプロンプト(指示文)によって画像を生成します。
2022年 OpenAIがGPT-3を開発
GPT-3を構築するため、マイクロソフトは1万個のGPUを搭載した世界第5位のスーパーコンピュータをつくりました。ChatGPTはGPT-3のうえに構築されており、1回のセッションで繰り返されるプロンプトを含む会話をすることができるようになりました。
マイクロソフトがGPT-3をBingとEdgeに統合
2023年2月にマイクロソフトがChatGPTを規制製品に統合する第一歩を踏み出しました。Bingのインターネットで検索するMicrosoft Edgeのユーザーは、ChatGPTの使用前後で検索結果を見比べることができます。
2023年 OpenAIがGPT-4を発表
GPT-4はOpenAIの最新のGPTモデルです。現在のところChatGPTプラスのサブスクリプションのみで利用可能です。OpenAIによると、GPT-4の回答の精度は40%向上し、開発チームに設定されているルールを遵守する確率が80%にまで上がったとしています。
ChatGPTの仕組みとは?
ChatGPTはトランスフォーマーモデルを採用
トランスフォーマーとはニューラルネットワークのことで自然言語処理用の基盤です。トランスフォーマーではモデルは一連の言葉の繋がりを見て次の単語の意味や文脈を判断することができます。これは人間が文章を読むときに行う自然処理と同じ仕組みです。
ChatGPTは24レイヤー
チャットGPTのトランスフォーマーモデルは複数のレイヤーがあり、人間の脳で言うとたくさんのニューロンのネットワークのような作りになっています。一連の単語が各レイヤーを通過するとそれぞれの単語の重要性が加重して識別されていきます。すべてのレイヤーを通過するころにはチャットGPTはその一連の言葉の意味や文脈、言葉の意味の重要度などについて比較的高い確度を持って処理できます。
ChatGPTはインターネットに存在する45TB相当のテキストデータを学習
初期段階のGPTモデルの学習トレーニングはプレトレーニングと呼ばれていました。チャットGPTはWebText2と呼ばれるデータベースから3000億個もの単語を“読み”こむことに成功しました。この学習トレーニングは誰かによって管理されていたものではなく、ChatGPT自身でテキストを読み込み、一定のパターンなどを自ら学習したものになります。人間のプロンプターが何かを読むように指示を出したり、質問文を出したり、フィードバックを与えたりしたものではありません。
ChatGPTは二人の人間の会話を使うことで自然な文章生成が可能に
ChatGPTに人間の会話を理解させるため、二人の人間が話している会話16万通りが与えられました。各会話は違う声のトーンやモチベーション、バックグラウンドなど多用なサンプルが存在していました。
プレトレーニングが完了後、モデルの適応のために手が加えられた
GPTのモデルが発表される前、人工知能の研究者にChatGPTを利用することが許されました。研究者がChatGPTの生成した答えにモデルのフィードバックを与えることで、チャットGPTの回答を最適化させることができるようになりました。
ChatGPTはマルチターン会話ができる
ChatGPTの強みは自然なマルチターン会話ができることです。答えを返したらリセットされてしまうのではなく、会話を行ったり来たりしたり、質問の意味を明確にするよう聞き返したりすることもできます。
ChatGPTは何に使える?
ChatGPTは誰にでも無料
すでにChatGPT(チャットジーピーティ)は多くの産業で使われていますが、まだ既存のソフトウェアには統合されていません。
ChatGPTの主な用途:
- 同僚へのメールの下書き
- 就職活動のための履歴書や職務経歴書を書いてくれる
- 既成のウェブ検索をせず質問への答えを出せる
- コンピュータのコーディングやデバッグができる
- コンテンツを複数の言語に翻訳できる
- どんな分野の小論文も書ける
- 数式を解ける
- 食材から新しいレシピを見つけてくれる
ChatGPTを使った人の用途:
・無料で医療的な診察を受ける
・無料で法律相談
・無料でオンラインセラピー
・AIと卑猥な話をする
以上の使い方はOpenAIに推奨されていませんが、多くのユーザーが実際にやってみて有効性を覚えています。
ChatGPTの限界と課題、未来
ChatGPTは誤った情報も生成しうる
ChatGPT(チャットジーピーティ)が生成する答えの多くは正しいものが多いですが、誤った答えを出してしまうこともあります。そのため、複雑かつ重要度の高いトピックになるとChatGPTに全幅の信頼を置けるというわけではありません。
ChatGPTは2021年9月以降の出来事を知らない
チャットGPTの学習データベースは2021年9月でストップしています。GPTのモデルはこれ以降の世界について何も知らず、ユーザーが最近の出来事について言及してもチャットGPTが知らないということが起きています。
ChatGPTは約500単語の上限がある
ユーザーの指示文が500単語以上を超えるとChatGPTは回答できなくなります。また、500単語あたりになると回答そのものが打ち切られる可能性もあります。その場合、ChatGPTの会話がストップしたところから始めなければなりません。GPT-4(ChatGPTプラスのサブスクプランで利用可能)は単語数の上限が劇的に向上したとされています。
ChatGPTは常に使えるわけではない
ChatGPTのウェブサイトがピーク時にはウェブサイトが読み込めないことがありえます。その場合、使いたいユーザーはピークが過ぎるまで待つしかありません。ChatGPTプラスのサブスク利用者ならピーク時でも優先的にアクセスすることができます。
ChatGPTは悪用できる
チャットGPTは一定のプロンプトに答えないよう設定されているはずですが、必ずしも全てがコントロールされているわけではありません。前述の通り、チャットGPTが誤った情報を生成したり、マルウェアをコーディングしたり、フィッシングメールを書くこともできます。
ChatGPTの未来
2023年3月13日、ChatGPT発表の3ヶ月後にOpenAIがGPT-4をリリース
OpenAIの最新版は100兆個以上ものパラメーターを有しています。ChatGPTの発表からたったの3ヶ月後に高性能のGPT-4が発表されたことから、今後は年中アップデート版がリリースされていくことが予想されます。
マイクロソフトはChatGPTをOffice365に統合する考え
Office 365はワードやエクセル、パワーポイントやOutlookなど事務作業に必要な機能を提供するサービスですが、世界で3億4500万人のユーザーがいます。チャットGPT(マイクロソフトのプロメテウスモデルの改良版)がOffice 365に統合されると、多くの事業や産業がChatGPTのAIモデルをさらに利用できるようになります。
ChatGPTが業務に導入されていく
現在のところChatGPTが日々の業務で使われるということはまだありませんが、近い将来この状況が変わるかもしれません。チャットGPTが業務に導入されると従業員の業務内容が変わったり、企業の雇用者が減る可能性もあります。
ChatGPT対競合他社
ChatGPTの競合他社はBing ChatやChatsonic、Google Bardなどがある
Bing ChatとChatsonicはChatGPTに深い関係がありますが、モデルの学習プロセスにいくつかの違いがあります。両者ともOpenAIが開発したGPT-3.5のモデルです。Google BardはGoogleが所有する言語モデルで、2023年3月に発表されました。
ChatGPT | Bing Chat | Chatsonic | Google Bard | |
プラットフォームの種類 | AIによるチャットボット | AIによるチャットボットと検索エンジンの機能 | AIによるチャットボット | AIによるチャットボットと検索エンジンの機能 |
AIモデル | OpenAIのGPT-3.5 | プロメテウス(マイクロソフト版GPT-3.5) | OpenAIのGPT-3.5 | Google LaMDA |
データソース | ウェブサイト、本などから抽出した45TB相当のテキストデータ | Bingの検索インデックスから抽出したテキストデータ | ChatGPTと同様、さらにリアルタイムインデックス | Google検索インデックス |
知識ベース | 2021年9月以降はデータがない | 現在までの全ての事象を知っている | 現在までの全ての事象を知っている | 現在と過去の全ての事象を知っている |
料金体系 | 無料(ChatGPTプラスのサブスクは月額20ドル) | 無料(Microsoft Edegのブラウザでのみ使用可能) | 無料 | 無料(米国と英国のみで利用可能) |
用途 | 無制限 | 無制限 | 無制限 | 無制限 |
ChatGPTに関する面白い事実
ChatGPTによって“プロンプトエンジニア”の職種が誕生
ChatGPTからベストアンサーを引き出そうとしたり、AIモデルの欠陥を見つけ出したりするにはプロンプトをよく練らなければなりません。そこでOpenAIや競合他社はプロンプトエンジニアを採用し始めています。この仕事は必ずしもコンピュータ科学者である必要はなく、むしろAIモデルに最適な問いかけができるクリエイティブな作家などが適任なようです。
ChatGPTはジョークが言える
ChatGPT(チャットジーピーティ)のデフォルトは面白いわけではありませんが、プロンプトが面白ければ回答が面白くなることがあります。例えばユーザーがチャットGPTに好きなお笑い芸人のスタイルに関する話を書くように指示を出したとします。もしくはチャットGPTに皮肉で返すように指示を出したとしましょう。その結果、ChatGPTが面白く切り返せるようになるにはトライ・アンド・エラーを繰り返すしかありませんが、上手くいくととても面白いです。
ChatGPTは学習し続ける
ユーザーがChatGPTと会話する度にGPTのAIモデルが新しい情報を学習します。フィードバックを元に常にファインチューニング(微調整)をしていきます。
ChatGPTはすでにいくつかの産業を変革している
これからはChatGPTが生成した文章だと気づかずに読んでしまうことがより多くなると予想されます。すでに多くの産業ではチャットGPTにメールの下書きをさせたり、不動産業者は不動産のテナント募集情報などを記入するのに利用したりしています。プログラマーもまたチャットGPTにコードを書かせ、エラーをチェックさせるなどしています。
よくある質問
2023年のChatGPTのユーザー数は?
ChatGPTプラスの利用者数は?
ChatGPTのデータはどれだけ新しい?
ChatGPTはどこでデータを得るの?