FIRE: 投資でセミリタイアする九条日記

九条です。資産からの不労所得で経済的独立を手に入れ、自由な生き方を実現するセミリタイア、FIREを実現しました。米国株、優待クロス、クリプト、太陽光、オプションなどなどを行うインデックス投資家で、リバタリアン。ロジックとエビデンスを大事に、確率と不確実性を愛しています。

チャット型AIは頭打ち? AIはぼくらの上司か部下か


2022年末に登場したChatGPTは、史上最速で10億人以上が使うサービスになりました。そこから、仕事のあり方から社会まで、大きく変革するインパクトを与えてきたのはご存知のとおりです。ところが、その利用は15億〜20億人程度で頭打ちになっているようなのです。それはなぜなのでしょうか。

ChatGPTの利用は頭打ち

先日、次のような示唆的なポストを目にしました。LLMはチャットUIで大ブレイクしたけど、今はそれに呪われているというものです。

ソースはSimillerWebのデータを使った米The Wrapの記事です。下記のように、GPT-4を発表した2023年春にピークを迎えたあと、ChatGPTの利用者は下落、横ばいが続いているのです。

ChatGPTは2023年5月に18億のウェブ訪問でトラフィックのピークを迎えたが、夏には減少した。2023年8月までに、訪問者数は最高値から21%減少し、それ以来回復していません。

ChatGPT's Growth Is Flatlining: Where Does It Go From Here?

使える人が限られるチャットUI

これはなぜか? 先のポストでは、次のように分析しています。

基本的にはいまでも「複雑なインプット(質問)を組み立てられる人だけが使いこなせる高度なツール」の域を出ていない。

つまり、知的生産活動に従事しているような、人口比でみればトップ5-10%の人たちにしか使い道がないツールになっているのだ。

なるほど、ChatGPTを仕事に活用して圧倒的にパフォーマンスが上がったというい人は確かにいます。ぼくもその一人です。ただし、友人たちに「ChatGPTを何に使っている?」と聞くと、出てくるのは仕事の効率化とは程遠いところだったりします。

  • 一人で飲んだときの話し相手
  • アイデア出し
  • 調べ物(嘘ばっかりで使えない)

なるほど。これらの用途から分かるのは、チャットUIを本当の意味で活用するのは、すごく難しいということです。基本的に、LLMは独創的な何かを生み出すものではなく、極めて一般的なありがちなものを出力するものです。そのためアイデア出しにおいても、「◯◯についてのアイデアを出して」といったようなプロンプトでは、ごくごくありきたりな、何ら光るところのないものしか現れません。

 

調べ物をして「嘘ばっかり返してくる。使い物にならない」という人は大変多いのですが、これはLLMの本質を捉えそこねていると以前から言ってきました。それでもこれが示唆するのは、キーワードだけを入れれば何らか役に立つ答えを返してくれる検索エンジンというのは、偉大な発明だったということです。

 

Googleで検索するときのことを考えてみましょう。例えばChatGPTのチャット型UIの限界について調べたければ「チャット型UI 限界」なんてクエリーを入力しませんか? でも検索エンジン側も長らく「文章で入力してくれたほうが適切な検索結果を返せます」とアピールしてきたのです。ところが、実際に文章でクエリーを書いている人を見たことはありません。

 

それだけ単語の羅列で済ませるUIは簡単で使いやすいのです。しかし、ChatGPTは単語の羅列では、必ずしもうまく動作しません。

チャットの次のUIは何か?

となると、もっと広い人たちが使いこなせるUIが求められます。新型モデルとして発表されたGPT-4oはその答えの一つでしょう。音声→文章化→LLMで処理 という多段型ではなく、音声を直接LLMのニューラルネットワークで受け取るGPT-4oは、真の意味で音声でLLMとやりとりできる可能性を拓きました。


www.youtube.com

世界中の誰にとっても、音声による会話というのは、文章で指示を出すことよりも明らかに容易なコミュニケーション手段です。これはChatGPTの壁を乗り越える方策になり得るかもしれません。

 

ただし必ずしもスマホというデバイスはそれに向いていないでしょう。スマホは文字を入力したりタップして、画面に出てくるものを目で見るデバイスです。今も音声入力機能やSiriのように音声エージェントは搭載されていますが、メジャーなスマホの使い方にはなっていません。

 

先のポストでは「クリックひとつで動く体験が求められている」としています。これはうまく作り込まれれば可能性があるでしょう。次々現れる写真を「好き」「嫌い」に応じて左右フリックしていくだけでリコメンドが洗練されるUIのTinderや、ひたすら下にスクロールしていくだけで、視聴時間やスキップなどからリコメンドを強化していくUIでTikTokの大ブレイクがそのイメージです。

AIに指示を出すのではなくAIが指示を出す

ただ、そもそもの根幹の話でいうと、大多数の人はAIであれ人であれ、誰かに指示を出すことに慣れていないし、そもそも指示したいとも思っていません。AIは今や、限定された分野では新入社員レベルの能力を持っていますが、そうした人に指示を出す事自体、かなりハードルが高い行為なのです。

 

言ってみれば、人間であれAIであれ、部下を使いこなすにはそれなりのスキルが必要です。不平不満も言わず圧倒的に行動が早いAIであっても、「いい感じにやっておいて」というような指示ではまともなアウトプットは出せないのです。

 

それよりも実は多くの場合にニーズが高いのは、AI側が上司になる形でしょうか。AIが何をやったらいいかを取りまとめて、指示を出してくれる。人間はAIの指示に従って、やるべきことを行うという世界です。

 

AIが上司だというとディストピア的ですが、AI執事とかAI秘書といえばイメージが湧くでしょうか。いわゆるAIエージェントです。「次は◯◯線に乗って、□□駅で降りてください。△△社の受付で◎◎さんを呼び出してください」こんな指示がAIから出される日は、そんなに遠くないはずです。

◯◯さんから、こんなメールが届きました。過去の行動履歴と予定表を見たところ、□□のように返信するのがいいと思ったので、文面を作りました。

こちらで返信しますか? 

もう少し進むと、AIがこのくらいはやってくれるでしょう。この形であれば、人間は「はい」ボタンを押すだけで仕事が完結します。極端にいえば、人間としての役割はAIが行った仕事の成果に責任を持つだけになるかもしれません。

 

www.kuzyofire.com

www.kuzyofire.com

www.kuzyofire.com