FIRE: 投資でセミリタイアする九条日記

九条です。資産からの不労所得で経済的独立を手に入れ、自由な生き方を実現するセミリタイア、FIREを実現しました。米国株、優待クロス、クリプト、太陽光、オプションなどなどを行うインデックス投資家で自由主義者、リバタリアン。ロジックとエビデンスを大事に、確率と不確実性を愛しています。

最近のAIエージェント所感 ClaudeCode〜Codex、AntiGravity

最近、AIエージェントにハマっています。特に、SaaSからセキュリティ関係までプラグインを発表するたびに、各種企業の株価の暴落を招いているAnthropicのClaudeCode(Cowork)。これを中心に、各種AIエージェントの今について、所感をまとめておきます。

AIエージェントとチャットAIの違い

「AIエージェント」と言われると、確かに最近よく聞くけど、何やらそれすごいの? ChatGPTと何が違うの? と思うと思います。ClaudeCode、そしてOpenAIのCodex、GoogleのAntiGravity。これらが有名どころAIエージェントなわけですが、チャットAIとは何が違うのでしょうか。

 

1つ目は、ローカルのファイルやアプリケーションを操作できることです。ChatGPTは基本的に、アップロードしたファイルを読むことしかできません。あとはWebを検索したりするだけです。ところがこれらのAIエージェントは、デスクトップにあるファイルを読み込むだけでなく、それを書き換えたりできるのです。

 

さらにアプリケーションも操作します。といっても、Wordを立ち上げて何か書き始めるというよりも、Macでいうターミナル、Windowsのコマンドラインで利用するアプリケーションを自分で判断して使います。

 

デスクトップに置いてある動画abc.movを、フレームレート2fpsでビットレート200kbpsにエンコードしなおして、リネームして保存して。

などと指示を出せば、ファイルを読み込むだけでなく、PCの中にあるffmpegなどの動画編集コマンドを呼び出してファイルを編集し、出来上がったファイルを保存してくれます。まさに人の代わりにいろいろやってくれるイメージです。

 

投資家的な話だと、

ソフトバンクGの業績を分析したい。IRページにアクセスして、決算短信と有価証券報告書、決算説明資料を過去2年分ダウンロードして、ファイル名を整理してデスクトップに保存して。

などと指示すれば、あとはよしなにやってくれます*1

 

もちろん、ローカルファイルを操作するので、AIエージェントが暴走すると大変なことになります。重要なファイルを勝手に削除されたり、勝手にどこかに送付することだってできてしまいます。そのため、各AIエージェントは、どのフォルダだけをアクセス可能にするか、どんな作業をOKするかを細かく設定します。また、「これは人間に確認を取ったほうがいいな」と判断されたリスクの高い操作は確認を求めてきます。

 

もちろん、ここは自律性との兼ね合いで、あんまり確認ばっかりしてくるAIエージェントは、つきっきりで見ていなくてはならないので、それもしんどいんですよね。

圧倒的な自律性

もう一つの違いは圧倒的な自律性です。チャットAIは、基本的に依頼したら返ってきて、それに対して再び指示をする、対話形式で利用します。一方、AIエージェントは一度指示をしたら、それが終わるまでしばらく勝手にAIが動き続けます。

 

イメージとしてはDeepResearch機能に近いです。あれも、調査指示を出すとしばらくの間、調べ続けますよね。裏側では、まず調査プランを作り、それに従って各所のWebを回って調べ、出てきた情報を元に再度プランをアップデートして調べて、情報が集まったら文章として執筆する――。そんなことをやっているわけですが、AIエージェントも同じです。

 

そのため、チャットに比べると丁寧に指示をしてあげる必要があります。出てきたものを見て、「ここが違う、作り直して」とアジャイルにやりとりするのがチャットAIなら、丁寧に作りたいものを説明して、それを元に長い時間をかけて完成させてくれるのがAIエージェントのイメージでしょうか。

 

例えば、複数の画像をまとめたPDFの中身をAIで文字起こしすることを考えてみましょう。PDFをGeminiのチャットにアップロードして文字起こしを依頼すれば、さらさらと起こされたものが出てきます。ただし、大きなPDFの場合、最後までやり遂げることは稀です。途中で終わってしまったり、「中略」とか勝手に付けてきたり、AIにはサボるクセがあります。

 

これは「サボるな」「最後までやれ」「出力を見直して完全じゃなかったらやりなおせ」などと指示を足すことでそこそこ改善しますが、それでも完全ではありません。人間が代わりに監督してチェックしてあげなくてはならないのです。

 

でもAIエージェントの場合は違います。自分自身で見直して、最後までやり遂げようと頑張るのです。

恵まれた料金

このように自律的に動くAIエージェントは、相当な計算が行われることが容易に想像できます。AIに入出力するデータの大きさは「トークン」という単位で測られ、API料金もトークン単位で決まっています。例えばGPT-5.2なら、100万トークンあたり入力は1.75ドル出力は14ドルです*2

 

AIエージェントモデルの場合、内部でプランを作ってそれに従って実行している間、要するに山のようにトークンを出し入れしているので、一気に料金がかさみます。AIエージェントは凄まじい勢いでトークンを食うのです。

 

ところが、ClaudeCode、そしてOpenAIのCodex、GoogleのAntiGravityは違います。Claude Codeは、APIではなくチャットの利用容量内で動作します。ぼくはClaude Proに入っていますが、これでもClaude Codeでちょっとした作業(15分くらい)は動かすことができます。100ドルのMaxプランにすれば5倍、200ドルの20xMaxプランなら20倍の利用が可能です。

 

バリバリ使う人に聞くと、そこそこ使うくらいなら100ドルMaxでもOKで、200ドルのx20MAXなら一日中動かしてもけっこうOKだとか。これはAPIでガンガン回すのに比べて、かなり安いのです。

 

Claude Codeを追いかける立場であるCodexは、これ利用制限ってくるの?というレベルの制限です*3。また、AntiGravityはGeminiだけでなくClaudeのOpusやSonnetも選択できるうえに、いったい利用制限があるの?というくらい使いまくれます。ちなみにぼくが使っているプランは20ドルのGoogle AI Proです。

 

そんなわけで、AIエージェントは激戦区で各社ユーザー獲得のためにガンガン大盤振る舞い中。APIで使うのに比べると恐ろしいほどの安さで各種モデルを試せる状況なのです。

ClaudeCode:さすがにこなれている

ではそれぞれのAIエージェントの所感です。ClaudeCodeは、もともCLI(コマンドライン)で動くもので、ターミナルを開き、ターミナルの中で利用するものでした。そりゃ、使うコマンドも全部ターミナルから呼び出すのですから、これが自然といえば自然。一見、とっつきにくそうに見えますが、ターミナルにはターミナルの良さがあります。

そして、M1 Macのみですが、専用アプリ「Claude」からも利用できます。そして、ここにはコーディングにフォーカスした「コード」だけでなく、ビジネスユースに展開した「Cowork」も用意されていて、利用できます。

コードを書くのでなければ、このCoworkがオススメ。ClaudeCode(Cowork)の特徴は、動作の設定が複雑すぎず、かつイメージしたとおりの動きをしてくれるところです。ClaudeCodeはいまやAIエージェントの代名詞ですが、実際に使って比較すると、最も実用性があるのがClaudeCodeだと感じます。

Codex:完遂力がすごい

続いてOpenAIのCodex。こちらは、専用のCodexアプリと、VS CodeなどのIDEに組み込む形と、ClaudeCodeと同じくターミナルで動くものの3種類が用意されています。ぼくは基本的にCodexアプリを使っています。

Codexの特徴は僕の印象では完遂力の強いこと。非常に地頭の良さを感じます。センスがいいというよりも、論理的できっちり作業を遂行するイメージと言ったらいいのでしょうか。一方で、Coworkに相当するものは用意されておらず、Claude以上にコーディングに特化している感じがしています。そのため、クリエイティブな作業をさせると、ちょっと期待外れです。

 

使えるモデルもこんな感じで、GPT-5.3系が用意されています。さらにスピードを強化したSparkモデルも入っています。

AntiGravity:今後に期待

最後にGoogleのAntiGravityです。こちら「Experience liftoff with the next-generation IDE」とうたうだけあって、バリバリのIDEなんですね。エージェント管理に特化した感のあるClaudeCode/Coworkとは方向性が違う。

 

なので、非常に細かな設定が可能で、正直、それだけで気が滅入ります。日本語モジュールを入れれば日本語化もできるようですが、いまのところ英語で使っています。

所感としては、ClaudeCode、Codexに比べて本当に細かく許可を求めてくる。いや、「全部OK」とか入れれば勝手にやるのかもしれませんが、オススメ設定で動かすと、しょっちゅう許可待ちで止まっています。この辺はもっと突き詰めないと分からない。

 

画面にあるように、モデルはGeminiだけでなくClaude Opus/Sonnet系も使えます。あとGPT-OSSも。ただ、他の中華系AIエージェントにも言えることですが、基盤モデルにOpusが使えても、性能はまるでClaudeCodeのようにはなりません。いまや基盤モデルの優劣ではなく、AIエージェントの枠組みの勝負にもなってきています。

 

なおAntiGravityは最高に大盤振る舞いで、僕は20ドルのGoogle AI Proにしか入っていないのですが、けっこう使っても全然リミットに達しません。まぁ許可許可許可でなかなか進まないので、思ったほどトークンが消費できていないのかもしれませんけど。

 

www.kuzyofire.com

www.kuzyofire.com

www.kuzyofire.com

 

*1:正確には、この指示だけではちゃんと動かないことが多いです。もう少し詳細にスキルとかで指示する必要があります。

*2:Claude Opus4.6なら100万トークンあたり入力は5ドル、出力は25ドル。GPT-5.2 Proだと、入力は21ドル、出力は168ドルに跳ね上がります

*3:まぁぼくは200ドルのChatGPT Proに入っているというせいもあります