実はGoogleのGeminiのことをバカにしていました。マルチモーダルも推論モデルも超大規模モデルも、最初に出すトップランナーであるOpenAI。派手さはなくても着実に開発を進め、API利用、特にプログラマーでの利用はトップクラス。MCPのようなデファクトスタンダードを開発する力を持つAnthropic。一方で、微妙にやる気を感じられなかったのが、データもユーザーベースも演算能力もふんだんに持ち、各種AI技術の発祥の地でもあるGoogleです。
ところが3月末に出たGemini2.5 Proにはやられました!
理解力がトップクラスに
AIにはいくつかの評価指標があって、純粋な頭の良さがまず重要です。で、各AIはそれぞれクセがあって、頭はいいんだけど間違いを指摘するとムキになって反論しなかなか謝らないo1/o3系統、何も言ってないのに忖度して謝って勝手に推察して修正までやってしまうClaude、思いやりの心あふれるGPT-4.5、軽薄で軽いユーモア豊かなGrokなど、さまざまです。
ところがGeminiはどうも印象が薄い。個性を感じない。まぁこれは悪いことではないので、いいのですが、Geminiを使う理由というのを感じられていませんでした。
ぼくはAIでなにかをやるとき、時間があれば、複数のAIに同じプロンプトを投げて比較してみることがあります。結果を見て採用に近いのは、だいたいo1 ProかClaude3.7で、Geminiは一歩落ちる印象でした。
ところが今回、Gemini2.5 Proの回答に驚きです。むむむ。これが一番いいぞ? 出力の良し悪しを見極める目は持っているつもりですが、ついにGeminiがトップに立った印象でした。
大量のデータを投げるなら
こうなると、俄然Geminiの強さが光ります。Geminiの最大の特徴はコンテキストウインドウが大きいこと。これはプロンプトとともに与えられる資料のサイズのことで、トークンサイズで表されます。
Gemini2.5Proはこれがなんと100万トークンです(4月5日に出たLlama4は1000万トークンで、これは相当な量ですが)。
- Llama 4 1000万トークン
- Gemini 1.5Pro/2.5pro 100万トークン
- Claude Enterprise 50万トークン
- Cluade 3.5 Sonnet 20万トークン
- GPT-4o 12.8万トークン
- GMeta Llama 3.2 12.8万トークン
100万トークンがどのくらいの量かというと、
- 大学の講義 40〜50コマ分
- ブログ記事 1000〜1500記事分
- 新聞 3〜4ヶ月分のテキスト
- 本 200ページの文庫本10冊
といった感じ。つまりけっこうなボリュームのコンテンツを投げ入れてもAIに処理できるわけです。どデカいテキストを扱う場合など、Claude3.5の20万トークンでは「多すぎます」とエラーになることがしばしばあったのですが、100万ならOK。大部の本一冊を丸ごと読み込ませられるのは、本当にすごいことです。
DeepResearchもイケる
OpenAIの十八番のように見られがちのDeepResearchも、2.5Proが行うようになってかなり進化しました。
DeepResearchのスピードと精度はだいたい比例していて、感覚的には速いほうからGrok<Gemini<ChatGPTという感じなのですが、Geminiのバランスはちょうどいいんですね。
ChatGPTは「え?まだ調べてるの?」みたいな遅さで、かといって遅いのに見合った内容というほどではありません。Grokは速いのですが、うーん、DeepResearchとしてはイマイチという場合が多い。Geminiは精度はChatGPTと遜色なくスピードは2倍くらい速い印象なのです。
さっそくGemini Advancedに課金
そんなイケてるGemini2.5 Proなのですが、無料版だとなんかちょうどいいところでリミットになるんですね。何度もやり取りして乗ってきたぞ!もう一往復!というくらいのところで、「無料版の制限です。どうぞ課金を!最初の1ヶ月無料」とくるわけです。
そんなわけで、今回ばかりはたまらず課金してしまいました。で課金版のGemini Advancedは、GoogleOneとセットになっていて、つまり2TBのストレージがセットになっていたりします。2Tのストレージに慣れたらもう無料版には戻れないだろうな……と思いつつ、月額2900円を課金しました。
でもAI Studioのほうがいいかも
ただGemini Advancedにはいろいろ不可解なところがあります。実はGeminiのほかにもGoogleのAIサービスはあって、その一つがAI Studio。これはGeminiのモデルを実験的に使えるサービスとされていますが、実はやれることはAI Stuidioのほうが多いんですよね。
例えば、本当に最新のモデルはGemini Advancedよりも先にAI Stuidioのほうに展開されます。
どのくらい独創的な出力にするかを決める「Temperature」や検索を可能にするかどうかなど、こまかな設定も可能。ハラスメントやヘイト、セクシャリティ、危険なコンテンツなどのセイフティ設定もパラメータを調整できます。
なにより違うのは、サポートフォーマット。100万コンテキストウインドウがあるなら、音声とかも読み込ませたいじゃないですか。ところがGemini Advancedのほうはm4aファイルを読み込めないのに、AI Stuidioは読み込めるのです。さらにAI StudioはURL形式でYouTubeを読み込むこともできます。
そしてなんと、AI Studioのほうは100万じゃなくて200万コンテキストウインドウなのです。そして当然AI Stuidioは無料。いかにも開発者向けというUIを除けば、実は自由度が高いのはAI Studioなんじゃないか?と思うくらいです。
ただし、AI StudioはAPIを生で叩くのと同じような仕組みになっていて、チャットアプリケーションとしてのチューニングは今ひとつです。Gemini Advancedはどれだけやり取りしても、冷静な反応を返してくれますが、AI Studioはたまに発狂したかのように同じ言葉を永遠を出力するようになってしまったりするのです。
一卵性双生児だけど、しっかり教育されしつけられたGemini Advanced、荒削りで制約が少なく無料!だけどたまに発狂するAI Studioという感じでしょうか。
そんなわけで、Geminiイマイチじゃんと思っている人は、ぜひ一度2.5 Proを試してみてもらえればと思っています。このところはイチオシです。