これまでの生成AI開発といえば、米OpenAIがリードし他がそれを追う。そしてオープンソースとしてLlamaを提供するMetaが別路線で開発競争を繰り広げてきました。ところが、ここに来て彗星のように現れたのが中国のDeepSeekです。
DeepSeekとは?
DeepSeekとは中国のDeepSeek社が提供する生成AIモデルです。オープンソースで提供されながら、OpenAIのo1に相当する性能をもっていることで一躍話題の中心となりました。
創業者の梁文峰(Liang Wenfeng)氏は1980年代の生まれ。AIを使ったクオンツ運用の投資会社を立ち上げ、80億ドルもの収益を上げたと言われています。運用用に整備したGPUと投資利益を使い、DeepSeekを開発したとされています。
DeepSeekモデルの特徴は次の通りです。
- o1を超える高性能
- オープンソース 蒸留された小サイズ版も提供さえておりローカル環境でも動作可能
- 超低コスト サーバ提供版のAPIコストは、o1の10分の1、o1-miniの5分の1
- 思考内容も公開
現在、通常モデルのV3と思考モデルのR1があり、R1ではWebサイト閲覧機能もオンにすることができます。これは現在o1でも実現できていない機能です。
下記は各種AIベンチマークによるDeepSeek-R1の成績です。ほとんどでo1相当の性能を持っていることが示されています。

これの何が衝撃なのかというと、月額300ドルで提供されるOpenAIの最新モデルに相当するものが、遥かに低コストで提供され、しかもオープンソースだということ。さらに、GPU輸出規制下の中国で開発されたものだということが、話題になっています。
Web版のチャットのほか、スマホアプリも提供されていて、早くもランキング上位に食い込んでいます。
素晴らしい精度と速度
DeepSeek-R1の最大の特徴は、ネット検索と思考を同時に走らせられる点にあります。これは複雑な調査を行わせるのに最適。そこで、日本のiDeCo制度の改悪の歴史について調べてもらいました。

結果、下記のようにある程度検索結果を踏まえてまとめてくれます。

これは、Google GeminiのDeep Researchに似た機能ですが、有料でしか使えないGeminiに対しDeepSeekは無料。しかも分析について思考させられる点が優位点です。
さて、下記は初出時のサンプルですが、不適切でした。つくだに博士御自らご指摘いただきましたが、DeepSeek-R1は内部的にコードを実行させることができません。またo1もできません。
現在のところ、メジャーどころでコードを内部実行できるのは、GPT-4o、そしてClaude3.5といったところのです。
DeepSeekの性能を見るために、つくだに博士が作成したリタイアシミュレーションプロンプトを動かしてみましょう。
資産1億円で50歳でリタイアします。51歳から65歳まで、毎年500万円を取り崩します。66歳以降は毎年400万円を取り崩します。運用結果は μ=7%、σ=20% の幾何ブラウン運動に従うと仮定します。毎年の死亡確率は、0代: 0.00056, 10代: 0.00028, 20代: 0.00063, 30代: 0.0014, 40代: 0.0021, 50代: 0.0035, 60代: 0.007, 70代: 0.014, 80代: 0.035, 90代: 0.14, 100以降: 0.35 とします。死ぬまで資産が尽きない確率を、シミュレーションして求めてください。
結果は10行で簡潔に出力すること。

数分間の中国語での思考の結果、出力は下記のようになりました。
- 資産枯渇せずに死亡する確率: 78.3%
- 平均死亡年齢: 84.1歳
- 最大資産残高: 5.7億円
- 最小資産残高(失敗時): -2,300万円
- 60歳時点の生存率: 96.5%
- 70歳時点の生存率: 72.8%
- 80歳時点の生存率: 34.2%
- 90歳以上の生存率: 9.7%
- 平均資産推移(成功例): 1.8億円
- 標準偏差(リスク指標): 1.2億円
同様の問をChatGPT-4oに与えた場合の回答は下記です。

またAnthropic Claude3.5 sonnetに与えた場合の回答はつぎのようになりました。
モンテカルロシミュレーションを使って、この退職プランの成功確率を計算します。View analysisJavascriptExpandCopyfunction simulateRetirement(initialAssets, simulations = 10000) {
const mu = 0.07;
const sigma = 0.20;
let successCount = 0;const deathProbabilities = {
50: 0.0035, 60: 0.007, 70: 0.014,
80: 0.035, 90: 0.14, 100: 0.35
};for (let sim = 0; sim < simulations; sim++) {
let assets = initialAssets;
let age = 50;
let isAlive = true;
let isBankrupt = false;while (isAlive && !isBankrupt) {
// 年間支出を決定
const withdrawal = age < 66 ? 5000000 : 4000000;
// 資産運用のシミュレーション
const normalRandom = Math.sqrt(-2 * Math.log(Math.random())) *
Math.cos(2 * Math.PI * Math.random());
const return_rate = Math.exp((mu - 0.5 * sigma * sigma) + sigma * normalRandom) - 1;
assets = assets * (1 + return_rate) - withdrawal;
// 破産チェック
if (assets <= 0) {
isBankrupt = true;
continue;
}// 死亡判定
age++;
const deathProb = deathProbabilities[Math.floor(age / 10) * 10] || 0.35;
if (Math.random() < deathProb) {
isAlive = false;
}
}if (!isBankrupt) {
successCount++;
}
}return successCount / simulations;
}const successRate = simulateRetirement(100000000);
console.log(`シミュレーション結果:`);
console.log(`成功確率: ${(successRate * 100).toFixed(1)}%`);
Resultシミュレーション結果:
成功確率: 67.0%シミュレーション結果の要約:初期資産1億円、51-65歳は年500万円、66歳以降は年400万円を取り崩すプランにおいて、
運用収益率は平均7%、標準偏差20%の対数正規分布を仮定し、
年齢別死亡確率を考慮したモンテカルロシミュレーション(10,000回)の結果、
死亡までに資産が尽きない確率は約67.0%となりました。この結果は、このリタイアプランには中程度のリスクがあることを示唆しています。リスクを下げるためには、支出を抑えるか、より保守的な運用戦略を検討することが考えられます。
リスクと課題
素晴らしい性能を持つDeepSeek-R1ですが、リスクや課題もあります。最大の点は中国製だということです。開発において、適切なデータが使われているのかは分かりません。例えばOpenAIは、OpenAIの出力を用いて他のAIを学習することを禁じていますが、DeepSeekがそれらを守っているかは不明です。
入力したデータの取り扱いにも安心できない点があります。入力したデータが学習に使われないかの確証を得ることはできません。また中国当局がそのデータを把握できる可能性もあります。もっともオープンソースとしても提供されているので、モデルをダウンロードしてローカルで動かせば、入力したデータの秘匿性は確保できるでしょうけど。
また巧妙な学習がされていて、出力したコードにバックドアが仕込まれるのではないか? といった懸念も取り沙汰されています。実際、天安門などについて尋ねると、回答を拒否、または回答したあとすぐに消去するなどの挙動を示します。中国当局の意向に配慮した作りになっていることは間違いありません。
米中のAI戦争の幕開けは何を意味するか
これまでAI開発においては米国が独走しているように見えました。しかしDeepSeekの登場で、完全に中国が追いついたといえるでしょう。DeepSeek以外にもByteDanceなども高性能なLLMを公開し話題になっています。正直、AIモデルについては中国の躍進は要注意です。
これは2つのことを意味していると思っています。一つはGPUニーズはさらに高まるということ。今日1月28日は、NVIDIAを始めハイテクAI銘柄が大きく下落し「中国DeepSeekの台頭懸念」なんて報道もされましたが、これは短期的に上がりすぎた株価の調整だと思っています。

DeepSeekは別にNVIDIA GPU不要で何かを開発したというものではありません。公式には1万台のA100GPUを使ったとされていますし、5万台のH100 GPUを非公式に入手して使っているというような噂もあります。
2つ目は、DeepSeekの登場は、米中でさらなるAI開発競争が激化することを意味していていることです。それは、下記の記事で言及した論文が指摘しているように、「超知能をリードする者は、決定的な軍事的優位に立つ」からです。

すでにMeta社内ではDeepSeekに対する非常事態宣言が出されたそうです。OpenAIも、今後4年間で5000億ドル(70兆円!)を投資するStargate計画を発表しました。ここから先、AIはひたすら半導体リソースと電力を食って成長を続けるでしょう。そしてそれは早晩、米中の軍拡競争の様相を帯びることになるでしょう。