Categories

130 ページ目

コンピューター

大規模AIモデル企業がIPOへ殺到も、利益はまだ見えない(未黒字)

最近、大規模モデル(LLM)関連企業の資本の動きを見ると、二つの事柄を混同しやすいです。

知譜(ZhiPu)とMiniMaxはどちらもA株(中国本土株式)上場の道を推し進めている。AnthropicはすでにSECにS-1のドラフトを秘密裏に提出しており、OpenAIもまたAxiosによって機密のIPO目論見書(prospectus)の準備を進めていると報じられている。こうした複数のニュースが並ぶことで、この業界がついに収穫期を迎えたように見える。

しかし、上場ウィンドウがオープンしたからといって、利益のウィンドウが開いたわけではありません。大規模言語モデル(LLM)企業に収入がないわけではなく、高いスピードで成長しているものもあります。真にまだ広く実現していないのは、純利益、営業キャッシュフロー、そして持続可能なモデルへの投資という勘定です。

Codex goalは、完了基準をタスク自体に委ねること

/goal は、「agent にしばらく動作を続けさせる」という命令だと誤解されやすいです。

これは当然、その表象にすぎません。Codexに目標を与えるだけで、その目標を中心に継続的に推し進めることができ、一度の回答で止まるわけではありません。しかし、真に注目すべき点は「長く稼働できること」ではなく、「何が完了と見なされるか(終了条件)」という概念を一時的なリマインダーからタスク自体の一部へと昇華させた点です。

通常のプロンプト(prompt)は、次に何をすべきかを述べています。それに対し、goal は、エージェントに対して『受入チェックリスト』を渡しているようなものです:目標が何か、境界線(スコープ)はどこか、どの検証項目を通過する必要があるか、そして作業完了のために満たすべき条件とは何か、といった要素を定義しています。

ChatGPTが公開された後、NVIDIAのデータセンター向けGPUはどのように進化するでしょうか?

まず、時期を明確にしましょう。ChatGPTの公開研究プレビュー版は、2023年ではなく、2022年11月30日にリリースされました。[1]

この時期以降、NVIDIAのデータセンターGPUのメインラインは非常に明確です。Ampereが終息し、Hopperに引き継がれ、Hopperは大容量メモリを刷新し、そしてBlackwellが重心を「単一カードでの高密度計算能力」から、「推論スループット、消費電力、システム全体レベルの相互接続性」へと移していくという流れです。対照的に、中国向け特別仕様ラインは別の物語があります。A800、H800、H20といったものは、本質的には米国の輸出規制の制約の下で作られた

AIがコードを書き始めたけど、新人は何でスキルアップすればいいの?

ここ数ヶ月、ClaudeやCodexといったツールを使ってコードを書いている中で、最も強く感じているのは、「プログラマーが不要になる」ということではなくて、以前は新人に練習課題として出していたような作業まで、AIがすでに叩き台(ドラフト)を生成してくれることだ。

スキャフォールドの作成、いくつかのテストの追加、ついでに小さな機能を修正する…という操作を続けていくと、その速度があまりにも速くて、なんとも言えない「意難平」な気分になる。

私のような卒業から10年が経過した人間にとって、正直なところ、これは主に効率化の問題です。なぜなら、どこを信じてよいか、どこを信用してはいけないか、そして表面上は動作しているように見えても、実は後に罠(落とし穴)がある場所などを概ね把握しているからです。しかし、新卒者にとっては、この問題はそれほど簡単ではありません。AIは単に数時間の肉体労働を奪ってくるだけでなく、「初心者がどうやって無知から熟練へとなるか」という確立された道筋そのものを圧縮してしまっているようなものです。これが私が改めて書きたいと考えている点でもあります。

トークンが少ないのに、なぜGPT-5.5はCodexでかえって高くなったのですか?

呆然とした。

ChatGPTの公式側では、トークンや費用を直接確認するのが難しいため、サードパーティのプラットフォームを利用して、CodexでGPT-5.4とGPT-5.5を用いて同種のタスクを一度実行しました。思考モードはすべてhighに設定しています。結果は非常に明快でした。簡単な問題については比較的穏やかで、GPT-5.5はGPT-5.4よりおよそ30%高価です。しかし、複雑なタスクになると、費用が直接2.6倍に跳ね上がり、リクエスト回数とトークン消費量も共に増加

私自身の判断も非常にストレートに申し上げますが、これは単に「5.5のほうが単価が高い」という一言で片付けられる問題ではありません。簡単なタスクの場合、費用は主に単価が要因となります。しかし、複雑なタスクの場合、実際にかかっているコストは、その呼び出しチェーン(処理の一連の流れ)全体です。

とはいえ、逆から見ると、5.5はあなたの手戻り(作り直し)のコストを肩代わりしてくれている側面があります。モデル側がより深く考え、より多くの工程を経て実行し、より多くチェックしてくれるため、最終的に請求されるのは単一の回答に対する費用ではなく、一連のアクション全体に基づいた費用になります。結果として、人間側も何度もやり取りをして手間取る回数が減ります。

このモデル競争は、すでに価格やチップのレベルまでエスカレートしている。

今夜、モデルのメッセージを追っていると、本当に目が点になった。

公式サイトのタイムラインを見ると、今回の集中更新は連続していることが分かります:2026-04-20 にMoonshotがKimi K2.6をトップページに掲げました。2026-04-22にはXiaomiが正式にMiMo-V2.5MiMo-V2.5-Proをリリースし、2026-04-23にはOpenAIがGPT-5.5を公開し、API料金も同時に引き上げられました。そして2026-04-24にはDeepSeekがまたV4 Previewを推しました。ついでに言うと、グループチャットでよく話題になる「Xiaomi 2.5」というのは、厳密に言えばぼんやりとしたコードネームではなく、Xiaomi MiMo-V2.5 / V2.5-Proのことを指します。

私の現在の判断は非常に明確です。今回の波は単なるモデルのリリースブームではなく、3つの要素が同時にぶつかり合っています――すなわち、**モデル能力、API価格設定、チップスタックの支配権(または所有権)**です。これらの一つだけを語る人は、基本的に視点が偏りがちです。この三つの要素が絡み合うからこそ、大規模言語モデル(LLM)という分野はこれほどまでに過熱しているのです。

最強モデルを先にロックし、AI企業がゲートキーパーになり始めた

この数日、Anthropic が 2026 年 4 月 7 日にリリースする「Project Glasswing」を見かけましたが、最初に感じたのはちょっと呆れました。それはまたモデルのスコアが高くなったからではなく、最も強力な能力を最初から特定のグループ(AWS、Apple、Google、Microsoft、Linux Foundationといった守備側)にロックしてしまったからです。

私自身の判断は非常に直接的です。この件は、また別のベンチマークで記録を更新することよりも重要です。最先端のAI企業が今売っているのは、もはやモデルそのものだけではなく、「誰が能力を手に入れられるか、どれだけの能力を手に入れられるか、そして手に入れた後にどのような監査や制約を受けるか」という一連のアクセス制御システムです。モデルはますます危険なツールに近づいており、リリースペースもライセンスの発行に似てきています。