Essay文責野田大貴 / Taiki Noda05 / 174 min readEnglish version →

antirez の DS4 と、Pure Go OSS を兼業で出している自分が見ているもの

Redis を独りで作った antirez が、DS4 という LLM 推論エンジンを書いている。兼業 Pure Go OSS 作者として何を学べるか。

朝の antirez 通信から

antirez.com に "A few words on DS4" という短い記事が流れていました。Salvatore Sanfilippo が DeepSeek V4 Flash 向けのネイティブ推論エンジン DS4 の近況を 1 本に書きまとめています。Metal と CUDA のデュアルバックエンド化、MacBook 上で 284B パラメータのローカル推論、構築中に GPT-5.5 をかなり使った、と続きます。Redis を独りで書いた人が、Redis 以後にもまだ独りで新しいものを書いています。

この事実だけで、今日は他のどの記事より先に DS4 の記事に 1 時間使っていいと判断しました。

「独りで書いた」が指している範囲

DS4 という名前は控えめですが、書かれていることは大きいです。LLM 推論ランタイムを Metal / CUDA の両方に対応させる、というのは、CUDA カーネルを書ける人を 1〜2 人、Metal のシェーダに慣れた人を 1〜2 人、それを統合する人をもう 1 人、と並べたくなるサイズの仕事です。普通はそういう構成で組みます。

antirez はその構成を採りません。Redis の頃から、コア部分を自分で書き、外側を必要なときだけ薄く広げるスタイルを変えていません。記事の中で「大規模リファクタリングを経て」と書いてありますが、リファクタリングを独りでやるというのは、設計の判断が一切薄まらないという意味でもあります。委譲した瞬間にどこかが折れる、ということを知っていて、わざと折らないでいる。

これは「彼が天才だから」で片付けたくない論点です。Redis の発明から十数年経って、ローカル LLM 推論という別ドメインに移っても同じパターンが効いている、という事実のほうが重要だと感じています。1 人で深く触る、というのはドメインに依存せず再現性を持つ働き方らしい、という 1 つのデータ点として読めます。

私が gpdf の CJK フォントサブセット化を 2 週間で Pure Go で書き上げたとき、ずっと選択肢の隅に「FreeType を CGO で呼べばいい」が浮いていました。実装の途中で何度か、その隅の選択肢を取らなかった理由を疑いました。あの 2 週間の判断を、antirez の DS4 が間接的に肯定してくれている感覚があります。同じことを違うドメインで、もっと長い時間軸でやってきた人がいる、というのは精神的に効くものでした。

クラウド API ゼロのスタックという思想

DS4 のもう 1 つの面白さは、目的そのものにあります。MacBook 上でローカル 284B パラメータ推論を回せるようにする。これはクラウド API への依存をゼロにできる範囲を、もう一段押し広げる方向の仕事です。

私は gpdf を Pure Go のゼロ依存で書いています。理由は CGO を入れた瞬間にクロスコンパイルの自由を失うこと、それから利用者のビルド環境に CGO の追加要求を出したくないこと、の 2 点です (Pure Go で zero-dependency の PDF ライブラリを作った話で詳しく書きました)。

DS4 はこれを LLM 推論のレイヤーでやっています。OpenAI / Anthropic / Google の API を叩く代わりに、自分のマシン上でモデルを動かす。ローカルで動かせれば、API キーの管理、レート制限、コスト、データ送信ポリシー、すべてが消えます。クラウド側にデータを出さない、という選択肢が現実的になります。

私自身は LLM 推論を Go で実装する予定はありません (やる能力もない、と正直に書いておきます)。ですが、思想のレイヤーは強く重なります。外部依存を 1 つ減らすたびに、配布と運用の自由度が階段状に上がる、というのが Pure Go OSS を 4 本書いた現在地での感触です。DS4 がやっているのは、その階段を「クラウド AI 推論」というもう 1 段上で同じ形で実装しに来ることに見えます。

2026 年に「ローカルで完結する開発スタック」を組もうとすると、エディタ層はローカル LLM (Ollama / llama.cpp 系)、ライブラリ層は Pure Go や Rust の zero-dep 実装、デプロイ層は single binary、という積み方になります。DS4 はその一番上の段、推論ランタイムを 1 人で書くという選択肢を、現実的なオプションとして残しに来ています。

GPT-5.5 で構築した、というメタ

antirez の記事で個人的に一番目を引いたのは「GPT-5.5 を使って構築した」という 1 行のメタでした。

Redis を書いた人が、新しいプロジェクトの中で AI コーディングアシスタントをかなり活用している、と公の場で書いています。これは「AI コーディングは初心者の補助輪」という見方への、強い反例として記録に残ると思っています。最も慣れた個人開発者ですら、AI を使った方が同じドメインを深く速く触れる、という事実関係を、彼が認めています。

私は gpdf v1.0.0 のリリースまで、AI を「困ったときに 5 分だけ聞く」用途で使っていました。Claude Code を本格的に常時走らせる体制に切り替えたのは v1.0.0 の後です。切り替え後、テスト網羅と _benchmark の追加にかかる時間が、体感で 3〜5 割落ちています。抽象的な「AI で生産性が上がる」ではなく、「自分が触る時間を取らずに自然と網羅が増える」というレイヤーで効いている、という温度感です。

antirez が GPT-5.5 で DS4 を書いている、という事実は、この体感が個人 OSS 領域で広く起きている同型のシフトであることを示している気がします。彼を真似ろ、ではなく、彼がやっているのと同じ条件は自分にも揃っている、と読むのが正しい使い方だと思っています。

質問への応答

「antirez は天才だから独りで作れる。普通の個人開発者の参考にならない」

半分は正しく、半分は外しています。彼が Redis を書いた人だから DS4 の設計を間違えにくい、という能力差はあります。否定しません。

ただし、独りで作るという働き方そのものは才能の話ではありません。週ごとに 1 プロジェクトに絞る、コアは委譲しない、外側だけ薄く広げる、という運用上の判断は、誰でも採れます。問題は能力の差ではなく、判断の選び方の差です。

天才性の話ではなく、「複雑なものを 1 人で長く触る」という働き方が 2026 年に成立するか、という問いに対する 1 つのデータ点として読むのが、再現性のある読み方です。

今朝の他に読むべき記事

DS4 以外にも、今朝の枠で読む価値があると判断した記事をジャンル横断で 6 本置いておきます。

arXiv が幻覚引用を含む論文提出者を 1 年 BAN へ (404 Media / Hacker News) LLM で書いた論文に幻覚引用が混じったまま提出するケースが 2023 年比で約 10 倍、277 本に 1 本の頻度に。一発 BAN、その後の投稿は査読誌掲載必須。OSS の README / docs を LLM で書くときに「引用は人間が確認する」を運用に組む直接の根拠になる事例。
What happens when AI starts building itself? (TechCrunch) Richard Socher と Peter Norvig が Recursive Superintelligence を $650M で立ち上げ。AI が自身を再帰的に改善する、と宣言。個人 OSS 文脈でどう作用するかはまだ不明ですが、「数四半期以内に製品」と言い切っている時間軸は記録しておきたいです。
Ten Data-Backed Truths Of User Experience ROI (Smashing Magazine) 「UX 投資 1 ドルあたり 100 ドルの ROI」「ページ速度 1.2 秒削減で成約率 +12%」など、UX を見た目論ではなく収益軸で語る 10 のデータ。gpdf の README ページや gsql のドキュメント設計を見直すときの数字の出典として使えます。
The Future-Proof Designer (Nielsen Norman Group) デザイナーの最大の課題は「組織のステークホルダー調整」であり「UI スキル」ではない、という NNg のレポート。1 人で SaaS とプロダクトページを設計する個人開発者にとって、組織がない代わりに 1 人で複数役を回すという意味で同じ問題を扱っています。
Announcing the Zulip Foundation (Zulip Blog) Zulip 創業者の Tim Abbott が Anthropic に転職、製品は Zulip Foundation に移管。Mozilla / Signal 型の非営利移管モデル。創業者の退場と製品の継続をフォークなしで両立する 1 事例として残しておきたいです。
California's Protect Our Games Act が本会議へ (TechTimes) オンラインゲームのサービス終了 60 日前告知 + オフライン版提供 / 全額返金の義務化案。SaaS の規約や Sunset 設計にも飛び火する可能性が高い領域。renma の利用規約を書くときに 1 度立ち止まる材料として記録。

← 前の記事『テキストにぶつかるまでネイティブで』を読んで、Pure Go の PDF を思い出した次の記事 →NN/g が『小規模デザインシステムは戦略』と言った朝に、micro SaaS を 3 つ持つ自分が考えたこと