
世界中に拠点を持つグローバルカンパニー
Tenstorrentは、RISC‑Vアーキテクチャを採用したハイエンドCPUとAI向けコンピューティングプラットフォームを開発・販売する次世代半導体企業。
オープンRISC‑VプロセッサIPの提供に加え、AIに最適化したチップ、ボード、サーバーを車載、エンタープライズ、スーパーコンピュータなど多彩な分野へ届け、加速するデータ処理ニーズに応えます。日本法人テンストレントジャパン株式会社は2023年1月に設立されました。
オープンRISC‑VプロセッサIPの提供に加え、AIに最適化したチップ、ボード、サーバーを車載、エンタープライズ、スーパーコンピュータなど多彩な分野へ届け、加速するデータ処理ニーズに応えます。日本法人テンストレントジャパン株式会社は2023年1月に設立されました。
幅広い技術と製品分野
主な技術
製品分野
日本国内の主な活動
TenstorrentとRapidus社がパートナーシップを締結
RapidusとTenstorrentは2nmロジック技術に基づくエッジAI半導体IPを共同開発にむけたパートナーシップを締結。Rapidus千歳IIM‑1で2025年試作、2027年量産を予定。RISC‑Vチップレット技術と国産先端製造を融合し、高性能かつ低消費電力デバイスの早期提供を目指します。
2nmロジック技術による
エッジAIアクセラレータの開発(NEDOプロジェクト)
エッジAIアクセラレータの開発(NEDOプロジェクト)
NEDO採択のLSTCプロジェクトで2nm世代エッジAIアクセラレータを共創。TenstorrentがRISC‑V CPU、AIDCがアクセラレータ設計、Rapidusが製造を担当し、生成AI対応の省電力演算基盤を国際連携で構築、迅速な市場投入を図ります。
国内半導体人材育成プロジェクト(NEDOプロジェクト)
LSTCとTenstorrentはNEDO「最先端デジタルSoC設計人材育成」事業に採択され、シングルナノ設計OJTを含むカリキュラムで設計エンジニアを養成。実践的研修で即戦力人材を創出し、日本半導体産業の競争力を底上げします。

製品の位置づけ 同じ基本アーキテクチャ、同じSDKで組込みからHPCまでをカバーする製品群
AI/MLアクセラレーター(Core Silicon Roadmap)
•小さいRISC-Vによる動的な制御 → 少ない、遅いDRAMでも GPUに対抗できる。
•Ethernetによるチップ直接結合 → ネットワークベンダに依存せずシステムを大型化できる。
•AI機能(FP8演算精度)に特化した設計、電力/面積あたりの演算効率を高く保つ。
•Ethernetによるチップ直接結合 → ネットワークベンダに依存せずシステムを大型化できる。
•AI機能(FP8演算精度)に特化した設計、電力/面積あたりの演算効率を高く保つ。
Wormhole™
•80 Tensix+ Cores
•12nm
•292 TFLOPS (FP8)
•164 TFLOPS (BLOCKFP8)
•16 lanes of PCIe Gen 4
•16x100 Gbps Ethernet
•6 channels GDDR6
•80 Tensix+ Cores
•12nm
•292 TFLOPS (FP8)
•164 TFLOPS (BLOCKFP8)
•16 lanes of PCIe Gen 4
•16x100 Gbps Ethernet
•6 channels GDDR6
Wormhole™ n150s/n150d
TC-02001(n150s), TC-02002(n150d)*
•72 Tensix Cores @ 1 GHz
•12GB GDDR6 RAM @ 288 GB/s
•108MB SRAM
•262 TFLOPS (FP8)
148 TFLOPS (BLOCKFP8)
•2x QSFP-DD 400GbE ports
2x Warp 100 Bridge slots
•Dual-slot, 160W TBP
TC-02001(n150s), TC-02002(n150d)*
•72 Tensix Cores @ 1 GHz
•12GB GDDR6 RAM @ 288 GB/s
•108MB SRAM
•262 TFLOPS (FP8)
148 TFLOPS (BLOCKFP8)
•2x QSFP-DD 400GbE ports
2x Warp 100 Bridge slots
•Dual-slot, 160W TBP
Wormhole™ n300s/n300d
TC-02003(n300s), TC-02004(n300d)*
•128 Tensix Cores @ 1 GHz
•24GB GDDR6 RAM @ 576 GB/s
•192MB SRAM
•466 TFLOPS (FP8)
262 TFLOPS (BLOCKFP8)
•2x QSFP-DD 400GbE ports
2x Warp 100 Bridge slots
•Dual-slot, 300W TBP
TC-02003(n300s), TC-02004(n300d)*
•128 Tensix Cores @ 1 GHz
•24GB GDDR6 RAM @ 576 GB/s
•192MB SRAM
•466 TFLOPS (FP8)
262 TFLOPS (BLOCKFP8)
•2x QSFP-DD 400GbE ports
2x Warp 100 Bridge slots
•Dual-slot, 300W TBP

ワークステーション
LLama3.3-70B, Qwen-72Bを最大32並列で処理できる
TT-LoudBOX
TT-QuietBOX
CPU | 2x Intel® Xeon® Silver 4309Y (8C/16T ea., up to 2.8GHz, 105W) |
---|---|
Memory | 512GB (16x32GB) DDR5-4800 |
Storage | 3.8TB U.2 PCIe 4.0 x4 |
Ethernet | 2x 10GbE |
Tensix Processors | 4x Wormhole™ n300s 96GB GDDR6, 768MB SRAM Connected in 2x4 mesh |
TeraFLOPS (FP8) | 1864 |
TeraFLOPS (BLOCKFP8) | 1048 |
TeraFLOPS (FP16) | 524 |
CPU | AMD EPYC™ 8124P (16C/32T, up to 3GHz, 125W) |
---|---|
Memory | 512GB (8x64GB) DDR5-4800 |
Storage | 3.8TB U.2 PCIe 4.0 x4 |
Ethernet | 2x 10GbE, 2x 1GbE |
Tensix Processors | 4x Wormhole™ n300, Liquid-Cooled |
TeraFLOPS (FP8) | 1864 |
TeraFLOPS (BLOCKFP8) | 1048 |
TeraFLOPS (FP16) | 524 |
サーバー(Galaxy™ Wormhole Server)
LLama3.2-405B, DeepSeed-r1-625B等大型モデル実行に最適
Wormhole™ ASIC | Wormhole™ Tray | Tenstorrent Galaxy™ Wormhole Server |
|
---|---|---|---|
Form Factor | Soldered to UBB | UBB | 6U |
Units per Server | 32 | 4 | 1 |
Tensix Cores | 80 @ 1 GHz* | 640 @ 1 GHz* | 2,560 @ 1 GHz* |
GDDR6 Memory | 12GB @ 12 GT/sec* | 96GB @ 12 GT/sec* | 384GB @ 12 GT/sec* |
SRAM | 120MB | 960MB | 3.84GB |
Power | 250W* | 2 kW* | 11 kW* |
Topology | - | - | 4x8 Mesh |
Internal Bandwidth | - | 4x100GbE chip-to-chip | 51.2 Tbps |
TeraFLOPS (FP8) | 292* | 2.3 PetaFLOPS* | 9.32 PetaFLOPS* |
TeraFLOPS (BLOCKFP8) | 164* | 1.3 PetaFLOPS* | 5.24 PetaFLOPS* |
TeraFLOPS (FP16) | 82* | 656* | 2.62 PetaFLOPS* |
Galaxy™
Wormhole Server
Wormhole Server

Software製品概要紹介 Tenstorrent Open Source Software
TT-Forge – Integrated into various frameworks
for native model ingest
•各フレームワークの計算グラフをTT-MLIRへコンパイル
for native model ingest
•各フレームワークの計算グラフをTT-MLIRへコンパイル
TT-MLIR – New MLIR-based compiler
•MLIRベースのDNNコンパイラ
•TTデバイスターゲットに最適化
•MLIRベースのDNNコンパイラ
•TTデバイスターゲットに最適化
TT-NN™ – Library of optimized operators
•Torch ATenライクな命令群
•Python APIからTT-Metaliumを実装
•Torch ATenライクな命令群
•Python APIからTT-Metaliumを実装
TT-Metalium™ – Low-level programming model
and entry point
•TTデバイスターゲットのカーネル/ランタイム
and entry point
•TTデバイスターゲットのカーネル/ランタイム
日本語LLM の動作実績
Qwen
abeja/ABEJA-Qwen2.5-32b-Japanese-v0.1
cyberagent/
DeepSeek-R1-Distill-Qwen-32B-Japanese
Llama
elyza/Llama-3-ELYZA-JP-8B
sbintuitions/sarashina2-70b
tokyotech-llm/
Llama-3.1-Swallow-8B-Instruct-v0.3
Mistral
Rakuten/RakutenAI-7B-instruct