世界中に拠点を持つグローバルカンパニー
Tenstorrentは、RISC‑Vアーキテクチャを採用したハイエンドCPUとAI向けコンピューティングプラットフォームを開発・販売する次世代半導体企業。
オープンRISC‑VプロセッサIPの提供に加え、AIに最適化したチップ、ボード、サーバーを車載、エンタープライズ、スーパーコンピュータなど多彩な分野へ届け、加速するデータ処理ニーズに応えます。日本法人テンストレントジャパン株式会社は2023年1月に設立されました。
幅広い技術と製品分野
主な技術
製品分野
日本国内の主な活動
TenstorrentとRapidus社がパートナーシップを締結
RapidusとTenstorrentは2nmロジック技術に基づくエッジAI半導体IPを共同開発にむけたパートナーシップを締結。Rapidus千歳IIM‑1で2025年試作、2027年量産を予定。RISC‑Vチップレット技術と国産先端製造を融合し、高性能かつ低消費電力デバイスの早期提供を目指します。
2nmロジック技術による
エッジAIアクセラレータの開発(NEDOプロジェクト)
NEDO採択のLSTCプロジェクトで2nm世代エッジAIアクセラレータを共創。TenstorrentがRISC‑V CPU、AIDCがアクセラレータ設計、Rapidusが製造を担当し、生成AI対応の省電力演算基盤を国際連携で構築、迅速な市場投入を図ります。
国内半導体人材育成プロジェクト(NEDOプロジェクト)
LSTCとTenstorrentはNEDO「最先端デジタルSoC設計人材育成」事業に採択され、シングルナノ設計OJTを含むカリキュラムで設計エンジニアを養成。実践的研修で即戦力人材を創出し、日本半導体産業の競争力を底上げします。
製品の位置づけ 同じ基本アーキテクチャ、同じSDKで組込みからHPCまでをカバーする製品群
AI/MLアクセラレーター(Core Silicon Roadmap)
•小さいRISC-Vによる動的な制御 → 少ない、遅いDRAMでも GPUに対抗できる。
•Ethernetによるチップ直接結合 → ネットワークベンダに依存せずシステムを大型化できる。
•AI機能(FP8演算精度)に特化した設計、電力/面積あたりの演算効率を高く保つ。
Wormhole™ 
•80 Tensix+ Cores
•12nm
•292 TFLOPS (FP8)
•164 TFLOPS (BLOCKFP8)
•16 lanes of PCIe Gen 4
•16x100 Gbps Ethernet
•6 channels GDDR6
Wormhole™ n150s/n150d
TC-02001(n150s), TC-02002(n150d)*
•72 Tensix Cores @ 1 GHz
•12GB GDDR6 RAM @ 288 GB/s
•108MB SRAM
•262 TFLOPS (FP8)
 148 TFLOPS (BLOCKFP8)
•2x QSFP-DD 400GbE ports
 2x Warp 100 Bridge slots
•Dual-slot, 160W TBP
Wormhole™ n300s/n300d
TC-02003(n300s), TC-02004(n300d)*
•128 Tensix Cores @ 1 GHz
•24GB GDDR6 RAM @ 576 GB/s
•192MB SRAM
•466 TFLOPS (FP8)
 262 TFLOPS (BLOCKFP8)
•2x QSFP-DD 400GbE ports
 2x Warp 100 Bridge slots
•Dual-slot, 300W TBP
ワークステーション
LLama3.3-70B, Qwen-72Bを最大32並列で処理できる
TT-LoudBOX
TT-QuietBOX
CPU 2x Intel® Xeon® Silver 4309Y
(8C/16T ea., up to 2.8GHz, 105W)
Memory 512GB (16x32GB) DDR5-4800
Storage 3.8TB U.2 PCIe 4.0 x4
Ethernet 2x 10GbE
Tensix Processors 4x Wormhole™ n300s
96GB GDDR6, 768MB SRAM
Connected in 2x4 mesh
TeraFLOPS (FP8) 1864
TeraFLOPS (BLOCKFP8) 1048
TeraFLOPS (FP16) 524
CPU AMD EPYC™ 8124P
(16C/32T, up to 3GHz, 125W)
Memory 512GB (8x64GB) DDR5-4800
Storage 3.8TB U.2 PCIe 4.0 x4
Ethernet 2x 10GbE, 2x 1GbE
Tensix Processors

4x Wormhole™ n300, Liquid-Cooled
96GB GDDR6, 768MB SRAM
Connected in 2x4 mesh

TeraFLOPS (FP8) 1864
TeraFLOPS (BLOCKFP8) 1048
TeraFLOPS (FP16) 524
サーバー(Galaxy™ Wormhole Server)
LLama3.2-405B, DeepSeed-r1-625B等大型モデル実行に最適
  Wormhole™ ASIC Wormhole™ Tray Tenstorrent Galaxy™
Wormhole Server
Form Factor Soldered to UBB UBB 6U
Units per Server 32 4 1
Tensix Cores 80 @ 1 GHz* 640 @ 1 GHz* 2,560 @ 1 GHz*
GDDR6 Memory 12GB @ 12 GT/sec* 96GB @ 12 GT/sec* 384GB @ 12 GT/sec*
SRAM 120MB 960MB 3.84GB
Power 250W* 2 kW* 11 kW*
Topology - - 4x8 Mesh
Internal Bandwidth - 4x100GbE chip-to-chip 51.2 Tbps
TeraFLOPS (FP8) 292* 2.3 PetaFLOPS* 9.32 PetaFLOPS*
TeraFLOPS (BLOCKFP8) 164* 1.3 PetaFLOPS* 5.24 PetaFLOPS*
TeraFLOPS (FP16) 82* 656* 2.62 PetaFLOPS*
Galaxy™
Wormhole Server
Software製品概要紹介 Tenstorrent Open Source Software
TT-Forge – Integrated into various frameworks
for native model ingest

•各フレームワークの計算グラフをTT-MLIRへコンパイル
TT-MLIR – New MLIR-based compiler
•MLIRベースのDNNコンパイラ
•TTデバイスターゲットに最適化
TT-NN™ – Library of optimized operators
•Torch ATenライクな命令群
•Python APIからTT-Metaliumを実装
TT-Metalium™ – Low-level programming model
and entry point

•TTデバイスターゲットのカーネル/ランタイム
日本語LLM の動作実績

Qwen

abeja/ABEJA-Qwen2.5-32b-Japanese-v0.1

cyberagent/
DeepSeek-R1-Distill-Qwen-32B-Japanese

Llama

elyza/Llama-3-ELYZA-JP-8B

sbintuitions/sarashina2-70b

tokyotech-llm/
Llama-3.1-Swallow-8B-Instruct-v0.3

Mistral

Rakuten/RakutenAI-7B-instruct

facebook twitter
Tenstorrentは、RISC‑Vアーキテクチャを採用したハイエンドCPUとAI向けコンピューティングプラットフォームを開発・販売する次世代半導体企業。
オープンRISC‑VプロセッサIPの提供に加え、AIに最適化したチップ、ボード、サーバーを車載、エンタープライズ、スーパーコンピュータなど多彩な分野へ届け、加速するデータ処理ニーズに応えます。
日本法人テンストレントジャパン株式会社は2023年1月に設立されました。
世界中に拠点を持つグローバルカンパニー
幅広い技術と製品分野
主な技術
製品分野
日本国内の主な活動
RapidusとTenstorrentは2nmロジック技術に基づくエッジAI半導体IPを共同開発にむけたパートナーシップを締結。Rapidus千歳IIM‑1で2025年試作、2027年量産を予定。RISC‑Vチップレット技術と国産先端製造を融合し、高性能かつ低消費電力デバイスの早期提供を目指します。
NEDO採択のLSTCプロジェクトで2nm世代エッジAIアクセラレータを共創。TenstorrentがRISC‑V CPU、AIDCがアクセラレータ設計、Rapidusが製造を担当し、生成AI対応の省電力演算基盤を国際連携で構築、迅速な市場投入を図ります。
LSTCとTenstorrentはNEDO「最先端デジタルSoC設計人材育成」事業に採択され、シングルナノ設計OJTを含むカリキュラムで設計エンジニアを養成。実践的研修で即戦力人材を創出し、日本半導体産業の競争力を底上げします。
LLama3.3-70B,
Qwen-72Bを最大32並列で処理できる
TT-LoudBOX
CPU 2x Intel® Xeon® Silver 4309Y
(8C/16T ea., up to 2.8GHz, 105W)
Memory 512GB (16x32GB) DDR5-4800
Storage 3.8TB U.2 PCIe 4.0 x4
Ethernet 2x 10GbE
Tensix Processors 4x Wormhole™ n300s
96GB GDDR6, 768MB SRAM
Connected in 2x4 mesh
TeraFLOPS (FP8) 1864
TeraFLOPS (BLOCKFP8) 1048
TeraFLOPS (FP16) 524
TT-QuietBOX
CPU AMD EPYC™ 8124P
(16C/32T, up to 3GHz, 125W)
Memory 512GB (8x64GB) DDR5-4800
Storage 3.8TB U.2 PCIe 4.0 x4
Ethernet 2x 10GbE, 2x 1GbE
Tensix Processors

4x Wormhole™ n300, Liquid-Cooled
96GB GDDR6, 768MB SRAM
Connected in 2x4 mesh

TeraFLOPS (FP8) 1864
TeraFLOPS (BLOCKFP8) 1048
TeraFLOPS (FP16) 524
LLama3.2-405B,
DeepSeed-r1-625B等大型モデル実行に最適
Galaxy™
Wormhole Server
  Wormhole™ ASIC Wormhole™ Tray Tenstorrent Galaxy™
Wormhole Server
Form Factor Soldered to UBB UBB 6U
Units per Server 32 4 1
Tensix Cores 80 @ 1 GHz* 640 @ 1 GHz* 2,560 @ 1 GHz*
GDDR6 Memory 12GB @ 12 GT/sec* 96GB @ 12 GT/sec* 384GB @ 12 GT/sec*
SRAM 120MB 960MB 3.84GB
Power 250W* 2 kW* 11 kW*
Topology - - 4x8 Mesh
Internal Bandwidth - 4x100GbE chip-to-chip 51.2 Tbps
TeraFLOPS (FP8) 292* 2.3 PetaFLOPS* 9.32 PetaFLOPS*
TeraFLOPS (BLOCKFP8) 164* 1.3 PetaFLOPS* 5.24 PetaFLOPS*
TeraFLOPS (FP16) 82* 656* 2.62 PetaFLOPS*
Software製品概要紹介
Tenstorrent Open Source Software
TT-Forge – Integrated into various frameworks
for native model ingest
•各フレームワークの計算グラフをTT-MLIRへコンパイル
TT-MLIR – New MLIR-based compiler
•MLIRベースのDNNコンパイラ
•TTデバイスターゲットに最適化
TT-NN™ – Library of optimized operators
•Torch ATenライクな命令群
•Python APIからTT-Metaliumを実装
TT-Metalium™ – Low-level programming model
and entry point
•TTデバイスターゲットのカーネル/ランタイム

pagetop