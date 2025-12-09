NVIDIA於NVIDIA CUDA 13.1推出全新NVIDIA CUDA Tile，透過基於tile的平行編程虛擬指令集，為CUDA增添新方式，然而知名晶片架構師Jim Keller對此感到不解，表示NVIDIA Tile的方式將簡化既有支援CUDA的程式碼移植到非CUDA GPU，進而使CUDA護城河失靈。

對於開發者而言，相較過往基於SIMT的CUDA給予程式設計師具備更大自主權但需要手動最佳化，CUDA Tile導入基於Tile的程式設計模型與名為Tile IR的底層虛擬機器，透過把GPU偽裝成採用Tile運算的「類TPU」，使AI開發者可專注在結構化矩陣運算、捲積等技術。

然而CUDA Tile與傳統的SMMIT並非二擇一，開發者仍可依據運算需求彈性選擇使用哪種方式，為透過CUDA GPU開發提供新的選項，不過相較原生為Tile開發的TPU，CUDA Tile的效率仍會相對差一些，但前提是兩者性能是在對等的前提之下。

Jim Keller的論點是建立在Tile是目前AI業界普遍使用的方法，當CUDA導入CUDA Tile，意味著能夠把像是支援Tile的Triton框架作為中介，先把CUDA程式碼轉移到Triton、進而移植到非CUDA的GPU，未來開發者不再需要撰寫支援特定架構的CUDA程式碼，理論上在CUDA開發的結果有望更不被CUDA制約。

雖然Jim Keller的說法並非毫無根據，然而CUDA畢竟是CUDA，即便對外採取更為開放的架構，但NVIDIA對自家硬體的最佳化仍非其它競爭者能在短時間內迎頭趕上，移植歸移植，要使非CUDA硬體能夠獲得最佳化的效果恐怕仍需繁瑣的微調，使用CUDA GPU仍可事倍功半。

值得一提的是Jim Keller目前正任職AI晶片新創Tenstorrent並擔任總裁及技術長，旨在提供較NVIDIA GPU更具經濟效益的AI晶片解決方案，並鎖定NVIDIA GPU無法涵蓋的特定AI市場。

