一、NVIDIA A2 基本特性
通用入門級(jí)推理
NVIDIA A2 Tensor Core GPU 具有低功耗、小尺寸和高性能的特點(diǎn),可為 NVIDIA 邊緣 AI 提供入門級(jí)推理功能。A2 采用半高 PCIe 4.0設(shè)計(jì)和 40-60 瓦低熱設(shè)計(jì)功耗(TDP)配置功能,為各種服務(wù)器帶來自適應(yīng)推理加速。
A2 的通用性、小尺寸和低功耗可輕松滿足對(duì)大規(guī)模邊緣部署的需求,能立即將現(xiàn)有的入門級(jí) CPU 服務(wù)器升級(jí)到能處理推理的水平。使用A2 GPU 加速的服務(wù)器提供比使用 CPU 更高的推理性能,智能視頻分析(IVA)部署效率比使用前幾代 GPU 更高,而且這都基于入門級(jí)價(jià)格。
搭載 A2 GPU 和 NVIDIA AI 的 NVIDIA-Certified Systems (NVIDIA認(rèn)證系統(tǒng)),包括 NVIDIA Triton? 推理服務(wù)器,可跨邊緣、數(shù)據(jù)中心和云提供突破性的推理性能。這些系統(tǒng)確保支持 AI 的應(yīng)用能夠以更少的服務(wù)器和更低的功耗完成部署,從而在顯著降低成本的情況下更輕松地部署和更快地獲取見解。
推理性能提升高達(dá) 20 倍
部署 AI 推理技術(shù)的目的是通過實(shí)時(shí)體驗(yàn)使消費(fèi)者的生活變得更便利,并支持其從數(shù)萬億個(gè)端點(diǎn)傳感器和攝像頭獲得認(rèn)知。與 CPU 服務(wù)器相比,搭載 NVIDIA A2 Tensor Core GPU 的服務(wù)器可提供高達(dá) 20 倍的推理性能,能立即將服務(wù)器升級(jí)到能處理現(xiàn)代 AI 的水平。


在智能邊緣實(shí)現(xiàn)更高的 IVA 性能
在智慧城市、制造和零售等智能邊緣用例中,搭載 A2 的服務(wù)器最高可將性能提升 1.3 倍。與前幾代 GPU 相比,運(yùn)行 IVA 工作負(fù)載的 NVIDIA A2 GPU 最高可將性價(jià)比和能效分別提升1.6 倍和 10%,從而改善部署效率。

二、NVIDIA A2 創(chuàng)新特性

二、NVIDIA A2 創(chuàng)新特性
NVIDIA A2 帶來突破性的 NVIDIA Ampere 架構(gòu)創(chuàng)新
第三代 TENSOR CORE NVIDIA A2 中的第三代 Tensor Core 支持下至 INT4 的整數(shù)運(yùn)算和上至 FP32 的浮點(diǎn)運(yùn)算,可提供強(qiáng)大的 AI 訓(xùn)練和推理性能。NVIDIA Ampere 架構(gòu)還支持 TF32 和 NVIDIA 的自動(dòng)混合精度(AMP)功能。
信任根安全性 在邊緣部署和端點(diǎn)中提供安全性對(duì)于企業(yè)業(yè)務(wù)運(yùn)營至關(guān)重要。 NVIDIA A2 通過受信任的代碼身份驗(yàn)證和強(qiáng)化的回滾保護(hù)實(shí)現(xiàn)安全啟動(dòng),以防止惡意軟件攻擊。
第二代 RT CORE NVIDIA A2 包含用于光線追蹤的專用 RT Core,能夠迅速實(shí)現(xiàn)新銳技術(shù)。其吞吐量高達(dá)上一代產(chǎn)品的 2 倍,還能在進(jìn)行著色或降噪的同時(shí)運(yùn)行光線追蹤。
硬件轉(zhuǎn)碼性能 視頻應(yīng)用的指數(shù)級(jí)增長需要實(shí)時(shí)可擴(kuò)展性能,而這就需要最新的硬件編碼和解碼功能。A2 GPU 使用專用硬件全面加速熱門編解碼器的視頻解碼和編碼,包括 H.265、H.264、VP9 和 AV1 解碼。
完整的推理產(chǎn)品組合
NVIDIA 提供完整的 NVIDIA 認(rèn)證系統(tǒng)產(chǎn)品組合,搭載 Ampere Tensor Core GPU這一助力 NVIDIA AI 的推理引擎。A2 Tensor Core GPU 為已經(jīng)包括 A100 和 A30Tensor Core GPU 的 NVIDIA AI 產(chǎn)品組合增加了低版外形規(guī)格的入門級(jí)推理產(chǎn)品。A100 可實(shí)現(xiàn)各種規(guī)模的超高推理性能,A30 則為主流服務(wù)器提供更佳推理性能。NVIDIA A2、NVIDIA A30 和 NVIDIA A100 Tensor Core GPU 在邊緣、數(shù)據(jù)中心和云中提供領(lǐng)先的推理性能。

適用于企業(yè)的優(yōu)化軟件和服務(wù)
NVIDIA AI Enterprise NVIDIA AI Enterprise 是一套端到端云原生 AI 和數(shù)據(jù)分析軟件,經(jīng)認(rèn)證可在基于服務(wù)器虛擬化平臺(tái)的虛擬基礎(chǔ)設(shè)施(帶有 VMware vSphere)中的 A2 上運(yùn)行。這使得在混合云環(huán)境中管理和擴(kuò)展 AI 和推理工作負(fù)載成為可能。
三、系統(tǒng)規(guī)格
三、系統(tǒng)規(guī)格
FP32 峰值性能
4.5 TF
4.5 TF
TF32 Tensor Core
9 TF | 18 TF
9 TF | 18 TF
BFLOAT16 Tensor Core
18 TF | 36 TF
18 TF | 36 TF
FP16 Tensor Core 峰值性能
18 TF | 36 TF1
18 TF | 36 TF1
INT8 Tensor Core 峰值性能
36 TOPS | 72 TOPS1
36 TOPS | 72 TOPS1
INT4 Tensor Core 峰值性能
72 TOPS | 144 TOPS1
72 TOPS | 144 TOPS1
RT Core 數(shù)量
10 個(gè)
10 個(gè)
媒體引擎
1 個(gè)視頻編碼器
1 個(gè)視頻編碼器
2 個(gè)視頻解碼器(包括 AV1 解碼)
GPU 顯存
16GB GDDR6
16GB GDDR6
GPU 顯存帶寬
200GB/s
200GB/s
互連
PCIe 4.0 x8
PCIe 4.0 x8
外形規(guī)格
單插槽,半高 PCIe
單插槽,半高 PCIe
最大熱設(shè)計(jì)功耗(TDP)
40-60W(可配置)
vGPU 軟件支持
NVIDIA 虛擬 PC (vPC)、NVIDIA 虛擬應(yīng)用(vApp)、NVIDIA RTX 虛擬工作站(vWS)、NVIDIA AI Enterprise、NVIDIA 虛擬計(jì)算服務(wù)器(vCS)
NVIDIA 虛擬 PC (vPC)、NVIDIA 虛擬應(yīng)用(vApp)、NVIDIA RTX 虛擬工作站(vWS)、NVIDIA AI Enterprise、NVIDIA 虛擬計(jì)算服務(wù)器(vCS)