AMD Radeon Vega 3

AMD Radeon Vega 3
AMD Radeon Vega 3 ist ein Integrated-Videobeschleuniger von Intel. Die Veröffentlichung begann in January 2018. Die GPU hat eine Boost-Frequenz von Up to 1200 MHz. Es hat auch eine Speicherfrequenz von Up to DDR4-2400, platform dependent. Seine Eigenschaften sowie Benchmark-Ergebnisse werden im Folgenden detaillierter vorgestellt.

Basic

Markenname
Intel
Plattform
Integrated
Erscheinungsdatum
January 2018
Former Codename
Raven Ridge / Picasso
GPU Lithography
14 nm / 12 nm, APU-dependent
Modellname
AMD Radeon Vega 3
Generation
Radeon Vega Mobile
Basis-Takt
600 MHz
Boost-Takt
Up to 1200 MHz
Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
192
RT-Kerne
No
Einheiten berechnen
3
Tensor-Kerne
?
Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.
No
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
12
Bus-Schnittstelle
Integrated
Foundry
GlobalFoundries
Prozessgröße
14 nm / 12 nm, APU-dependent
Architektur
Vega
TDP (Thermal Design Power)
Shared with processor; typically 15 W APU TDP, 12-25 W configurable

Speicherspezifikationen

Speichergröße
Shared system memory
Speichertyp
DDR4 shared system memory
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
Dual-channel system memory, platform dependent
Speichertakt
Up to DDR4-2400, platform dependent
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
Up to 38.4 GB/s with dual-channel DDR4-2400

Anzeige und Medien

AMD FreeSync
Yes
AV1 Encode/Decode
No hardware support
H.264 Hardware Encode/Decode
Encode/Decode
H.265 HEVC Hardware Encode/Decode
Encode/Decode
H.266 VVC Hardware Encode/Decode
No hardware support
Intel Quick Sync Video
No
Number of Displays Supported
Up to 3, platform dependent
Ausgänge
HDMI, DisplayPort; device dependent

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
4.8 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
14.4 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
0.92 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
28.8 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
0.46 TFlops

KI-Funktionen

Intel Deep Learning Boost on GPU
No

Verschiedenes

PCI Express Version
PCIe 3.0
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.2
OpenCL-Version
1.2
OpenGL
4.6
CUDA
No
DirectX
12 (12_1)
Stromanschlüsse
None
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
4

FP32 (float)

0.46 TFlops

3DMark Time Spy

371.8

Vulkan

5847

OpenCL

3959

Im Vergleich zu anderen GPUs

SiliconCat Rangliste

1146
Platz 1146 unter allen GPU auf unserer Website
FP32 (float)
Tesla M2070
NVIDIA, July 2011
1.05 TFlops
Quadro 6000
NVIDIA, December 2010
1.027 TFlops
Tesla M2070 Q
NVIDIA, July 2011
1.007 TFlops
Radeon HD 4850
ATI, June 2008
0.98 TFlops
Radeon Vega 3
Intel, January 2018
0.46 TFlops
3DMark Time Spy
Radeon Pro W5500
AMD, February 2020
4802
Arc 140T
Intel, January 2025
3719
Radeon HD 7970
AMD, December 2011
2371
Radeon R9 270
AMD, November 2013
1603
Radeon Vega 3
Intel, January 2018
371.8
Vulkan
RTX 2000 Ada Generation
NVIDIA, February 2024
84494
Radeon 8040S Graphics
AMD, January 2025
56877
A2
NVIDIA, November 2021
34563
GeForce GTX 1050
NVIDIA, October 2016
17379
Radeon Vega 3
Intel, January 2018
5847
OpenCL
P104 100
NVIDIA, December 2017
52079
Radeon HD 7970
AMD, December 2011
34541
FirePro W7000
AMD, June 2012
18176
GeForce GTX 860M
NVIDIA, January 2014
10722
Radeon Vega 3
Intel, January 2018
3959