Mga website

Nvidia Unveils Next-Gen Fermi Arkitektura

Nvidia unveils next-gen Pascal GPU

Nvidia unveils next-gen Pascal GPU
Anonim

Nvidia maaaring pinalitan ng pangalan nito NVISION promotional pagpupulong sa "GPU Technology Conference," ngunit ito ay pa rin ng isang Nvidia ipakita sa pamamagitan at sa pamamagitan ng. Kinuha ni CEO Jen-Hsun Huang ang ilang oras sa panahon ng kanyang pangunahing tono upang i-unveil ang susunod na major GPU architecture ng kumpanya, ang code na pinangalanang "Fermi." Ito ang chip graphics tagahanga na tumatawag sa GT300, ang generational successor sa GT200 chip na nagpapagana ng mga card tulad ng GeForce GTX 285.

Ang chip giant ay maingat na iposisyon ang maliit na tilad bilang hindi isang bagong graphics chip, ngunit isang bagong " compute at graphics" chip, sa utos na iyon (italics minahan). Sa katunayan, halos lahat ng bagay na ipinahayag tungkol sa bagong chip ay may kaugnayan sa mga tampok ng computational nito, kaysa sa tradisyonal na mga bagay na nakatuon sa graphics tulad ng mga yunit ng texture at render-back ends. Ang alam natin ay ang chip ay malaki sa tinatayang 3.0 bilyong transistors, at gagawin sa isang proseso ng 40nm sa TSMC. Ito ay tungkol sa 40 porsiyento ng higit pang mga transistors kaysa sa RV870 chip sa bagong Radeon 5800 series DirectX 11 cards na inilabas lamang ng karibal na AMD. Ang maliit na tilad ay mayroong 512 na yunit ng pagpoproseso (tinatawag Nvidia sila CUDA cores) na nakaayos sa 16 "streaming multiprocessors" ng 32 core bawat isa. Ito ay higit sa doble ang 240 cores sa GT200, at ang core ay may makabuluhang mga pagpapahusay bukod sa. Ang maliit na tilad ay gumagamit ng isang 384-bit GDDR5 memory interface.

Narito ang ilan sa mga pangunahing bullet points:

Third Generation Streaming Multiprocessor (SM)

  • 32 CUDA core bawat SM, 4x sa GT200
  • 8x ang tugatog double precision floating point performance sa GT200
  • Dual Warp Scheduler na nagtatakda at nagpapadala ng dalawang warps ng 32 threads
  • bawat orasan
  • 64 KB ng RAM na may configure na partitioning ng shared memory at L1 cache

Pangalawa Pag-uugnay ng Parallel Thread Execution ISA

  • Pinag-isang Address ng Space na may Buong C ++ Suporta
  • Na-optimize para sa OpenCL at DirectCompute
  • Buong IEEE 754-2008 32-bit at 64-bit na katumpakan
  • -bit na mga extension
  • Mga tagubilin sa pag-access ng memory upang suportahan ang paglipat sa pag-aayos ng 64-bit
  • Pinahusay na Pagganap sa pamamagitan ng Predication

Pinagbuting Memory Subsystem

  • NVIDIA Parallel DataCache hierarchy na may Configurable L1 at Pinag-isang L2 < Unang GPU na may suporta sa memorya ng ECC
  • Lubos na pinabuting operasyon ng memorya ng atomic pagganap
  • NVIDIA GigaThread Engine
  • 10x mas mabilis na paglipat ng konteksto ng application

Kasabay na pagpapatupad ng kernel

  • Out of Order thread block pagpapatupad
  • Dalawampung naka-overlap na mga engine sa paglipat ng memory
  • Mayroong maraming mga karagdagang tampok na dapat mapabuti ang pagganap ng maliit na tilad na ito sa mga gawain ng stream ng computing, tulad ng mas mabilis na double-precision floating point computation rate. Ang kasalukuyang Nvidia GPUs ay nagpapatunay ng double-precision sa bahagi ng bilis ng mga single-precision operation. Ang double-precision floating point operations ay dapat na ngayon sa kalahati ng pagganap ng single-precision, na kung saan ay isang malaking pagpapabuti. Ang mga malalaking pagpapabuti sa pag-cache at pag-iiskedyul ay maliwanag din. Maaari kang magbasa nang higit pa tungkol sa arkitektura sa bagong pahina ng Fermi ng Nvidia, na kinabibilangan ng isang PDF whitepaper.
  • Kaya kailan makakabili ka ng isang graphics card na gumagamit ng chip na ito? Hindi sinasabi ni Nvidia. Sinabi ng mga kinatawan ng kumpanya na kasalukuyang sila ay "nagdadala ng maliit na tilad", na nangangahulugan na ang mga sample ng trabaho ay kamakailan lamang ay bumalik mula sa planta ng katha. Ang pagsasagawa ng nakapag-aral na hula mula sa nakaraang kasaysayan, sasabihin namin na ang Disyembre ay isang maasimpleng petsa ng paglabas, at ang Q1 2010 para sa malawak na availability ay mas malamang. Inaasahan ang mga board na maging mahal. Nvidia ay hindi ibubunyag ang laki ng maliit na tilad, ngunit ang paghuhusga sa bilang ng transistor ay hulaan natin sa pagitan ng 450 at 500 mm

2

. Kaisa sa mga idinagdag na mga gastos sa board ng isang 384-bit memory interface at ang mga hamon sa pagkuha ng mahusay na pagbubuhos ng tulad ng isang malaking chip sa relatibong bagong 40nm manufacturing process, at naghahanap ka sa mga card na malamang na maging mas malakas at mas mahal kaysa sa mga inilabas na Radeon 5800 series cards ng AMD. Sundin si Jason Cross sa twitter o bisitahin ang kanyang blog.