24 İşhattının gücü! NVIDIA 7800 GTX

NVIDIA Elinde CineFX 4.0 "taramalı" Tüfeğiyle

NVIDIA Elinde CineFX 4.0 "taramalı" Tüfeğiyle

Konuya dışarıdan bakan birinin gözüyle G70’e ait çizelgelere göz atarsak, verinin izlediği yolların ek tarayıcı (shader) birimler dışında, NV40 ile aynı olduğunu söyleyebiliriz. Ancak daha derine inersek, G70’in her saat döngüsünde (clock cycle) daha fazla matematik işlem yapabildiğini görebiliriz.

7800 GTX’in amacının bir bölümü de oyunlarda elde edilen en düşük resim hızını (FPS) artırabilmek ve kesintisiz bir oynayışı sağlayabilmek. Günümüz (olasılıkla yarının) oyunlarındaki “fazladan gider” (overhead) kalemiyle başa çıkabilmek ve 3B tarama işhattındaki (renderin pipeline) başarımı artırabilmek için ek “Aritmetik Mantık Birimleri” de (Arithmetic Logic Units, ALU) kullanmak gerekiyor.

NVIDIA Elinde CineFX 4.0 "taramalı" Tüfeğiyle

Bu çizelgede ALU’ların nokta işhattına (pixel pipeline) nerelerde eklendiğini görüyorsunuz. Her küçük-ALU, çarpma-toplama (multiply-add, MAD) yönerge takımını barındırıyor. NVIDIA tepe tarama başarımının yönsüz işlemler için (scalar OPS), bu tek saat döngüsünde sonuç verebilen MAD’ler sayesinde %30’a kadar artırılıldığını iddia ediyor. Tam hızda döngü başına dört kayar noktalı çarpma-toplama (MAD) işlemi yapılabiliyor.

” border=”0″ cellpadding=”3″ cellspacing=”1″>

  Nokta Tarayıcı Tepe Tarayıcı ALU 24 8 Mimari 2x Vektör-4 + Yönsüz (scalar) + Normal Vektör-4 + Yönsüz Vektör   4 MAD / 8 flop (aç-kapa) Yönsüz   2 flop Yönerge (instruction) / ALU 5 2 İşlem (Ops) / ALU 10 5 Flop /ALU 27 10 Yönerge / Döngü (clock cycle) 120 16 İşlem / Döngü 240 40 Flop / Döngü 648 80 Saah Hızı 430 MHz 430 MHz Yönerge / Saniye 51.6 milyar 6.88 milyar İşlem / Saniye 103.2 milyar 17.2B milyar Kayar nokta işlemleri (floating point ops) / Saniye 278.6 milyar 34.4 milyar İkiyollu Süzülmüş Doku (bilinear filtered texture) / Döngü 24   İkiyollu Dokucuk (Texel) Doldurma Hızı 10.3 milyar   Doku Veriyolu Genişliği (Önveriyolu (FB) + PCI-E) 44.4GB/s  

Bunlara ek olarak NVIDIA işhattı işleyişinde temel geliştirmeler yaptığını da söylüyor. Bunlardan ikisi ölçüm sonuçlarındaki son satırda ve gerçek kullanım başarımında gözlenebiliyor – gecikmelerin azaltılması ve her saat döngüsündeki (clock cycle) işlem miktarının artırılmış olması. Eğer her şey daha az gecikmeyle (latency) çalışırsa, bundan tüm grafik düzenek yarar sağlayacak demektir.

NVIDIA Elinde CineFX 4.0 "taramalı" Tüfeğiyle

Bir cevap yazın