Tahmin: Nvidia’nın Fermi GF100 Ekran Kartının Teknik Ayrıntıları

Nvidia’nın ATI’ye cevabı şubat ayına kadar gecikebilir fakat geldiği zaman tek GPU kartlarda dünya lideri olacağı tahmin ediliyor. Yalnız bir terslik fark ettiniz mi? Nvidia, Fermi GF100 kod adlı grafik işlemcisini bir oyun canavarından ziyade hesaplama istasyonu olarak tanıtıyor. Hatırlarsanız Nvidia, eski G80 grafik işlemcileriyle (GeForce 8800 GTX ve GTS) beraber CUDA mimarisini tanıttığında da karşımıza programcılara ve yoğun hesaplama yapan bilim insanlarına yönelik bir ürün çıkacağını düşünmüş, Nvidia’nın oyuncuları yeterince önemsemeyebileceğinden endişe duymuştuk. Nitekim endişelerimiz yersiz çıktı ve GeForce 8800 serisi oyun dünyasında oldukça olumlu izlenimler bıraktı. G80’in biraz geliştirilmiş sürümü olan G92 ve GT200 grafik işlemcileri de görevlerini başarıyla yerlerine getirdiler. Ancak bilimsel hesaplama ve programlanabilme özellikleri hep geri planda kaldı. Zira ATI’nin kartları hesaplama gücü bakımından GeForce kartlardan epey iyi fakat programlanabilirlik yönüyle CUDA’nın daha başarılı olduğu ve daha fazla yaygınlık kazandığını görüyoruz.

Fermi GF100 Diyagram

Konuyu daha fazla dağıtmadan Nvidia’nın Fermi mimarisinin eski mimarilerden farklı olduğunu söyleyelim. Fermi GF100 işlemciye (CPU) eskisinden biraz daha yakın bir GPU. Örneğin L1 önbelleğin  yanı sıra, L2 önbelleği de var. Yonga üzerindeki tüm bellek birimleri ECC ile korunuyor. C/C++ programlama dilleri destekleniyor. GeForce kartların zayıf noktaları kayar nokta ve tam sayı hesaplama hızı büyük ölçüde arttırılmış. 40 nm üretim süreci sayesinde 480-500 mm2 gibi bir alana 3 milyarın üzerinde transistör sığdırılmış. Daha derine inecek olursak sayfalar dolusu bir makale yazmamız gerekir. Neyse ki TechReport Nvidia’dan bazı kilit bilgiler elde ederek Fermi’yi tepeden tırnağa tanıtmış. Makalenin sonunda da “büyük ölçüde emin oldukları tahminlerle” oluşturdukları bir özellik tablosu yayınlamışlar.

 GF100GT200RV870
Transistor Sayısı
3.0 Milyar
1.4 Milyar
2.15 Milyar
Üretim Süreci
40 nm @ TSMC55 nm @ TSMC40 nm @ TSMC
Çekirdek Hızı
650 MHz648 MHz850 MHz
Tarayıcı Hızı
1700 MHz1476 MHz
Bellek Hızı
4200 MHz2600 MHz4800 MHz
ALU Sayısı
5122401600
SP FMA Hızı1.74 Tflops0.708 Tflops2.72 Tflops
DP FMA Hızı
870 Gflops88.5 Gflops544 Gflops
ROP Sayısı
483232
Bellek Arabirimi
384 bit512 bit256 bit
Bellek Bant Genişliği
201.6 GB/s166.4 GB/s153.6 GB/s
ROP Hızı31.2 Gpixels/s21.4 Gpixels/s27.2 Gpixels/s
INT8 Bilineer Çokgen Oluşturma Hızı
83.2 Gtexels/s51.8 Gtexels/s68.0 Gtexels/s

Üstteki değerlere bakıldığında GF100’ün ATI Cypress (RV870)’den biraz daha hızlı olabileceği anlaşılabilir. Bununla beraber dediğimiz gibi bunlar TechReport’un tahminleri. Nvidia’dan resmi bir açıklama gelmeden kesin bir şey söylememiz mümkün değil.

1 Yorum

Bir cevap yazın