Tahmin: Nvidia’nın Fermi GF100 Ekran Kartının Teknik Ayrıntıları
Nvidia’nın ATI’ye cevabı şubat ayına kadar gecikebilir fakat geldiği zaman tek GPU kartlarda dünya lideri olacağı tahmin ediliyor. Yalnız bir terslik fark ettiniz mi? Nvidia, Fermi GF100 kod adlı grafik işlemcisini bir oyun canavarından ziyade hesaplama istasyonu olarak tanıtıyor. Hatırlarsanız Nvidia, eski G80 grafik işlemcileriyle (GeForce 8800 GTX ve GTS) beraber CUDA mimarisini tanıttığında da karşımıza programcılara ve yoğun hesaplama yapan bilim insanlarına yönelik bir ürün çıkacağını düşünmüş, Nvidia’nın oyuncuları yeterince önemsemeyebileceğinden endişe duymuştuk. Nitekim endişelerimiz yersiz çıktı ve GeForce 8800 serisi oyun dünyasında oldukça olumlu izlenimler bıraktı. G80’in biraz geliştirilmiş sürümü olan G92 ve GT200 grafik işlemcileri de görevlerini başarıyla yerlerine getirdiler. Ancak bilimsel hesaplama ve programlanabilme özellikleri hep geri planda kaldı. Zira ATI’nin kartları hesaplama gücü bakımından GeForce kartlardan epey iyi fakat programlanabilirlik yönüyle CUDA’nın daha başarılı olduğu ve daha fazla yaygınlık kazandığını görüyoruz.
Konuyu daha fazla dağıtmadan Nvidia’nın Fermi mimarisinin eski mimarilerden farklı olduğunu söyleyelim. Fermi GF100 işlemciye (CPU) eskisinden biraz daha yakın bir GPU. Örneğin L1 önbelleğin yanı sıra, L2 önbelleği de var. Yonga üzerindeki tüm bellek birimleri ECC ile korunuyor. C/C++ programlama dilleri destekleniyor. GeForce kartların zayıf noktaları kayar nokta ve tam sayı hesaplama hızı büyük ölçüde arttırılmış. 40 nm üretim süreci sayesinde 480-500 mm2 gibi bir alana 3 milyarın üzerinde transistör sığdırılmış. Daha derine inecek olursak sayfalar dolusu bir makale yazmamız gerekir. Neyse ki TechReport Nvidia’dan bazı kilit bilgiler elde ederek Fermi’yi tepeden tırnağa tanıtmış. Makalenin sonunda da “büyük ölçüde emin oldukları tahminlerle” oluşturdukları bir özellik tablosu yayınlamışlar.
GF100 | GT200 | RV870 | |
---|---|---|---|
Transistor Sayısı | 3.0 Milyar | 1.4 Milyar | 2.15 Milyar |
Üretim Süreci | 40 nm @ TSMC | 55 nm @ TSMC | 40 nm @ TSMC |
Çekirdek Hızı | 650 MHz | 648 MHz | 850 MHz |
Tarayıcı Hızı | 1700 MHz | 1476 MHz | — |
Bellek Hızı | 4200 MHz | 2600 MHz | 4800 MHz |
ALU Sayısı | 512 | 240 | 1600 |
SP FMA Hızı | 1.74 Tflops | 0.708 Tflops | 2.72 Tflops |
DP FMA Hızı | 870 Gflops | 88.5 Gflops | 544 Gflops |
ROP Sayısı | 48 | 32 | 32 |
Bellek Arabirimi | 384 bit | 512 bit | 256 bit |
Bellek Bant Genişliği | 201.6 GB/s | 166.4 GB/s | 153.6 GB/s |
ROP Hızı | 31.2 Gpixels/s | 21.4 Gpixels/s | 27.2 Gpixels/s |
INT8 Bilineer Çokgen Oluşturma Hızı | 83.2 Gtexels/s | 51.8 Gtexels/s | 68.0 Gtexels/s |
Üstteki değerlere bakıldığında GF100’ün ATI Cypress (RV870)’den biraz daha hızlı olabileceği anlaşılabilir. Bununla beraber dediğimiz gibi bunlar TechReport’un tahminleri. Nvidia’dan resmi bir açıklama gelmeden kesin bir şey söylememiz mümkün değil.
Bu kartların hepsı 3 asagı 5 yukarı aynı ıslevı yerıne getırır, parasıda hemen hemen aynıdır..