4/10/2013
Wstęp do Informatyki Wydajność systemów komputerowych
Cezary Bolek Katedra Informatyki
Prawo Moore’a Gordon E. Moore, 1965. "Cramming more components onto integrated circuits," Electronics, v.38, no 8 (19 April), • Wzrost liczby elementów układów mikroprocesorowych ma charakter wykładniczy • Liczba tranzystorów mikroprocesorów podwaja się średnio co 18 miesięcy (1980) • Wydajność obliczeniowa mikroprocesorów podwaja się średnio co 18 miesięcy (1990) • Wydajność komputerów w odniesieniu do ceny podwaja się średnio co 18 miesięcy (1990)
1
4/10/2013
ZłoŜoność mikroprocesorów i pamięci
Koszt wydajności komputerów
2
4/10/2013
Miary wydajności komputerów (MIPS)
• MIPS (Milion Instructions Per Second) - miara wydajności jednostki centralnej CPU komputera, liczba milionów operacji stałoprzecinkowych wykonywanych w ciągu sekundy Procesor
MIPS
Ołówek i papier Intel 4004 IBM System/370 model 158-3 Intel 8080 Motorola 68000 Intel 386DX Intel 486DX PowerPC 600s (G2) Intel Pentium Pro ARM 7500FE PowerPC G3 Zilog eZ80 Intel Pentium III AMD Athlon AMD Athlon XP 2400+ Pentium 4 Extreme Edition ARM Cortex A8 Xbox360 IBM "Xenon" Triple Core P.A. Semi PA6T-1682M AMD Athlon FX-57 AMD Athlon 64 3800+ X2 (Dual Core) AMD Athlon FX-60 (Dual Core) Intel Core 2 X6800 Intel Core 2 Extreme QX6700 Intel Polaris Prototype
0.0119 IPS 92 kIPS (740 kHz) 1 MIPS 640 kIPS (2 MHz) 1 MIPS (8 MHz) 8.5 MIPS (25 MHz) 54 MIPS (66 MHz) 35 MIPS (33 MHz) 541 MIPS (200 MHz) 35.9 MIPS (40 MHz) 525 MIPS (233 MHz) 80 MIPS (50 MHz) 1,354 MIPS (500 MHz) 3,561 MIPS (1.2 GHz) 5,935 MIPS (2.0 GHz) 9,726 MIPS (3.2 GHz) 2,000 MIPS (1.0 GHz) 9,600 MIPS (3.2 GHz) 8,800 MIPS (2.0 GHz) 12,000 MIPS (2.8 GHz) 14,564 MIPS (2.0 GHz) 18,938 MIPS (2.6 GHz) 27,079 MIPS (2.93 GHz) 57,063 MIPS (3.33 GHz) 1,800,000 MIPS (5.8 GHz)
MIPS/MHz 0.124 0.320 MIPS/MHz 0.125 MIPS/MHz 0.340 MIPS/MHz 0.818 MIPS/MHz 1.06 MIPS/MHz 2.705 MIPS/MHz 0.897 MIPS/MHz 2.253 MIPS/MHz 1.6 MIPS/MHz 2.708 MIPS/MHz 2.967 MIPS/MHz 2.967 MIPS/MHz 3.039 MIPS/MHz 2.0 MIPS/MHz 2.0 MIPS/MHz 4.4 MIPS/MHz 4.285 MIPS/MHz 7.282 MIPS/MHz 7.283 MIPS/MHz 9.242 MIPS/MHz 17.136 MIPS/MHz 310.4 MIPS/MHz
Rok 1892 1971 1972 1974 1979 1988 1992 1994 1996 1996 1997 1999 1999 2000 2002 2003 2005 2005 2007 2005 2005 2006 2006 2006 2007
Miary wydajności komputerów (SPEC) • SPEC (Standard Performance Evaluation Corporation) - załoŜona w 1988 r. organizacja z siedzibą w Warrenton, Virginia, zajmująca się ustanawianiem standardowych benchmarków oceniających wydajność komputerów.
• Jej pierwszym testem wydajności był SPECmark badający CPU, w którym jednostką był ekwiwalent wydajności maszyny VAX 11/780. ChociaŜ testy SPEC w dalszym ciągu badają CPU, organizacja opracowała teŜ inne testy, np. do oceny podsystemu graficznego czy rozmaitych kategorii aplikacji:
3
4/10/2013
SPEC CPU2006
• SPEC CPU92, CPU95, CPU2000, CPU2006
• Zestaw testów opartych na realizacji problemów za pomocą języków programowania wysokiego poziomu
• Pomiar czasu realizacji i odniesienie do czasu referencyjnego • Składający się z:
– CINT2006 ("SPECint"), arytmetyka stałoprzecinkowa (kompilatory, interpretery, edytory tekstu, gry logiczne itp,) – CFP2006 ("SPECfp"), arytmetyka zmiennoprzecinkowa pod kątem aplikacji numerycznych, grafiki 3D, przetwarzania obrazów itp
CINT2006 ("SPECint") – – – – – – – – – – – –
Benchmark 400.perlbench 401.bzip2 403.gcc 429.mcf 445.gobmk 456.hmmer 458.sjeng 462.libquantum 464.h264ref 471.omnetpp 473.astar 483.xalancbmk
Language Category C Programming Language C Compression C C Compiler C Combinatorial Optimization C Artificial Intelligence C Search Gene Sequence C Artificial Intelligence C Physics / Quantum Computing C Video Compression C++ Discrete Event Simulation C++ Path-finding Algorithms C++ XML Processing
4
4/10/2013
Inne testy SPEC
•
SPECweb2005, PHP and/or JSP performance.
•
SPECapc, performance of several 3D-intensive popular applications on a given system
•
• • • • • • • •
SPECviewperf, performance of an OpenGL 3D graphics system, tested with various rendering tasks from real applications
SPEC OMP2001 V3.2, for evaluating performance of parallel systems using OpenMP (http://www.openmp.org) applications.
SPEC MPI2007, for evaluating performance of parallel systems using MPI (Message Passing Interface) applications. SPECjvm2008, measuring basic Java performance of a Java Runtime Environment on a wide variety of both client and server systems. SPECjAppServer2004, a multi-tier benchmark for measuring the performance of Java 2 Enterprise Edition (J2EE) technology-based application servers.
SPECjbb2005, evaluates the performance of server side Java by emulating a threetier client/server system (with emphasis on the middle tier). SPEC MAIL2001, performance of a mail server, testing SMTP and POP protocols SPECpower_ssj2008, evaluates the energy efficiency of server systems. SPEC SFS97_R1, NFS file server throughput and response time
Miary wydajności komputerów (SPEC) CINT2006
CFP2006
Rdzenie
Proces ory
Rdzeni/ proc.
Procesor
Taktowanie proc. [GHz]
Pamięć
23
19.5
2
1
2
Intel Core 2 Duo T7600
2333
2 GB (2x1 GB 667 MHz CL5 DDR2 SDRAM)
Dell Precision T3400 (Intel E6850, 3.00 GHz)
33.7
28.8
2
1
2
Intel Core 2 Duo E6850
3000
4 GB (4x1 GB 800 MHz ECC CL6 DDR2)
Dell Precision T3400 (Intel E8500, 3.16 GHz)
36.8
30.5
2
1
2
Intel Core 2 Duo E8500
3166
4 GB (4x1 GB 800 MHz ECC CL6 DDR2)
Dell Precision 690 (Intel Xeon 5160, 3.00 GHz)
53.2
42.3
4
2
2
Intel Xeon 5160
3000
8 GB (8x1 GB 667 MHz ECC CL5 DDR2 FB-DIMM)
XPS M1710 (Intel Core 2 Duo T7600)
23.9
19.9
2
1
2
Intel Core 2 Duo T7600
2333
2 GB (2x1GB Hynix DDR2-667 CL5)
System
Dell Precision M90 (Intel T7600, 2.33 GHz)
5
4/10/2013
Miary wydajności komputerów (FLOPS) • FLOPS (ang. FLoating point Operations Per Second) - liczba operacji zmiennoprzecinkowych na sekundę, miara wydajności układów realizujących obliczenia zmiennoprzecinkowe. – – – –
1 1 1 1
MFLOPS = 1 milion FLOPS-ów GFLOPS = 1 miliard FLOPS-ów TFLOPS = 1 bilion FLOPS-ów PFLOPS = 1 biliard FLOPS-ów
• Najszybszy komputer Cray XT5 (Jaguar) – 1795 TFLOPS* • Najszybszy polski komputer ACTION Cluster Xeon E5345 Infiniband (Galera) – 38,17 TFLOPS (136 pozycja na świecie)* • Komputer klasy PC – kilkanaście GFLOPS • Człowiek – do kilkudziesięciu mFLOPS (Podzielenie dwóch liczb dziesięciocyfrowych zajmuje człowiekowi średnio kwadrans) * Dane: http://www.top500.org/
Superkomputery • Kategoria komputerów o wielkiej mocy obliczeniowej • Najszybsze i najbardziej wydajne (najdroŜsze) w danym czasie • Za pierwszy superkomputer uznaje się CDC 6600 (CDC - Control Data Corporation) – powstał w 1963 roku, według projektu i pod ścisłym nadzorem Seymoura Craya. – 3 miliony operacji na sekundę. Był to pierwszy komputer gdzie zastosowano tranzystory krzemowe, oraz nowatorską technikę chłodzenia podzespołów freonem
• Zastosowania
– Modelowanie – Symulacja – Militaria
•
np. meteorologia
• • • •
Modelowanie fizyczne, chemiczne Analiza katastrof Kryptografia Symulacje reakcji nuklearnych Analiza strukturalna
6
4/10/2013
Superkomputery – czym się róŜnią od normalnych
• Cena
– od $100.000+ do $1,000,000+
• Środowisko pracy – Kontrolowane
– Stałe parametry środowiskowe
• Peryferia
– brak kard grafiki, dźwiękowych, klawiatury itp. – dostęp poprzez stacje robocze
• Języki programowania
– C, C++, Java, FORTRAN
Superkomputery – architektura SMP • Symmetric SharedMemory Multiprocessing (SMP) • Współdzielona pamięć • Wspólny system operacyjny
• Programy dzielone na podzadania (wątki) dla poszczególnych procesorów (wielowątkowość)
7
4/10/2013
Superkomputery – architektura MPP • • • • •
Massively Parallel Processing (MPP) KaŜdy procesor posiada swoją własną pamięć Samodzielne systemy operacyjne dla jednsotek Interfejs komunikacyjny Wiele procesorów rozwiązuje problem podzielony na części (200+)
Superkomputery – Clustering • Grid computing
• Wiele serwerów połączonych ze sobą
• Oparte na szybkich łączach sieciowych
• Łatwo rozszerzalne poprzez dodawanie nowych serwerów
8
4/10/2013
Najszybsze komputery świata (listopad 2009)
Najszybsze komputery świata (listopad 2009) Rmax Rpeak
Nazwa
Komputer, liczba rdzeni
1
1759.00 2331.00
Jaguar
Cray XT5 224162 (Opteron)
Cray
Oak Ridge National Laboratory United States, 2008
2
1042.00 1375.78
Roadrunner
BladeCenter QS22/LS21 122400 (Cell/Opteron)
IBM
Los Alamos National Laboratory United States, 2008
3
831.70 1028.85
Kraken
Cray XT5 98928 (Opteron)
Cray
National Institute for Computational Sciences United States, 2008
4
825.50 1002.70
JUGENE
Blue Gene/P Solution 294912 (Power)
IBM
Jülich Research Centre Germany, 2009
5
563.10 1206.19
Tianhe-I
NUDT TH-1 71680 (Xeon), InfiniBand
NUDT
6
544.30 673.26
Pleiades
SGI Altix ICE 8200EX 56320 (Xeon), InfiniBand
SGI
NASA/Ames Research Center United States, 2008
7
478.20 596.38
Blue Gene/L
eServer Blue Gene Solution 212992 (Power)
IBM
Lawrence Livermore National Laboratory United States, 2007
8
458.61 557.06
Intrepid
Blue Gene/P Solution 163840 (Power)
IBM
Argonne National Laboratory United States, 2007
9
433.20 579.38
Ranger
Sun Constellation System 62976 (Opteron), Infiniband
Sun
Texas Advanced Computing Center United States, 2008
10
423.90 487.74
Red Sky
Sun Constellation System 41616 (Xeon), InfiniBand
Sun
Sandia National Laboratories United States, 2009
Pozycja
Dostawca
Lokalizacja, kraj, rok
National SuperComputer Center China, 2009
9
4/10/2013
Cray XT5 Jaguar • • • • •
System Name Site System Family System Model Computer
• • • • • •
Vendor Application area Installation Year Operating System Interconnect Processor
Cores
Jaguar Oak Ridge National Laboratory Cray XT Cray XT5-HE Cray XT5-HE Opteron Six Core 2.6 GHz Cray Inc. Not Specified 2009 Linux Proprietary AMD x86_64 Opteron Six Core 2600 MHz (10.4 GFlops)
Rmax(GFlops) Rpeak(GFlops)
224162 1759000
2331000
Polskie superkomputery w TOP500 Rank
Site
System
Cores
Rmax
Rpeak
136
Gdansk University of Technology, CI Task Poland
ACTION Cluster Xeon E5345 Infiniband ACTION
5336
38.17
49.73
451
Telecommunication Company Poland
Cluster Platform 3000 BL2x220, L54xx 2.5 Ghz, GigE Hewlett-Packard
4080
21.82
40.8
469
Telecommunication Company Poland
Cluster Platform 3000 BL2x220, L54xx 2.5 Ghz, GigE Hewlett-Packard
4000
21.4
40
10
4/10/2013
Najszybszy polski superkomputery - Galera • • • • • • • • • • • • •
System Name Site System Family System Model Computer Vendor Application area Main Memory Installation Year Operating System Memory Interconnect Processor
Galera Gdansk University of Technology, CI Task ACTION Cluster ACTION Cluster ACTION Cluster Xeon E5345 Infiniband ACTION Research 5376 GB 2008 Linux 5376 GB Infiniband DDR Intel EM64T Xeon 53xx (Clovertown) 2333 MHz (9.332 GFlops)
Cores Rmax(GFlops) Rpeak(GFlops) 5336
38170
49731
BlueGene/L - architektura Najszybszy komputer w listopadzie 2004 • • • • • • • • • • •
System Name Site System Family System Model Computer Vendor Application area Installation Year Operating System Interconnect Processor
BlueGene/L beta-System IBM/DOE IBM BlueGene BlueGene/L Prototype BlueGene/L DD2 beta-System (0.7 GHz PowerPC 440) IBM Not Specified 2004 Linux Proprietary PowerPC 440 700 MHz (2.8 GFlops)
Cores Rmax(GFlops) Rpeak(GFlops) 32768 70720
91750
11
4/10/2013
BlueGene/L - architektura
BlueGene/L – karta procesorowa
12
4/10/2013
BlueGene/L – węzeł
BlueGene/L – szafa i grid
13
4/10/2013
Najszybsze komputery – producenci
Najszybsze komputery – kraje
14
4/10/2013
Najszybsze komputery – architektury
Najszybsze komputery – zastosowania
15
4/10/2013
Najszybsze komputery – rodziny procesorów
Najszybsze komputery – systemy operacyjne
16