Dlaczego wszystkie rdzenie procesora mają tę samą prędkość, a nie różne?

why do cpu cores all have the same speed instead of different ones 00 1024x469 1

Jeśli kiedykolwiek robiłeś wiele porównań dla nowego procesora, być może zauważyłeś, że wszystkie rdzenie wydają się mieć szybkość, a nie kombinację różnych. Dlaczego? Dzisiejszy post z pytaniami i odpowiedziami dla SuperUser zawiera odpowiedź na ciekawe pytanie czytelnika.

Dzisiejsza sesja pytań i odpowiedzi przychodzi do nas dzięki uprzejmości SuperUser — pododdziału Stack Exchange, społecznościowej grupy witryn internetowych z pytaniami i odpowiedziami.

Pytanie

Czytnik SuperUser Jamie chce wiedzieć, dlaczego wszystkie rdzenie procesora mają tę samą prędkość, a nie różne:

Ogólnie rzecz biorąc, kupując nowy komputer, należy określić, który procesor kupić, na podstawie oczekiwanego obciążenia komputera. Wydajność w grach wideo jest zwykle określana przez prędkość pojedynczego rdzenia, podczas gdy aplikacje takie jak edycja wideo są określane przez liczbę rdzeni. Jeśli chodzi o to, co jest dostępne na rynku, wszystkie procesory wydają się mieć mniej więcej taką samą prędkość, a główne różnice to więcej wątków lub więcej rdzeni.

Na przykład:

Intel Core i5-7600K, częstotliwość podstawowa 3,80 GHz, 4 rdzenie, 4 wątki

Intel Core i7-7700K, częstotliwość podstawowa 4,20 GHz, 4 rdzenie, 8 wątków

AMD Ryzen 5 1600X, częstotliwość podstawowa 3,60 GHz, 6 rdzeni, 12 wątków

AMD Ryzen 7 1800X, częstotliwość podstawowa 3,60 GHz, 8 rdzeni, 16 wątków

Dlaczego widzimy ten wzór zwiększającej się liczby rdzeni, ale wszystkie rdzenie mają tę samą częstotliwość taktowania? Dlaczego nie ma wariantów o różnych częstotliwościach zegara? Na przykład dwa „duże” rdzenie i wiele małych rdzeni.

Zamiast, powiedzmy, czterech rdzeni taktowanych 4,0 GHz (tj. 4×4 GHz, maksymalnie 16 GHz), co powiesz na procesor z dwoma rdzeniami taktowanymi 4,0 GHz i czterema rdzeniami taktowanymi 2,0 GHz (czyli 2×4,0 GHz + 4×2,0 GHz, maksymalnie 16 GHz)? Czy druga opcja byłaby równie dobra w przypadku obciążeń jednowątkowych, ale potencjalnie lepsza w przypadku obciążeń wielowątkowych?

Zadaję to jako ogólne pytanie, a nie konkretnie w odniesieniu do procesorów wymienionych powyżej lub konkretnego obciążenia. Jestem tylko ciekaw, dlaczego wzór jest tym, czym jest.

Dlaczego wszystkie rdzenie procesora mają tę samą prędkość, a nie różne?

Odpowiedź

Współtwórca SuperUser bwDraco ma dla nas odpowiedź:

Jest to znane jako heterogeniczne przetwarzanie wieloprocesowe (HMP) i jest szeroko stosowane w urządzeniach mobilnych. W urządzeniach opartych na architekturze ARM, które wdrażają duży mały, procesor zawiera rdzenie o różnych profilach wydajności i mocy, tj. niektóre rdzenie działają szybko, ale pobierają dużo energii (szybsza architektura i/lub wyższe zegary), podczas gdy inne są energooszczędne, ale wolne (wolniejsza architektura i/lub niższe zegary). Jest to przydatne, ponieważ zużycie energii ma tendencję do nieproporcjonalnego wzrostu w miarę zwiększania wydajności po przekroczeniu pewnego punktu. Chodzi o to, aby uzyskać wydajność, gdy jej potrzebujesz, i żywotność baterii, gdy nie.

Na platformach stacjonarnych zużycie energii jest znacznie mniejszym problemem, więc nie jest to naprawdę konieczne. Większość aplikacji oczekuje, że każdy rdzeń będzie miał podobną charakterystykę wydajności, a procesy planowania dla systemów HMP są znacznie bardziej złożone niż planowanie dla tradycyjnych systemów symetrycznego przetwarzania wieloprocesowego (SMP) (technicznie Windows 10 obsługuje HMP, ale jest przeznaczony głównie dla urządzeń mobilnych urządzenia korzystające z ARM big.LITTLE).

Ponadto większość dzisiejszych procesorów do komputerów stacjonarnych i laptopów nie jest ograniczona termicznie ani elektrycznie do punktu, w którym niektóre rdzenie muszą działać szybciej niż inne, nawet przy krótkich seriach. W zasadzie uderzyliśmy w ścianę jak szybko możemy wykonać pojedyncze rdzenie, więc zastąpienie niektórych rdzeni wolniejszymi nie pozwoli na szybsze działanie pozostałych rdzeni.

Chociaż istnieje kilka procesorów do komputerów stacjonarnych, które mają jeden lub dwa rdzenie, które mogą działać szybciej niż inne, ta funkcja jest obecnie ograniczona do niektórych bardzo zaawansowanych procesorów Intel (znanych jako technologia Turbo Boost Max 3.0) i wiąże się tylko z niewielkim wzrostem wydajność dla tych rdzeni, które mogą działać szybciej.

Chociaż z pewnością możliwe jest zaprojektowanie tradycyjnego procesora x86 z zarówno dużymi, szybkimi rdzeniami, jak i mniejszymi, wolniejszymi rdzeniami w celu optymalizacji pod kątem obciążeń o dużej liczbie wątków, spowodowałoby to znaczną złożoność konstrukcji procesora, a aplikacje prawdopodobnie nie będą go prawidłowo obsługiwać.

Weź hipotetyczny procesor z dwoma szybkimi Jezioro Kaby (7. generacji) rdzenie i osiem slow Goldmont Rdzenie (atomowe). Miałbyś w sumie 10 rdzeni, a mocno wątkowe obciążenia zoptymalizowane dla tego rodzaju procesora mogą przynieść wzrost wydajności i wydajności w porównaniu z normalnym czterordzeniowym procesorem Kaby Lake. Jednak różne typy rdzeni mają bardzo różne poziomy wydajności, a wolne rdzenie nie obsługują nawet niektórych instrukcji obsługiwanych przez szybkie rdzenie, takich jak AVX (ARM unika tego problemu, wymagając, aby zarówno duży, jak i MAŁY rdzenie obsługiwały te same instrukcje).

Ponownie, większość aplikacji wielowątkowych opartych na systemie Windows zakłada, że każdy rdzeń ma ten sam lub prawie taki sam poziom wydajności i może wykonywać te same instrukcje, więc tego rodzaju asymetria prawdopodobnie spowoduje mniej niż idealną wydajność, a może nawet ulega awarii, jeśli używa instrukcji nieobsługiwanych przez wolniejsze rdzenie. Chociaż Intel mógłby modyfikować wolne rdzenie, aby dodać obsługę zaawansowanych instrukcji, tak aby wszystkie rdzenie mogły wykonywać wszystkie instrukcje, nie rozwiązałoby to problemów z obsługą oprogramowania dla procesorów heterogenicznych.

Inne podejście do projektowania aplikacji, bliższe temu, o czym prawdopodobnie myślisz w swoim pytaniu, wykorzystywałoby procesor graficzny do przyspieszania wysoce równoległych części aplikacji. Można to zrobić za pomocą interfejsów API, takich jak OpenCL i CUDA. Jeśli chodzi o rozwiązanie jednoukładowe, AMD promuje sprzętową obsługę akceleracji GPU w swoich APU, która łączy tradycyjny procesor i wysokowydajny zintegrowany procesor graficzny w tym samym chipie, jak Heterogeniczna architektura systemu, choć branża nie zyskała dużego zainteresowania poza kilkoma wyspecjalizowanymi aplikacjami.

Masz coś do dodania do wyjaśnienia? Dźwięk w komentarzach. Chcesz przeczytać więcej odpowiedzi od innych doświadczonych technologicznie użytkowników Stack Exchange? Sprawdź pełny wątek dyskusji tutaj.

Źródło obrazu: Mirko Waltermann (Flickr)

Czy ten post był pomocny?

Daj nam znać, czy podobał Ci się ten wpis. Pomoże nam to w poprawie.