Пять фактов об архитектуре графических чипов Nvidia Ampere

Геймерам придется подождать появления видеоадаптеров на их основе, но некоторые выводы о будущих возможностях можно сделать уже сейчас.

Архитектура видеопроцессоров Nvidia нового поколения, наконец, явлена миру. Прошло почти полтора года с тех пор, как появились адаптеры серии GeForce RTX 20 на основе архитектуры Turing, и три года со времени презентации графических процессоров для центров обработки данных Volta, и вот глава компании Дженсен Хуанг представил исполинскую графическую плату в ходе выступления на онлайн-конференции Nvidia GTC 2020.

Архитектура Ampere дебютирует в форме A100, мощнейшего видеопроцессора для центров обработки данных, на базе которого выполнена новая система Nvidia, DGX-A100. Для уточнения: этот «монстр» с 6192 ядрами CUDA предназначен для исследователей данных и оптимизирован для задач глубинного обучения — в Cyberpunk 2077 на нем не поиграешь. Однако кое-какие сведения из презентации Ampere геймеры все-таки почерпнуть могут. Перечислим пять фактов об Ampere, которые, скорее всего, найдут отражение в линейке видеоадаптеров GeForce следующего поколения.

1. Ampere пока не для геймеров, но со временем ситуация изменится

Тем, кому нужны точные подробности о новых платах GeForce, придется подождать. Как и в случае с архитектурами Volta и Pascal, Ampere была представлена в форме огромного видеоадаптера, предназначенного для ускорения задач центров обработки данных. Но в отличие от Volta, Ampere появится и в видеоплатах потребительского класса.

На пресс-конференции Хуанг объяснил, что благодаря новой архитектуре ассортиментный ряд видеопроцессоров Nvidia упростится, так как она заменит и Volta в чипах для ЦОД, и Turing в потребительских GeForce. При этом аппаратное обеспечение адаптеров будет варьироваться в зависимости от целевого рынка. Отвечая на вопрос журналиста Marketwatch о различиях видеопроцессоров для систем потребительского класса и рабочих станций, Хуанг сообщил: «Архитектура будет фактически одной и той же, основные отличия проявятся в конфигурации».

2. Ampere знаменует переход на 7 нм

Как и ожидалось, видеочипы Ampere будут выпускаться по технологическому процессу 7 нм, в отличие от 12-нанометровых Turing и Volta. Это серьезный шаг вперед — с уменьшением размера транзисторов повышается производительность и энергоэффективность чипа.

Судя по опубликованному Nvidia рекламному ролику, видеопроцессор, на котором выполнена система A100, называется GA100

AMD первой перешла на технологию 7 нм, предложив серию видеоплат Radeon RX 5000 на базе архитектуры Navi, и они продемонстрировали существенное улучшение упомянутых показателей по сравнению с предшественниками. Если прежние платы Radeon сильно нагревались и расходовали много электроэнергии, то 7-нанометровые Navi стали соперничать с аналогами из семейства GeForce и по производительности, и по экономичности. Можно также напомнить, что когда в прошлом Nvidia перешла от техпроцесса 28 нм, по которому выпускались адаптеры серии GeForce GTX 900, к 16 нм в GTX 10, это привело к резкому скачку быстродействия. Так что по всей видимости, от GeForce на Ampere можно ждать новых чудес.

3. Ampere — это гораздо больше ядер

Переход на более компактные транзисторы позволил разместить в гораздо больше ядер в прежних границах. В Tesla V100, флагмане архитектуры Volta, на кристалле площадью 815 мм² размещалось 21,1 млрд транзисторов, 5120 ядер CUDA и 80 поточных мультипроцессоров. А в A100 Ampere на кристалле площадью 826 мм² умещается уже 54 млрд транзисторов, 6912 ядер CUDA и 108 мультипроцессоров.

Как видно, сделан большой шаг вперед, благодаря чему видеоадаптеры станут значительно быстрее. Для сравнения, в GeForce RTX 2080 Ti на площади 754 мм² размещено 4352 ядер CUDA, а в видеочипах следующего поколения их может быть намного больше.

4. Тензорные ядра стали еще умнее

С переходом на Volta и Turing в видеопроцессорах Nvidia появились тензорные ядра, ускоряющие задачи машинного обучения. В GeForce с их помощью реализована технология Deep Learning Super Sampling (DLSS) 2.0, благодаря которой помимо прочего устраняются зернистые артефакты, являющиеся продуктом работы функции трассировки лучей в реальном времени.

В A100 используются тензорные ядра третьего поколения, которые существенно увеличивают скорость выполнения операций над числами с плавающей запятой половинной точности, а также позволяют работать с числами одинарной и двойной точности. Пока неясно, будут ли новые тензорные ядра использоваться в потребительских видеоадаптеров, но учитывая, насколько активно Nvidia пропагандирует DLSS и средства поддержки машинного обучения, скорее всего, в GeForce следующего поколения механизмы искусственного интеллекта будут выведены на новый уровень. В частности, это понадобится для повышения производительности функции трассировки лучей, — если эффектов реалистичного освещения станет больше, придется улучшить и средства устранения шума.

5. Ampere поддерживает PCIe 4.0

В ходе презентации DGX-A100 в Nvidia об этом не говорили, но в компании Supermicro, представляя ее будущие системы на базе A100, уточнили, что они поддерживают новую версию PCIe 4.0. Самыми первыми видеочипами, в которых появилась поддержка этого интерфейса, стали процессоры AMD серии Ryzen 3000. PCIe 4.0, напомним, обеспечивает гораздо более высокую скорость обмена данными по сравнению с PCIe 3.0, который применяется уже несколько лет.

Система DGX-A100 Ampere - только что «из духовки» на кухне главы Nvidia Дженсена Хуанга

Строго говоря, на данный момент наличие нового интерфейса в видеоадаптерах большого значения не имеет. Если бы адаптеры AMD Radeon 5700 архитектуры Navi были оснащены PCIe 3.0, они работали бы не быстрее, чем с PCIe 4.0, и более того, большинство существующих видеоплат еще не исчерпывают возможностей PCIe 3.0.

Однако сама тенденция обновления имеет значение. Как показало тестирование, проведенное TechPower, адаптер-«монстр» GeForce RTX 2080 Ti, который стоит в США 1200 долл., демонстрирует небольшую, но измеримую прибавку в производительности при работе в слоте PCIe 3.0 x16 по сравнению с PCI 3.0 x8. Это значит, что он приближается к достижению границ возможностей PCIe 3.0 при использовании в геймерских системах с несколькими графическими адаптерами (при установке нескольких видеоадаптеров в систему потребительского класса соединение PCIe 3.0 x16 распределяется между двумя слотами).

Если у наследника RTX 2080 Ti, выполненного на основе архитектуры Ampere, действительно будет гораздо больше ядер CUDA и общая производительность, возможностей PCIe 3.0 x8 ему, вероятно, не хватит. Поддержка PCIe 4.0 позволит избежать появления узкого места, но сборщикам геймерских систем необходимо учесть одну особенность: в Core десятого поколения, самых новых процессорах Intel, интерфейс PCIe 4.0 не предусмотрен. И хотя игры на них в целом демонстрируют более высокую производительность, тем, кто рассчитывает собрать максимально быструю систему с несколькими топовыми адаптерами GeForce Ampere, вероятно, лучше будет сделать выбор в пользу Ryzen, который поддерживает PCIe 4.0.

Какие подробности пока не известны

Архитектура Ampere уже применяется и скоро появятся видеоплаты GeForce на ее основе. Но в ходе презентации A100 не были обнародованы некоторые подробности, которые могут быть важны геймерам, прежде всего, тактовая частота видеопроцессоров и характеристики скорости трассировки лучей. Увеличение тактовой частоты обычно способствует большей производительности игр. Повышение количества специализированных ядер для трассировки лучей вместе с использованием новых тензорных ядер может способствовать избавлению от резкого падения производительности, который наблюдается сейчас при включении эффектов освещения в играх.

В ходе доклада на GTC 2020 оба этих вопроса были упущены, но по слухам, тактовая частота видеочипов GeForce Ampere будет больше, чем у RTX 20, а производительность трассировки лучей может возрасти вчетверо. Источник этого слуха не пользуется репутацией обнародования утечек информации, которые впоследствии оправдывались, но тем не менее, переход на технологию 7 нм дает Nvidia большое пространство для размещения дополнительных ядер CUDA и трассировки лучей.

Подводя итог, даже судя по видеопроцессору для центров обработки данных, Ampere обещает геймерам массу новых возможностей. Хотя в Nvidia ни словом не обмолвились о видеоадаптерах GeForce на основе Ampere, можно рассчитывать, что они появятся в этом году. Учитывая, что в ближайшие месяцы появятся видеоадаптеры AMD Radeon с новой архитектурой Big Navi, поддерживающие трассировку лучей, а также игровые консоли следующего поколения на их основе, Nvidia вряд ли упустит возможность нанести ответный удар.