Portal Prelude RTX привносит классическую модификацию Source на передовые технологии графики

Portal Prelude RTX - classic Source modification with advanced graphical technologies.

Portal: Prelude RTX представляет собой впечатляющий показ технологии RTX Remix от Nvidia, которая превращает мод для Portal, созданный на движке Source, в игру с визуальными особенностями и технологиями, которые не уступают и даже превосходят высокопрофильные AAA-проекты. Это действительно захватывающе – и, надеюсь, один из многих ремастеров с трассировкой лучей, которые появятся в будущем, по мере приближения выпуска инструментов моддинга RTX Remix.

Еще более интересным является то, что Prelude также является первой игрой, поддерживающей RTX IO – схему аппаратного ускорения распаковки, работающую на базе Vulkan. Это, по сути, брендированная версия Direct Storage 1.2 от Nvidia, которая также включена в Ratchet and Clank: Rift Apart, выходящую на ПК в этом месяце. Его цель – ускорить загрузку игры и потоковую передачу активов на ПК-платформе, и его включение здесь дает нам хорошую возможность увидеть, как работает эта технология.

Исторически загрузка включала передачу игровых данных, таких как текстуры или модели, с жесткого диска в системную память, а затем на GPU под управлением ЦП. Это был довольно медленный подход с большой задержкой, так как диск должен был физически запустить вращение шпинделя, найти данные, а затем блок за блоком загружать данные таким образом, чтобы минимизировать количество необходимых поисков.

Вот полное видео Алекса Баттальи о RTX IO в Portal: Prelude RTX.

Эта техника достаточно хорошо сработала с относительно небольшими игровыми активами, загружаемыми с HDD, но сейчас игры занимают сотни гигабайт и содержат крайне детализированные активы, все эти данные должны быть сжаты, чтобы эффективно использовать доступное пространство хранения и пропускную способность. Это означает, что активы должны быть распакованы ЦП, прежде чем они могут быть использованы на GPU, и дополнительное время и нагрузка на ЦП, вызванные этим, означают, что традиционный подход начинает терять свою эффективность.

К счастью, появление быстрого флэш-хранилища с низкой задержкой в SSD означает, что нам больше не нужно читать данные последовательно, чтобы минимизировать время поиска – мы можем создать новый стандарт. Во-первых, мы хотим получать доступ к данным параллельно, чтобы значительно сократить время загрузки по сравнению с традиционным стандартом ввода-вывода Windows. Во-вторых, мы хотим убедиться, что данные перемещаются с хранилища на GPU перед их распаковкой. Графические процессоры имеют множество ядер и лучше справляются с параллельными задачами, такими как распаковка, чем ЦП, поэтому этот подход экономит много времени. Это новая система, задуманная для RTX IO и Direct Storage 1.2, и она обеспечивает более быструю загрузку и, при использовании в игровом процессе для потоковой передачи данных, снижение нагрузки на ЦП, что потенциально может улучшить производительность.

Для RTX IO, как в случае с Portal Prelude RTX, данные на диске сжимаются с использованием формата GDeflate и временно перемещаются в системную память, затем на VRAM и распаковываются там с помощью GPU. Формат GDeflate – это открытый стандарт сжатия GPU от Nvidia, который был передан Microsoft и Kronos Group, и это формат, который, как я ожидаю, будет использоваться в играх Direct Storage 1.2 с поддержкой DirectX на ПК, поддерживаемых графическими процессорами Nvidia, AMD и Intel.

Это объяснение лучше всего работает в видеоформате, но основная идея RTX IO заключается в том, что мы снижаем нагрузку на ЦП, распаковывая данные непосредственно на GPU и ускоряя время загрузки путем параллельного чтения данных с SSD.

В отличие от этого, Portal Prelude RTX использует графический API Vulkan, для которого не существует универсальных вызовов, не зависящих от производителя, для аппаратной распаковки GPU; насколько мне известно, в настоящее время есть только предложенные расширения от Nvidia. Эти расширения от Nvidia для аппаратной распаковки GPU могут потенциально стать теми, которые будут полностью адаптированы группой Kronos для Vulkan-эквивалента Direct Storage. Тем временем быстрая аппаратная распаковка на GPU в Portal Prelude: RTX будет работать только на драйверах, поддерживающих эти конкретные расширения, то есть на графических картах Nvidia RTX.

Однако Portal Prelude RTX все еще работает в рамках более традиционной парадигмы загрузки, что означает, что RTX IO не увеличивает частоту кадров. В конце концов, RTX Remix не заменяет игровой движок или не изменяет способ разделения и загрузки уровней; RTX Remix просто меняет способ рендеринга и загрузки активов, необходимых для этого рендеринга. Это отличается от Ratchet and Clank: Rift Apart, которая также должна использовать аппаратную распаковку GPU для ускорения игрового процесса. Поэтому Portal Prelude RTX в основном получает преимущества в виде сокращения времени загрузки и времени загрузки текстур.

Чтобы проверить, как сильно технология влияет на игру, я протестировал сборку игры, запущенную без включенного RTX IO и работающую с ограниченной до 500 МБ/с скоростью SATA SSD. Игра загружается достаточно быстро, но текстуры требуют некоторого времени, чтобы достичь своего максимального качества – без сжатия GDeflate RTXIO, игра на диске полностью несжата и занимает около 60 процентов больше места. Таким образом, пропускная способность соответствующе увеличивается для перемещения текстур в VRAM, требуя немного больше секунды для загрузки последней текстуры. С включенным RTX IO, та же самая текстура на SATA SSD загружается за время, меньшее чем в два раза.

Конфигурация Загрузка игры Загрузка текстур
12900K + 500 МБ/с SATA SSD + RTX IO выключен 1.13 секунды 2.36 секунды
12900K + 500 МБ/с SATA SSD + RTX IO включен 0.67 секунды 1.16 секунды
12900K + 3.5 ГБ/с NVMe SSD + RTX IO выключен 0.57 секунды 1.45 секунды
12900K + 3.5 ГБ/с NVMe SSD + RTX IO включен 0.53 секунды 1.07 секунды

Это не самая большая разница в реальном мире, так как полсекунды проходит мгновенно, но уменьшение времени в два раза все равно впечатляет. После проведения нескольких тестов в разных конфигурациях у меня есть два интересных вывода. Во-первых, SATA-накопитель с протоколом RTX IO включенным превосходит NVMe-накопитель с протоколом RTX IO выключенным – довольно впечатляюще. Во-вторых, различия в аппаратных характеристиках ЦП и ГП не оказывали значительного влияния на время загрузки, система с RTX 2060 Super + Core i9 12900K проявляла почти такую же производительность, как и система с тем же ЦП и флагманской RTX 4090; система с RTX 4070 и Ryzen 5 3600 также была очень близка по времени загрузки.

Таким образом, Portal: Prelude RTX является многообещающим первым использованием этой технологии на ПК, но в то же время обыденным, так как она применяется к игре, которая изначально использует старую парадигму загрузки. В играх, которые используют активную потоковую передачу и не имеют экранов загрузки никакого вида, например Ratchet and Clank: Rift Apart и другие будущие игры, именно здесь эта технология покажет свою настоящую силу. Конечно, мы с нетерпением ждем возможности рассмотреть эту игру в ближайшее время, так как она выйдет на ПК 26 июля – так что оставайтесь с нами.