LLVM Clang 15 начнёт быстрее вычислять квадратный корень на процессорах AMD Zen
2026-02-21 08:20 Diff

Любитель научной фантастики и технологического прогресса. Хорошо сочетает в себе заумного технаря и утончённого гуманитария. Пишет про IT и радуется этому.

Недавно авторы LLVM Clang закоммитили в ветку этой версии новые фичи для процессоров AMD Zen. Они добавили поддержку SQRTSS/SQRTPS-инструкций для более быстрого и точного вычисления квадратного корня.

Разработчики отмечают, что эти инструкции относительно быстрые (меньше 14 циклов процессора). Они работают на процессорах Zen 1 и новее, а также являются хорошей альтернативой для простых sqrt (X)-инструкций.

Предложение по их включению возникло в ходе большого обсуждения, где пользователи вместе с разработчиками LLVM Clang пытались понять, как улучшить -mtune для современных процессоров.

LLVM Clang уже получил поддержку подобных инструкций для процессоров Intel — TuningFastScalarFSQRT и TuningFastVectorFSQRT. А для процессоров AMD Zen обновление выпустят лишь в 2022-м.

Поддержка SQRTSS/SQRTPS-инструкций — это одно из единственных изменений для процессоров AMD Zen с сентября 2021 года. Пользователи всё ещё ждут поддержку Zen четвёртого поколения, пока Intel вовсю работает над патчами для Alder Lake и Sapphire Rapids.


Бесплатный курс по Python ➞
Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу