На секцию высокопроизводительных вычислительных систем будут приниматься научные работы, посвященные проблемам и методам проектирования отечественных универсальных микропроцессоров и вычислительных комплексов, их аппаратуры и системного программного обеспечения. Основное внимание уделяется высокой производительности и защищенности вычислительного процесса, двоичной совместимости с доступными ресурсами прикладного программного обеспечения.
Контакты: surchenko_a@mcst.ru
Формат проведения:
Дата и время проведения:
Место проведения:
Реализация «Кузнечик» (ГОСТ Р 34.12-2015) на процессоре без аппаратного ускорения работает очень медленно. Разработан аппаратный модуль блочного шифра «Кузнечик» (ГОСТ Р 34.12-2015) для FPGA, Управление выполнено конечным автоматом, который запускает полное Испытания показали средние затраты 793 такта на установку ключа и 199 тактов на шифрование/расшифрование блока при 100 МГц
Детально описывается метод оценки производительности многоядерного процессора в больших задачах вроде тестов SPEC CPU путём воспроизведения на RTL-модели процессора трасс запросов в память, полученных на потактовом симуляторе процессора с использованием кластерной выборки.
Серверные процессоры Иртыш были представлены компанией "Трамплин Электроникс" в ноябре 2025 года. Они построены на ядрах LA664 архитектуры loongarch64, активно развивающейся в последние годы. ЦПУ Иртыш планируются с 16, 32 и 64 ядрами и частотой 2-2,2 ГГц. В работе освещены особенности и возможности архитектуры loongarch64. Оценка производительности ЦПУ Иртыш проводится по ближайшим аналогам среди ЦПУ Loongson последнего поколения в ряде бенчмарков в сравнении с ЦПУ Эльбрус, Intel, AMD и MTK.
В работе представлена архитектура специализированного потокового векторного процессора для FPGA, предназначенного для ускорения нейросетевых вычислений. Модуль с параметризируемой SIMD-размерностью поддерживает векторные и матричные операции, обеспечивая высокую пропускную способность при минимальном использовании ресурсов. Решение ориентировано на энергоэффективную интеграцию в вычислительные платформы искусственного интеллекта.
Разработка и внедрение специализированных ускорителей для логического вывода нейросетевых моделей требует гибких и адаптируемых средств компиляции, способных учитывать архитектурные особенности целевого оборудования. В данной работе представлено описание механизма компиляции нейронных сетей, ориентированного на аппаратные платформы с тензорной архитектурой и специальным набором инструкций.
В работе рассматриваются особенности процедуры реконфигурации подсистемы памяти современных процессоров архитектуры "Эльбрус" при изменении настроек адресного пространства. Описываются оптимизации процесса синхронизации узлов сети-на-кристалле в рамках этой процедуры, произведенные при разработке последнего поколения процессоров.
В работе рассматривается проблема конкуренции задач за общую кэш-память в многоядерных процессорах. Предлагается решение, позволяющее уменьшить число конфликтов между задачами за счет аппаратного разделения кэш-памяти на основе модификации политики замещения.
В работе рассматривается разработка контроллера проприетарной шины ELPLC-BUS для программируемого логического контроллера «Эльбрус» на базе ПЛИС, предназначенного для замены снятых с производства микросхем приёмопередатчиков UART. Представленная реализация обеспечивает поддержку высокоскоростного обмена по интерфейсу RS-485 и первичную обработку пакетов шины, что позволяет снизить нагрузку на микроконтроллер модуля ввода-вывода.
В работе рассматривается оптимизация аппаратных затрат устройства FMA процессора «Эльбрус» путем замены части унифицированных умножителей мантисс 64x64 бита на умножители разрядности 53x53 бита. Представлены результаты синтеза разработанных RTL-моделей, подтверждающие снижение площади кристалла при сохранении производительности и полной функциональности устройства.
В работе рассматривается разработка и адаптация открытого стека прошивки OpenBMC для контроллера управления базовой платой ASPEED AST2600 в составе серверных платформ на базе микропроцессора «Эльбрус». Предлагается решение, включающее создание специализированного слоя meta-mcst и комплексной системы автоматизированной сборки на базе Docker и bash-скриптов, обеспечивающее полную воспроизводимость результатов сборки, унификацию разработки и сокращение времени отладки прошивки BMC.