Конференция 68 МФТИ

Конференции

68-я Всероссийская научная конференция МФТИ

Список разделов ФРКТ - Cекция высокопроизводительных вычислительных систем

На секцию высокопроизводительных вычислительных систем будут приниматься научные работы, посвященные проблемам и методам проектирования отечественных универсальных микропроцессоров и вычислительных комплексов, их аппаратуры и системного программного обеспечения. Основное внимание уделяется высокой производительности и защищенности вычислительного процесса, двоичной совместимости с доступными ресурсами прикладного программного обеспечения.

Контакты: surchenko_a@mcst.ru

Формат проведения: онлайн

Дата и время проведения: 03.04.2026 в 11:00

Место проведения: онлайн платформа

Реализация шифрования Kuznyechik на FPGA
- 27 февраля
- Николай Задиран
Реализация «Кузнечик» (ГОСТ Р 34.12-2015) на процессоре без аппаратного ускорения работает очень медленно. Разработан аппаратный модуль блочного шифра «Кузнечик» (ГОСТ Р 34.12-2015) для FPGA, Управление выполнено конечным автоматом, который запускает полное Испытания показали средние затраты 793 такта на установку ключа и 199 тактов на шифрование/расшифрование блока при 100 МГц
Моделирование многоядерного процессора на основе трасс событий на уровне RTL
- 27 февраля
- Юрий Недбайло
Детально описывается метод оценки производительности многоядерного процессора в больших задачах вроде тестов SPEC CPU путём воспроизведения на RTL-модели процессора трасс запросов в память, полученных на потактовом симуляторе процессора с использованием кластерной выборки.
Оценка производительности и возможностей процессоров на архитектуре loongarch64 в сравнении с Эльбрус, Intel, AMD и ARM.
- 28 февраля
- Александр Зубанков
Архитектура loongarch64 активно развивается в последние годы. Серверные ЦПУ Loongson 3C6000 на ядрах LA664 с 32, 64 и 128 потоками и частотой 2-2,2 ГГц показывают достойный уровень производительности, составляя конкуренцию процессорам других архитектур. В работе освещены особенности и возможности архитектуры loongarch64. Производительность Loongson последнего поколения оценивалась среди встраиваемых, настольных и серверных ЦПУ в ряде бенчмарков в сравнении с ЦПУ Эльбрус, Intel, AMD и ARM.
Специализированная аппаратная архитектура расчета операций линейной алгебры для отечественной вычислительной платформы под задачи искусственного интеллекта
- 28 февраля
- Дарья Ильянова
В работе представлена архитектура специализированного потокового векторного процессора для FPGA, предназначенного для ускорения нейросетевых вычислений. Модуль с параметризируемой SIMD-размерностью поддерживает векторные и матричные операции, обеспечивая высокую пропускную способность при минимальном использовании ресурсов. Решение ориентировано на энергоэффективную интеграцию в вычислительные платформы искусственного интеллекта.
Механизм компиляции вычислительного графа нейросетевых моделей для аппаратной платформы искусственного интеллекта STIVIA
- 28 февраля
- Андрей Рожин
Разработка и внедрение специализированных ускорителей для логического вывода нейросетевых моделей требует гибких и адаптируемых средств компиляции, способных учитывать архитектурные особенности целевого оборудования. В данной работе представлено описание механизма компиляции нейронных сетей, ориентированного на аппаратные платформы с тензорной архитектурой и специальным набором инструкций.
Реконфигурация подсистемы памяти при изменении настроек адресного пространства в процессорах «Эльбрус» седьмого поколения
- 28 февраля
- Александр Сурченко
В работе рассматриваются особенности процедуры реконфигурации подсистемы памяти современных процессоров архитектуры "Эльбрус" при изменении настроек адресного пространства. Описываются оптимизации процесса синхронизации узлов сети-на-кристалле в рамках этой процедуры, произведенные при разработке последнего поколения процессоров.
Реализация метода аппаратного разделения кэш-памяти на основе модификации политики замещения
- 1 марта
- Тихон Рябых
В работе рассматривается проблема конкуренции задач за общую кэш-память в многоядерных процессорах. Предлагается решение, позволяющее уменьшить число конфликтов между задачами за счет аппаратного разделения кэш-памяти на основе модификации политики замещения.
Разработка контроллера шины ELPLS-BUS на базе ПЛИС для ПЛК «Эльбрус»
- 1 марта
- Владислав Матвеев
В работе рассматривается разработка контроллера проприетарной шины ELPLC-BUS для программируемого логического контроллера «Эльбрус» на базе ПЛИС, предназначенного для замены снятых с производства микросхем приёмопередатчиков UART. Представленная реализация обеспечивает поддержку высокоскоростного обмена по интерфейсу RS-485 и первичную обработку пакетов шины, что позволяет снизить нагрузку на микроконтроллер модуля ввода-вывода.
Уменьшение аппаратных затрат для устройства FMA в процессоре «Эльбрус»
- 1 марта
- Александр Степанов
В работе рассматривается оптимизация аппаратных затрат устройства FMA процессора «Эльбрус» путем замены части унифицированных умножителей мантисс 64x64 бита на умножители разрядности 53x53 бита. Представлены результаты синтеза разработанных RTL-моделей, подтверждающие снижение площади кристалла при сохранении производительности и полной функциональности устройства.
Разработка и внедрение системы управления платой вычислительной платформы на базе микропроцессора «Эльбрус» с использованием OpenBMC
- 2 марта
- Виктор Новиков
В работе рассматривается разработка и адаптация открытого стека прошивки OpenBMC для контроллера управления базовой платой ASPEED AST2600 в составе серверных платформ на базе микропроцессора «Эльбрус». Предлагается решение, включающее создание специализированного слоя meta-mcst и комплексной системы автоматизированной сборки на базе Docker и bash-скриптов, обеспечивающее полную воспроизводимость результатов сборки, унификацию разработки и сокращение времени отладки прошивки BMC.