Конференция 67 МФТИ

Методы повышения эффективности RAG-систем информационного поиска за счёт оценки качества эмбеддингов

20 февраля
Майя Котыга

Большие языковые модели получили распространение из-за способности решать широкий спектр задач. Но они демонстрируют тенденцию к генерации галлюцинаций. В рамках данного исследования разработан класс методов, которые повышают устойчивость RAG (Retrieval Augmented Generation) — системы, сочетающей поиск релевантной информации в базе знаний и формирование ответа, к генерации ложной информации.

Использование графовых нейросетевых архитектур для решения задачи дезагрегации потребления энергии

24 февраля
Андрей Атаян

Одной из ключевых задач в области энергоэффективности является мониторинг и анализ потребления электроэнергии.
В данной работе рассматривается применение графовых нейронных сетей в задаче дезагрегации энерегии.

Эффективное сжатие пространственно-временных данных методами самообучения

28 февраля
Александр Марусов

Методы самообучения позволяют тренировать модели машинного обучения на неразмеченных данных. В данной работе была обобщена модель самообучения, предназначенная для обработки временных рядов, на пространственно-временной случай. В качестве прикладной задачи была выбрана актуальная проблема предсказания засухи для выбранного региона.

Прототип модели принятия легитимных и этичных решений автономными системами искусственного интеллекта при управлении корпорациями

28 февраля
Анна Романова

В докладе представлен прототип модели принятия легитимных и этичных решений автономными системами искусственного интеллекта (далее ИИ) при управлении корпорациями. Прототип выпущен по лицензии MIT (https://github.com/iboard-project/prototype). Программный код исследования и набор искусственных данных доступны в репозитории: https://github.com/iboard-project.

Методы машинного обучения для бинарной классификации рамановских спектров кожи пациентов с заболеваниями сердца.

28 февраля
Елизавета Ерзикова

В работе представлены результаты детального изучения методов PCA и PLS для выделения информативных признаков в спектральных данных. Показана эффективность использования выделенных признаков в моделях машинного обучения SVM и GaussianNB.

Слияние динамических и статических признаков для точной классификации болезни Паркинсона

1 марта
Аоди Дин

Использовались данные CASIA-B и видеозаписи патологической походки. Статические признаки извлекались с помощью Mask R-CNN и ResNet-18, а динамические — на основе OpenPose, включая частоту шагов, длину шага и движения рук. Для объединения признаков разработан модуль слияния на основе механизма внимания. Итоговые признаки подавались в полносвязанный классификатор.

Speculative decoding for large batch size

2 марта
Василий Калугин

Спекулятивное декодирование стало популярным методом для ускорения генерации ответов большими языковыми моделями, сохраняя при этом качество ответов. Однако методы спекулятивного декодирования, разработанные для обработки одного запроса за раз (batch size = 1), не так эффективны при работе с большими пакетами запросов (batch size ≥ 8). В данной работе предлагается метод спекулятивного декодирования, который эффективно работает с большими пакетами запросов (batch size ≥ 8).

Нейронные сети для анализа наборов генетических данных: Решение проблемы нехватки и сложности данных

2 марта
Татьяна Марьяновская

Применение стохастического обучения модели нейронной сети для решения задач популяционной генетики

Применение графа сцены в задаче иерархического планирования антропоморфного робота

2 марта
Ева Бакаева

В данной работе предлагается использование графа сцены, сформированного модулем визуальной сегментации, для улучшения результата перепланирования в реальном времени. Такой подход позволяет обрабатывать запросы с использованием общих терминов, корректировать план при блокировании объектами взаимодействия с находящимися рядом, а также корректировать план под актуальные положения объектов.

Восстановление метрических карт глубин нейросетвыми методами с использованием особых меток объектов трехмерной сцены

2 марта
Александр Лазарев

Классические методы восстановления глубины включают стереозрение и использование лазерных сканеров, однако эти подходы имеют ряд ограничений. В этом исследовании предлагается подход, в котором для восстановления метрических карт глубин используется нейросеть, с последующей калибровкой карты глубин на основе детекции особых меток. Такой подход позволяет повысить точность и качество карт глубин.

Бинарная классификация МРТ снимков головного мозга с использованием гибридной квантово-классической нейронной сети

3 марта
Артем Рафиков

Изучение возможностей гибридных квантово-классических нейронных сетей для решения задачи классификации в бинарном исполнении. В данной работе представлен выйгрыш такого метода и возможности.

Модульная нейронная сеть с селективной заморозкой и отсоединяемым классификатором

3 марта
Аркадий Лебедев

В данной работе представлена модульная нейронная сеть, использующая селективную заморозку базового экстрактора и отсоединяемый классификатор для эффективного трансферного обучения и иерархической классификации. Реализация трёхэтапного цикла обучения на CIFAR-10 и CIFAR-100 демонстрирует, что предложенный подход позволяет достичь сопоставимых или более высоких показателей точности при снижении вычислительных затрат.

Оптимизация задачи детекции аномальных событий в видеоданных с одновременной минимизацией параметрической сложности

3 марта
Анна Зверева

Настоящее исследование посвящено анализу влияния различных конфигураций гибридных нейросетевых архитектур на эффективность детекции аномальных событий в видеопоследовательностях. В рамках работы рассмотрены модели, комбинирующие сверточные сети/блоки внимания для пространственного анализа и рекуррентные/трансформерные блоки для обработки временной динамики. Основной целью является разработка легковесной архитектуры, обеспечивающей высокий уровень точности при минимальном количестве параметров.

Применение методов неконтролируемой адаптации домена для переноса детекции объектов с полученных в симуляции изображений на реальные

3 марта
Данис Зубаиров

Данная работа направлена на применение в роботехнике, где часто возникает необходимость сбора и разметки датасета для задачи детекции. Предлагается автоматизировать процесс получения сбора и разметки изображений с помощью симулятора, а затем использовать методы адаптации домена для решения проблемы доменного сдвига между изображениями из симуляции и реальности.

Метод высокопроизводительного поиска аномалий во временных рядах на основе байесовских нейронных сетей

3 марта
Дмитрий Коврижных

В работе предлагается метод детекции аномалий во временных рядах, основанный на байесовских нейронных сетях. Подход использует вероятностные апостериорные распределения весов, что позволяет учитывать неопределённость и повышать надёжность обнаружения аномальных точек. Предложенная архитектура обучается в режиме без учителя (unsupervised learning) и способна адаптироваться к широкому спектру данных — от промышленных сигналов до финансовых индикаторов.

ETIA: Оптимизация эмоционального реагирования в LLMs

3 марта
Иван Насонов

В этой работе мы предлагаем метрику текстового воздействия с учетом эмоций ETIA (Emotion-Aware Textual Influence Activation), которая автоматически определяет эффективные эмоциональные промпты LLM на основе значений активаций в моделе. Результаты экспериментов подтверждают, что мы можем эффективно улавливать эмоциональное воздействие, что было продемонстрировано на моделях Gemma-2, LLaMA-3.3 и Qwen-2.5.

Применение методов лидарной одометрии для уплотнения облака точек в задаче 3D сегментации

3 марта
Владислав Дюжев

В работе исследуется подход к улучшению качества сегментации дороги путем уплотнения лидарного облака точек за счет использования лидарной одометрии. Полученные результаты могут быть применены при проектировании систем автономного транспорта.

VerifyLLM: Предварительная верификация планов робототехнических задач с использованием больших языковых моделей

3 марта
Данил Григорьев

В работе представлена VerifyLLM — система верификации планов роботов перед выполнением. Объединяя большие языковые модели с темпоральной логикой, система выявляет позиционные ошибки, отсутствие предусловий и избыточные действия. Тесты на наборах данных ALFRED-LTL и VirtualHome-LTL показывают улучшение метрики LCS в 2.5 раза и сокращение ошибок порядка вдвое. Абляционные исследования подтверждают критическую важность обоих компонентов, особенно модуля LLM-верификации.

Watermark Overwriting Attack on StegaStamp algorithm

3 марта
Ирина Серженко

В работе представлен метод атаки на алгоритм нанесения водяных знаков StegaStamp, полностью удаляющий водяные знаки с изображения с минимальной потерей качества, разработанный в рамках соревнования от NeurIPS “Erasing the invisible”.

Оптимизация больших языковых моделей посредством удаления слоев нейросети

3 марта
Александр Бучинский

В работе изучаются методы оптимизации больших языковых моделей (LLM) путем удаления слоев и квантизации весов. Рассмотрен алгоритм удаления слоев на основе углового расстояния между представлениями. Проведены эксперименты с моделями семейства Gemma, измерены перплексия (PPL) и снижение потребления видеопамяти. Для восстановления качества после оптимизации использован LoRA-адаптер, что позволило повысить точность генерации при сокращении объема модели.

Разработка системы обнаружения препятствий и дефектов дорожного покрытия

3 марта
Ольга Матыкина

Представлена система реального времени для обнаружения дефектов дороги и препятствий в сложных погодных условиях на основе стерео-камеры. Используются модели Mask2Former для сегментации дефектов и YOLOv11-seg для обнаружения объектов. Обучение проведено на собственных и открытых датасетах. Система достигает mIoU = 73.47%, работает со скоростью 14 FPS на RTX 4070 и обеспечивает надежную детекцию в сложных условиях.

Модернизация и применение моделей лидарной 3D-детекции в системах восприятия беспилотных автомобилей

3 марта
Илья Царин

Исследование фокусируется на анализе современных методов 3D-детекции на основе лидарных данных и делает акцент на улучшении эффективности работы алгоритма VoxelNeXt, что позволяет добиться инференса в режиме реального времени на видеокартах уровня GTX3060Ti при сохранении качества работы. Кроме этого, демонстрируется практическое применение алгоритма в настоящем беспилотном автомобиле.

Улучшение методов детекции сгенерированных текстов

3 марта
Дмитрий Балобин

В работе представлен новый подход к детекции машинно-сгенерированных текстов, показывающий на выбранном бенчмарке SOTA результаты. Он основан на применении понижения размерности конкретного внутреннего представления предобученной модели-декодировщика с последующей классификацией. С ним сравниваются текущие наиболее эффективные модели классификации. Также проводится анализ скрытых слоёв LLM и их влияние на модель выявления сгенерированных текстов.

Приложение больших языковых моделей для генерации мелодии в символьном домене по тексту песни

3 марта
Виталий Фархитдинов

В работе исследуется применение больших языковых моделей для генерации мелодий в символьном домене на основе текста песен. Основная задача — создание мелодии, где каждой ноте соответствует слог из исходного текста. Для решения задачи были дообучены три модели: Llama 3.1, Saiga и Vykhr, с использованием двух этапов обучения: pretrain на датасете мелодий и SFT на инструкциях по генерации мелодий.

Securing MLOps Platform: A STRIDE-Based Threat Modeling Approach for Machine Learning Service Deployment Pipeline

3 марта
Пуцзюнь Се

We systematically analyzed vulnerabilities, identified threats and summarized the mitigation strategies in a MLOps platform through STRIDE threat modeling.

Применение нейросетевых моделей для определения физических свойств объектов на изображениях

3 марта
Маргарита Кичик

Собран датасет с разметкой по материалам объектов на изображениях. Проведена валидация моделей семантической сегментации и визуальных языковых моделей.

Улучшение качества сегментации объектов с помощью текстового описания

3 марта
Лука Ветошкин

В работе рассматривается проблема сегментации тонких и вытянутых объектов, таких как провода, шланги и неровности поверхности. Современные модели часто ошибаются при их выделении из-за малых размеров, размытых границ и схожести с фоном.

Для решения этой проблемы предложен метод, улучшающий сегментацию с использованием текстового описания сцены. Разработанная архитектура HQ-SAM-Text интегрирует текстовую информацию, что повышает точность выделения сложных объектов.

Мультимодальная модель для диагностики широкого спектра заболеваний

3 марта
Иван Корзун

Для совершенствования методов диагностики заболеваний перспективно применение мультимодальных моделей, способных анализировать всю доступную информацию. В настоящей работе проведен анализ эффективности сочетанного использования данных пола, возраста и результатов общего анализа крови, электрокардиографии и рентгенографии органов грудной клетки – одних из наиболее простых, доступных и широко используемых методов диагностики – относительно максимально широкого спектра заболеваний.

Коррекция плана поведения агента в динамических средах с помощью визуальной обратной связи

3 марта
Максим Патрацкий

Предлагается новый метод LERa для корректировки плана действий поведения агента в виртуальной среде. Данный подход был аппробирован на виртуальных средах ALFRED, PyBullet и реальном роботе манипуляторе.

LEG-SLAM: Language-Enhanced Gaussian Splatting for Real-Time SLAM

3 марта
Роман Титков

В данной работе представлен LEG-SLAM (Language-Enhanced Gaussian Splatting SLAM) — первая система, объединяющая SLAM, Gaussian Splatting и языковые признаки для реконструкции трехмерных сцен в реальном времени с возможностью семантического анализа на основе текстовых запросов.

Эксперименты на Replica и ScanNet демонстрируют, что LEG-SLAM достигает 10 FPS на Replica и 18 FPS на ScanNet, что значительно превосходит существующие методы.

Разработка методов нейронного оптимального транспорта для трансфера голоса

3 марта
Гребняк Ярослав

Исследовано применение нейронного оптимального транспорта для трансфера голоса. Эксперименты показали улучшение метрики FAD при умеренном росте EER и WER, обеспечивая гибкий компромисс между качеством синтеза и точностью распознавания речи.

A Lyapunov Approach for Reinforcement Learning with guarantees

3 марта
Григорий Ярёменко

This work presents and showcases a novel reinforcement learning agent which is model-free and ensures online environment stabilization. Online means that in each learning episode, the environment is stabilized. The base actor-critic scheme of the proposed approach is analogous to SARSA, however unlike SARSA it comprises Lyapunov-like constraints that ensure asymptotic stability. This was confirmed with a formal result.

К вопросу об автоматическом обнаружении и выявлении причин возникновения аномалий во временных рядах

3 марта
Алексей Захаров

В работе рассмотрена задача детектирования и классификации аномалий во временных рядах применительно к открытому датасету 3W. Предложена и реализована архитектура модели на основе энкодера трансформера, учитывающая широкий контекст входных эмбедингов. В конце работы озвучены направления дальнейшего развития для достижения SOTA результатов на выбранном датасете

Разработка программного модуля для варьирования параметров симуляционных сред

4 марта
Роман Симонов

В данной работе представлен программный модуль для варьирования физических и визуальных параметров симуляционной среды на базе платформы IsaacSim, разработанный для генерации разнообразных сценариев для обучения и тестирования моделей.

Fourier KAN: обзор и сравнение с MLP в контексте нейронных сетей Колмогорова-Арнольда

4 марта
Александр Иванов

В работе представляется обзорная характеристика KAN с упором на их концептуальные отличия от классических MLP. Особое внимание уделяется вариациям архитектуры KAN, основанным на идеях использования преобразования Фурье. Обсуждаются примеры использования KAN в задачах анализа данных и возможные пути дальнейших улучшений, включая смешанные подходы (гибриды KAN и MLP), а также аспекты оптимизации периодических функций активации.

Разработка и применение методов машинного обучения для автоматической коррекции оценок

10 марта
Даниэль Баймурзин

Современные методологии управления проектами сталкиваются с проблемой неточных оценок трудозатрат и времени выполнения задач. Ошибочные прогнозы приводят к нарушению сроков, перерасходу ресурсов и ухудшению качества продукта. В данной работе рассматривается применение методов машинного обучения автоматической корректировки оценок задач

Новый взгляд на трансформеры в онлайн обучении с подкреплением для непрерывного управления

10 марта
Никита Качаев

В работе исследуется эффективность трансформерных моделей и методы повышения их стабильности и устойчивости в онлайн обучении с подкреплением для задач непрерывного управления. Для этого проводится сравнительный анализ моделей на основе GPT-2, LSTM, MLP на средах MuJoCo и ManiSkill3 с использованием алгоритмов PPO и TD3. Полученные результаты подтверждают потенциал трансформеров как универсальной архитектуры для онлайн RL и открывают перспективы для дальнейших исследований.

Адаптация мультимодальных моделей как инструмент анализа медицинских изображений в специализированных задачах диагностики

10 марта
Вадим Сечин

Работа посвящена адаптации мультимодальных моделей машинного обучения для медицинской диагностики. Предложен подход дообучения предобученной модели с использованием техник тонкой настройки и квантования весов для снижения вычислительных требований. Проведено сравнение адаптированной и исходной моделей. Показано, что предложенные методы улучшают качество генерации медицинских отчётов по изображениям, подтверждая перспективность их применения в автоматизированной диагностике.

67-я Всероссийская научная конференция МФТИ

Список разделов ФПМИ - Секция технологий искусственного интеллекта