Конференции

68-я Всероссийская научная конференция МФТИ

Список разделов ФПМИ - Секция проблем передачи информации, анализа данных и оптимизации

Секция посвящена современным и перспективным направлениям развития информационных технологий

 

 

Контакты:ershov.ei@mipt.ru

Формат проведения: очно

Дата и время проведения: 

Место проведения: Москва, Большой Каретный пер, 19с1, (ИППИ РАН, ауд 615)

  • Применение спектральной съемки для диагностики болезней томата

    В работе представлены результаты применения спектральной съемки в диапазонах VNIR и SWIR для автоматической диагностики болезней томата. С использованием спектральных камер получены спектральные данные листьев с кладоспориозом, фузариозом и мучнистой росой. Разработан метод классификации на основе логистической регрессии; точность разделения семи классов состояния составила свыше 99.9%.

  • Эффективное решение reasoning-задач с ограниченным контекстным окном: метод модельно-управляемого сокращения предложений

    Современные языковые модели сталкиваются с ограничениями контекстного окна при генерации длинных цепочек рассуждений, или reasoning-цепочек, что снижает их применимость к сложным задачам. Предложен метод модельно-управляемого сокращения предложений (Sentence Reduction), который итеративно удаляет наименее важные фрагменты с помощью внутренних способностей модели, сохраняя оригинальную структуру и распределения reasoning-текста без дообучения

  • Улучшение точности подсчета томатов в тепличном хозяйстве за счет использования монокулярной карты глубины

    Работа посвящена повышению точности подсчета томатов в теплице за счет фильтрации плодов по глубине сцены. Сравниваются два подхода: оценка удаленности по монокулярной карте глубины (нейросетевые модели) и по параллаксу на основе трекинга объектов в видео. 

    Показано, что тяжелые модели глубины обеспечивают качество, близкое к ручной фильтрации, а метод по параллаксу значительно повышает точность по сравнению с отсутствием фильтрации и требует меньших вычислительных ресурсов.

  • Геометрическая коррекция и восстановление гиперспектральных изображений по опорному RGB-снимку

    Работа посвящена постобработке гипеспектральных изображений, полученных методом линейного сканирования на щелевую гиперспектральную камеру, установленную на беспилотное воздушное судно. Рассмотрены два этапа: геометрическая коррекция искажений и восстановление пропущенных участков. Для каждого из этапов предложен алгоритм, повышающий качество итогового изображения.

  • Влияние ядерных взрывов на динамику a- и b-значений в законе Гутенберга–Рихтера

    В работе проведён анализ влияния подземных ядерных взрывов на параметры a и b закона Гутенберга–Рихтера. Использовались робастные методы оценки и критерий Чоу для выявления значимых структурных сдвигов. Обнаружены статистически значимые изменения в динамике параметров в 1988–1995 гг.: до этого периода преобладал положительный тренд, а после — стабилизация. Результаты указывают на изменение режима поведения параметров, возможно связанное с прекращением подземных ядерных взрывов.

  • К вопросу о sliced-взаимной информации как надёжной меры статистической зависимости

    Sliced Mutual Information (SMI) широко используется в качестве вычислительно эффективной альтернативы взаимной информации для измерения нелинейной статистической зависимости. Однако наш теоретический и экспериментальный анализ показывает, что несмотря на свою вычислительную эффективность, SMI обладает рядом критических недостатков. Полученные результаты указывают на необходимость крайней осторожности при интерпретации выводов, сделанных на основе этой меры зависимости.

  • Оценка взаимной информации через согласование потоков

    Мы предлагаем новый метод оценки взаимной информации, который коренным образом переосмысливает дискриминативный подход. Вместо обучения классификатора различению совместных и маргинальных распределений, мы обучаем нормализующий поток, который преобразует одно из них в другое. Этот метод позволяет получить вычислительно эффективную и точную оценку взаимной информации, которая хорошо масштабируется до больших размерностей и в широком диапазоне значений истинной взаимной информации.

  • Сравнение политик планирования передач для мультимодального удалённого инференса (AoI)

    Работа посвящена планированию передач данных в системах удалённого мультимодального инференса. Рассматривается выбор модальности при ограниченной пропускной способности сети, поскольку минимизация среднего AoI (Age of Information) не гарантирует минимизацию ошибки инференса из-за нелинейной зависимости потерь от AoI. Сравнение политик показывает преимущество индексной политики по средней ошибке при сопоставимом AoI.

  • Эффективная временная адаптация сверточных нейронных сетей для задачи восстановления видео

    В данной работе предложен метод адаптации предобученных CNN для восстановления видео посредством компактного временного адаптера. На базе NAFNet с модулем MFIRTemporalAdapter (деформируемое выравнивание, внимание) эксперименты на Vimeo-90K и DAVIS-2017 показывают: обучение адаптера превосходит SwinIR на 0,1 дБ PSNR и 0,023 SSIM при 9-кратном снижении вычислительных затрат. Метод обеспечивает быструю адаптацию моделей к видеодомену без роста сложности.

  • Системные методы оценки качества алгоритмов компенсации искажений на гиперспектральных изображениях дистанционного зондирования Земли

    Исследуется влияние атмосферной дымки на решение прикладных задач по гиперспектральным снимкам ДЗЗ и эффективность алгоритмов ее компенсации. Предложен подход к оценке качества дехейзинга через анализ downstream-задач: оконтуривание полей, классификация типов поверхности и сегментация водных объектов. На реальных парных снимках RRealHyperPDID показано, что дымка снижает точность классификации, а алгоритмы компенсации позволяют частично восстановить качество. 

  • Оценка функции соответствия цветов методом строгого замещения

    В работе представлена программная реализация метода измерения функций цветового соответствия (CMF) на основе строгого замещения цветов, как альтернатива классическому методу визуального уравнивания. Эксперименты проводились с использованием акустооптического колориметра. Разработанное программное обеспечение позволяет испытуемому подбирать интенсивности первичных стимулов (R, G, B). В результате получена предварительная оценка индивидуальных CMF для одного наблюдателя с дискретностью 10 нм.

  • К вопросу о применении квантовых генераторов случайных чисел в алгоритмах Метрополис–Гастингс для байесовского вывода в системном анализе IT-систем

    В работе исследуется применение квантовых генераторов случайных чисел (QRNG) в алгоритме Метрополис-Гастингс для байесовского анализа IT-систем. Псевдо-RNG создают корреляции и биасы, замедляя сходимость MCMC при моделировании нагрузки серверов и предсказании сбоев.

    QRNG повышают точность в оптимизации и криптографии. В будущем возможна интеграция в DevOps и quantum-assisted ML к 2030-му году, для масштабируемого управления инфраструктурой.

  • Гессианная оптимизация GPTQ метода пост-квантизации

    Предложен новый метод регуляризации для пост-тренировочного квантования LLM, развивающий GPTQ. Впервые при квантовании слоя учитывается влияние на последующие слои через гессианную оптимизацию. Параметры регуляризации оптимизируются до квантования на основе степенного закона распределения собственных значений гессианов с применением ELBO-лосса. Разработана стратегия выбора слоев, фокусирующаяся на feed-forward блоках. Подход впервые объединяет пост-квантизацию с гессианной оптимизацией.

  • Инициализация дифракционной нейронной сети методом Гершберга-Сакстона

    Построена математическая модель дифракционной нейронной сети на основе уравнения Гельмгольца, описывающая нейросетевую классификацию через дифракцию когерентного излучения на последовательности фазовых масок. Исследовано влияние стратегии инициализации фазовых профилей на сходимость обучения; в качестве альтернативы случайному начальному приближению предложен обобщённый алгоритм Гершберга–Сакстона, адаптированный для многослойной дифракционной системы.

  • Применение AlphaEvolve для решения задач логистической оптимизации

    Рассматривается предложенный DeepMind эволюционный подход AlphaEvolve для решения CVRP (Capacitated Vehicle Routing Problem). Данный метод сравнивается по скорости и качеству с генетическим алгоритмом на задачах с различным размером входных данных и способом задания расстояния. В качестве метрики для оценки результата берётся RMSE, учитывается также время работы алгоритма.

  • Метод переноса модели гиперспектральной реконструкции между различными мультиканальными камерами

    В работе рассматривается задача гиперспектральной реконструкции из цветовых откликов мультикамерной системы. Исследуется возомжность переноса модели реконструкции между различными мультикамерными системами. Предложен метод цветовой коррекции позволяющий улучшить точность реконструкции на домене новой камеры вплоть до 25% .

  • Оценка концентрации хромофоров в коже человека с использованием гиперспектральной камеры

    Мониторинг кожных заболеваний остается актуальной медицинской проблемой. Важную роль в нем играет определение концентраций хрофоморов в коже. Перспективным подходом здесь является использование гиперспектральной съемки. В настоящей работе собран датасет из гиперспектральных снимков фантомов, рассмотрены 3 подхода для решения задачи, произведено их сравнение. Средняя по всем экспериментам относительная ошибка в определении концентрации для наиболее эффективного из подходов составила 31,7%.

  • Разработка нейросетевой метрики цветоразличения человека

    Работа посвящена разработке нейросетевой модели оценки порогов цветоразличения человека. На основе предсказаний модели в пространстве CIE 1931 были построены эллипсы порогового цветоразличения. Для верификации результатов использовался критерий STRESS, посчитанный для моделей CIE 1976, CIEDE200 и CIE Luv.

  • Подготовка базы данных спектров отражения материалов из открытых наборов данных

    Работа посвящена разработке и валидации методики автоматизированного извлечения спектральных характеристик объектов из гиперспектральных наборов данных с помощью сегментационной модели SAM 3 на примере растительности.

  • Улучшение качества гиперспектральной реконструкции с исзользованием больших визуальных моделей

    В работе представлен новый подход для гиперспектральной реконструкции (ГР) с использованием больших предобученных моделей. Метод улучшает современные методы ГР использованием семантических карт для повышения точности работы методов на real-world наборах данных. Метод позволяет получить прирост качества вплоть до 20% по общепринятым метрикам ГР.

  • Метод обучения моделей шумоподавления с информацией о массиве цветовых фильтров для повышения устойчивости к изменениям домена

    В данной работе предложен метод обучения моделей шумоподавления с учётом типа массива цветовых фильтров (CFA) для устойчивости к изменению домена. Используется обуславливание (AdaIN) на основе представлений паттернов CFA от автокодировщика. Модель (UNet) обучена на SIDD (Bayer, Nona-Bayer), тестировалась также на Quad-Bayer. Результаты показали превосходство обусловленной модели по PSNR и SSIM на известных и новых доменах. Подход улучшает обобщающую способность и действует как регуляризатор.

  • Применение трансферного обучения и адаптивной инстанс-нормализации для перехода от синтетического к реальному шуму в задаче шумоподавления видео

    В работе предложен метод шумоподавления видео, устойчивый к дефициту реальных обучающих данных. Подход основан на трансферном обучении. Схема включает предобучение на синтетических данных и последующую адаптацию на малом наборе реальных видео путем выборочного обновления параметров. Эксперименты подтвердили, что метод обеспечивает лучшую обобщающую способность и устойчивость к смене домена (36.49 dB PSNR), превосходя модели, обученные исключительно на реальных или синтетических выборках.

  • Валидация рендеринга Mitsuba 3 на основе гиперспектральных измерений

    В работе предложена методика экспериментальной валидации спектрального рендеринга в Mitsuba 3 на основе гиперспектральных измерений реальных сцен. Выполнено сопоставление синтезированных и измеренных данных для трёхмерных объектов простой геометрии. Точность оценена по метрикам SAM и NSE в выделенных областях интереса. Показано хорошее совпадение формы спектров при амплитудных расхождениях, связанных с калибровкой освещения.

  • Особенности спайкового отклика простого модельного нейрона на стимуляцию стохастическим динамическим паттерном синаптических токов

    Исследованы статистические характеристики генерации спайков стандартным LIF (Leaky Integrate-and-Fire) нейроном — как коллективного эффекта в результате независимой стохастической (пуассоновской) активации нескольких входящих возбуждающих синапсов. Количественно доказано, что при достаточно большой, но физиологически реальной, средней частоте активации LIF нейрон в среднем генерирует спайки так, как если бы его стимулировали постоянным током, равным среднему суммарному синаптическому току.

  • ExtraSAGA: гибридный метод редукции дисперсии в вариационных неравенствах

    Мы предлагаем гибридный метод ExtraSAGA для решения вариационных неравенств, объединяющий технику редукции дисперсии SAGA с экстраградиентным шагом. Приведен теоретический анализ, демонстрирующий линейную сходимость для сильно монотонного случая. Также представлены эксперименты на билинейных задачах, состязательной логистической регрессии и задаче шумоподавления изображений, подтверждающие эффективность подхода.

  • Адаптивные ускоренные методы первого порядка для (L0-L1)-гладких функций в случае неточной информации о градиенте.

    В данной работе мы предлагаем адаптивные модификации ускоренных методов оптимизации первого порядка (подобных треугольников и SESOP) для (L0-L1)-гладких функций, используя только нормированный градиент. Также рассмотрен сценарий с неточной информацией и о нормированном градиенте с доступом лишь к сравнительному оракулу. Для этого случая модифицирован классический градиентный спуск. Сходимость алгоритмов доказана теоретически и подтверждена экспериментально.

  • Исследование перцептивной геометрии цвета во внутренних представлениях VLM

    В работе исследуется перцептивная геометрия цвета во внутренних представлениях Qwen2.5-VL на датасетах Манселла и COMBVD. Эти представления содержат линейно декодируемую информацию о малых и больших цветовых расстояниях, указывая на сходство с зрительной системой человека. Для подтверждения применено метрическое обучение линейного преобразования, минимизирующее разницу между евклидовыми расстояниями в пространстве представлений и психофизическими метриками.

  • Thinking like a CHEMIST: Бимодальная архитектура для получения физических обоснованных обучаемых представлений молекул

    В работе представлена бимодальная архитектура для получения химически обоснованных векторных представлений молекул, объединяющая трансформер RoBERTa на физико-химических дескрипторах подструктур и графовую нейронную сеть на молекулярном графе. Подход преодолевает ограничения строковых представлений SMILES, обеспечивая более содержательные эмбеддинги. Эксперименты на бенчмарках, включая QM9, FreeSolv, ClinTox и Tox21, подтверждают эффективность метода в задачах регрессии и классификации.

  • ML-моделирование сложных металлоорганических со-кристаллов: преодоление сдвига домена и дефицита негативных примеров

    Разработана классификационная модель на основе градиентного бустинга для предсказания образования трёхкомпонентных со-кристаллов. Так как негативные примеры отсутствуют в литературе, предложен подход к их генерации. Для извлечения структурных данных создан пайплайн, обрабатывающий трёхмерные геометрии молекул без ручного вмешательства. Данный пайплайн позволяет применять модель не только в домене органической химии, но и для металлокомплексов, остающихся за рамками большинства исследований.

  • Адаптация и валидация confidence-аудитора для обнаружения дрейфа в задачах классификации текстов

    В работе исследуется возможность обнаружения дрейфа данных в задачах классификации текстов на основе анализа распределения уверенности модели. Предложенный подход основан на применении confidence-аудитора и не требует доступа к исходным данным или их разметке. Проведена эмпирическая валидация метода на задаче анализа тональности русскоязычных текстов с использованием моделей TF-IDF и RuBERT при различных сценариях языкового дрейфа.

  • Расширение метода Retag для выявления ошибок конвертации на примере морфологической разметки корпуса СинТагРус

    Предложен метод выявления ошибок, возникающих при конвертации размеченных данных из одной схемы аннотации в другую. Метод основан на сравнении предсказаний нейросетевых классификаторов, обученных на исходной и сконвертированной версиях одного набора данных: расхождения в пользу исходной разметки указывают на ошибки конвертации. Эффективность подхода показана на морфологической разметке корпуса СинТагРус и его версии в формате Universal Dependencies.

  • Исследование цветового восприятия мультимодальных больших языковых моделей

    В работе исследуется цветовая константность MLLM на примере Qwen3-VL. Разработан физически корректный бенчмарк на основе гиперспектральных изображений, учитывающий спектральные свойства материалов и освещения, в отличие от RGB-аналогов. Проведён психофизически корректный эксперимент (метод асимметричного цветового сопоставления), адаптированный  для модели как задача множественного выбора. Результаты проанализированы с помощью стандартных психофизических метрик (BR, CI).

  • Исследование точности определения положения камеры при использовании цветных плоских шаблонов

    Работа посвящена исследованию точности определения положения камеры при использовании цветных плоских шаблонов на основе фидуциальных маркеров. Рассмотрен метод поканальной обработки изображения двухцветного маркера, направленный на повышение устойчивости и точности оценки ориентации. Экспериментальное исследование выполнено на основе видеоданных, полученных откалиброванной камерой. В качестве метрики точности использован угол относительного поворота.