Секция посвящена современным и перспективным направлениям развития информационных технологий
Контакты:ershov.ei@mipt.ru
Формат проведения: очно
Дата и время проведения:
Место проведения: Москва, Большой Каретный пер, 19с1, (ИППИ РАН, ауд 615)
В работе представлены результаты применения спектральной съемки в диапазонах VNIR и SWIR для автоматической диагностики болезней томата. С использованием спектральных камер получены спектральные данные листьев с кладоспориозом, фузариозом и мучнистой росой. Разработан метод классификации на основе логистической регрессии; точность разделения семи классов состояния составила свыше 99.9%.
Современные языковые модели сталкиваются с ограничениями контекстного окна при генерации длинных цепочек рассуждений, или reasoning-цепочек, что снижает их применимость к сложным задачам. Предложен метод модельно-управляемого сокращения предложений (Sentence Reduction), который итеративно удаляет наименее важные фрагменты с помощью внутренних способностей модели, сохраняя оригинальную структуру и распределения reasoning-текста без дообучения
Работа посвящена повышению точности подсчета томатов в теплице за счет фильтрации плодов по глубине сцены. Сравниваются два подхода: оценка удаленности по монокулярной карте глубины (нейросетевые модели) и по параллаксу на основе трекинга объектов в видео.
Показано, что тяжелые модели глубины обеспечивают качество, близкое к ручной фильтрации, а метод по параллаксу значительно повышает точность по сравнению с отсутствием фильтрации и требует меньших вычислительных ресурсов.
Работа посвящена постобработке гипеспектральных изображений, полученных методом линейного сканирования на щелевую гиперспектральную камеру, установленную на беспилотное воздушное судно. Рассмотрены два этапа: геометрическая коррекция искажений и восстановление пропущенных участков. Для каждого из этапов предложен алгоритм, повышающий качество итогового изображения.
В работе проведён анализ влияния подземных ядерных взрывов на параметры a и b закона Гутенберга–Рихтера. Использовались робастные методы оценки и критерий Чоу для выявления значимых структурных сдвигов. Обнаружены статистически значимые изменения в динамике параметров в 1988–1995 гг.: до этого периода преобладал положительный тренд, а после — стабилизация. Результаты указывают на изменение режима поведения параметров, возможно связанное с прекращением подземных ядерных взрывов.
Sliced Mutual Information (SMI) широко используется в качестве вычислительно эффективной альтернативы взаимной информации для измерения нелинейной статистической зависимости. Однако наш теоретический и экспериментальный анализ показывает, что несмотря на свою вычислительную эффективность, SMI обладает рядом критических недостатков. Полученные результаты указывают на необходимость крайней осторожности при интерпретации выводов, сделанных на основе этой меры зависимости.
Мы предлагаем новый метод оценки взаимной информации, который коренным образом переосмысливает дискриминативный подход. Вместо обучения классификатора различению совместных и маргинальных распределений, мы обучаем нормализующий поток, который преобразует одно из них в другое. Этот метод позволяет получить вычислительно эффективную и точную оценку взаимной информации, которая хорошо масштабируется до больших размерностей и в широком диапазоне значений истинной взаимной информации.
Работа посвящена планированию передач данных в системах удалённого мультимодального инференса. Рассматривается выбор модальности при ограниченной пропускной способности сети, поскольку минимизация среднего AoI (Age of Information) не гарантирует минимизацию ошибки инференса из-за нелинейной зависимости потерь от AoI. Сравнение политик показывает преимущество индексной политики по средней ошибке при сопоставимом AoI.
В данной работе предложен метод адаптации предобученных CNN для восстановления видео посредством компактного временного адаптера. На базе NAFNet с модулем MFIRTemporalAdapter (деформируемое выравнивание, внимание) эксперименты на Vimeo-90K и DAVIS-2017 показывают: обучение адаптера превосходит SwinIR на 0,1 дБ PSNR и 0,023 SSIM при 9-кратном снижении вычислительных затрат. Метод обеспечивает быструю адаптацию моделей к видеодомену без роста сложности.
Исследуется влияние атмосферной дымки на решение прикладных задач по гиперспектральным снимкам ДЗЗ и эффективность алгоритмов ее компенсации. Предложен подход к оценке качества дехейзинга через анализ downstream-задач: оконтуривание полей, классификация типов поверхности и сегментация водных объектов. На реальных парных снимках RRealHyperPDID показано, что дымка снижает точность классификации, а алгоритмы компенсации позволяют частично восстановить качество.
В работе представлена программная реализация метода измерения функций цветового соответствия (CMF) на основе строгого замещения цветов, как альтернатива классическому методу визуального уравнивания. Эксперименты проводились с использованием акустооптического колориметра. Разработанное программное обеспечение позволяет испытуемому подбирать интенсивности первичных стимулов (R, G, B). В результате получена предварительная оценка индивидуальных CMF для одного наблюдателя с дискретностью 10 нм.
В работе исследуется применение квантовых генераторов случайных чисел (QRNG) в алгоритме Метрополис-Гастингс для байесовского анализа IT-систем. Псевдо-RNG создают корреляции и биасы, замедляя сходимость MCMC при моделировании нагрузки серверов и предсказании сбоев.
QRNG повышают точность в оптимизации и криптографии. В будущем возможна интеграция в DevOps и quantum-assisted ML к 2030-му году, для масштабируемого управления инфраструктурой.
Предложен новый метод регуляризации для пост-тренировочного квантования LLM, развивающий GPTQ. Впервые при квантовании слоя учитывается влияние на последующие слои через гессианную оптимизацию. Параметры регуляризации оптимизируются до квантования на основе степенного закона распределения собственных значений гессианов с применением ELBO-лосса. Разработана стратегия выбора слоев, фокусирующаяся на feed-forward блоках. Подход впервые объединяет пост-квантизацию с гессианной оптимизацией.
Построена математическая модель дифракционной нейронной сети на основе уравнения Гельмгольца, описывающая нейросетевую классификацию через дифракцию когерентного излучения на последовательности фазовых масок. Исследовано влияние стратегии инициализации фазовых профилей на сходимость обучения; в качестве альтернативы случайному начальному приближению предложен обобщённый алгоритм Гершберга–Сакстона, адаптированный для многослойной дифракционной системы.
Рассматривается предложенный DeepMind эволюционный подход AlphaEvolve для решения CVRP (Capacitated Vehicle Routing Problem). Данный метод сравнивается по скорости и качеству с генетическим алгоритмом на задачах с различным размером входных данных и способом задания расстояния. В качестве метрики для оценки результата берётся RMSE, учитывается также время работы алгоритма.
В работе рассматривается задача гиперспектральной реконструкции из цветовых откликов мультикамерной системы. Исследуется возомжность переноса модели реконструкции между различными мультикамерными системами. Предложен метод цветовой коррекции позволяющий улучшить точность реконструкции на домене новой камеры вплоть до 25% .
Мониторинг кожных заболеваний остается актуальной медицинской проблемой. Важную роль в нем играет определение концентраций хрофоморов в коже. Перспективным подходом здесь является использование гиперспектральной съемки. В настоящей работе собран датасет из гиперспектральных снимков фантомов, рассмотрены 3 подхода для решения задачи, произведено их сравнение. Средняя по всем экспериментам относительная ошибка в определении концентрации для наиболее эффективного из подходов составила 31,7%.
Работа посвящена разработке нейросетевой модели оценки порогов цветоразличения человека. На основе предсказаний модели в пространстве CIE 1931 были построены эллипсы порогового цветоразличения. Для верификации результатов использовался критерий STRESS, посчитанный для моделей CIE 1976, CIEDE200 и CIE Luv.
Работа посвящена разработке и валидации методики автоматизированного извлечения спектральных характеристик объектов из гиперспектральных наборов данных с помощью сегментационной модели SAM 3 на примере растительности.
В работе представлен новый подход для гиперспектральной реконструкции (ГР) с использованием больших предобученных моделей. Метод улучшает современные методы ГР использованием семантических карт для повышения точности работы методов на real-world наборах данных. Метод позволяет получить прирост качества вплоть до 20% по общепринятым метрикам ГР.
В данной работе предложен метод обучения моделей шумоподавления с учётом типа массива цветовых фильтров (CFA) для устойчивости к изменению домена. Используется обуславливание (AdaIN) на основе представлений паттернов CFA от автокодировщика. Модель (UNet) обучена на SIDD (Bayer, Nona-Bayer), тестировалась также на Quad-Bayer. Результаты показали превосходство обусловленной модели по PSNR и SSIM на известных и новых доменах. Подход улучшает обобщающую способность и действует как регуляризатор.
В работе предложен метод шумоподавления видео, устойчивый к дефициту реальных обучающих данных. Подход основан на трансферном обучении. Схема включает предобучение на синтетических данных и последующую адаптацию на малом наборе реальных видео путем выборочного обновления параметров. Эксперименты подтвердили, что метод обеспечивает лучшую обобщающую способность и устойчивость к смене домена (36.49 dB PSNR), превосходя модели, обученные исключительно на реальных или синтетических выборках.
В работе предложена методика экспериментальной валидации спектрального рендеринга в Mitsuba 3 на основе гиперспектральных измерений реальных сцен. Выполнено сопоставление синтезированных и измеренных данных для трёхмерных объектов простой геометрии. Точность оценена по метрикам SAM и NSE в выделенных областях интереса. Показано хорошее совпадение формы спектров при амплитудных расхождениях, связанных с калибровкой освещения.
Исследованы статистические характеристики генерации спайков стандартным LIF (Leaky Integrate-and-Fire) нейроном — как коллективного эффекта в результате независимой стохастической (пуассоновской) активации нескольких входящих возбуждающих синапсов. Количественно доказано, что при достаточно большой, но физиологически реальной, средней частоте активации LIF нейрон в среднем генерирует спайки так, как если бы его стимулировали постоянным током, равным среднему суммарному синаптическому току.
Мы предлагаем гибридный метод ExtraSAGA для решения вариационных неравенств, объединяющий технику редукции дисперсии SAGA с экстраградиентным шагом. Приведен теоретический анализ, демонстрирующий линейную сходимость для сильно монотонного случая. Также представлены эксперименты на билинейных задачах, состязательной логистической регрессии и задаче шумоподавления изображений, подтверждающие эффективность подхода.
В данной работе мы предлагаем адаптивные модификации ускоренных методов оптимизации первого порядка (подобных треугольников и SESOP) для (L0-L1)-гладких функций, используя только нормированный градиент. Также рассмотрен сценарий с неточной информацией и о нормированном градиенте с доступом лишь к сравнительному оракулу. Для этого случая модифицирован классический градиентный спуск. Сходимость алгоритмов доказана теоретически и подтверждена экспериментально.
В работе исследуется перцептивная геометрия цвета во внутренних представлениях Qwen2.5-VL на датасетах Манселла и COMBVD. Эти представления содержат линейно декодируемую информацию о малых и больших цветовых расстояниях, указывая на сходство с зрительной системой человека. Для подтверждения применено метрическое обучение линейного преобразования, минимизирующее разницу между евклидовыми расстояниями в пространстве представлений и психофизическими метриками.
В работе представлена бимодальная архитектура для получения химически обоснованных векторных представлений молекул, объединяющая трансформер RoBERTa на физико-химических дескрипторах подструктур и графовую нейронную сеть на молекулярном графе. Подход преодолевает ограничения строковых представлений SMILES, обеспечивая более содержательные эмбеддинги. Эксперименты на бенчмарках, включая QM9, FreeSolv, ClinTox и Tox21, подтверждают эффективность метода в задачах регрессии и классификации.
Разработана классификационная модель на основе градиентного бустинга для предсказания образования трёхкомпонентных со-кристаллов. Так как негативные примеры отсутствуют в литературе, предложен подход к их генерации. Для извлечения структурных данных создан пайплайн, обрабатывающий трёхмерные геометрии молекул без ручного вмешательства. Данный пайплайн позволяет применять модель не только в домене органической химии, но и для металлокомплексов, остающихся за рамками большинства исследований.
В работе исследуется возможность обнаружения дрейфа данных в задачах классификации текстов на основе анализа распределения уверенности модели. Предложенный подход основан на применении confidence-аудитора и не требует доступа к исходным данным или их разметке. Проведена эмпирическая валидация метода на задаче анализа тональности русскоязычных текстов с использованием моделей TF-IDF и RuBERT при различных сценариях языкового дрейфа.
Предложен метод выявления ошибок, возникающих при конвертации размеченных данных из одной схемы аннотации в другую. Метод основан на сравнении предсказаний нейросетевых классификаторов, обученных на исходной и сконвертированной версиях одного набора данных: расхождения в пользу исходной разметки указывают на ошибки конвертации. Эффективность подхода показана на морфологической разметке корпуса СинТагРус и его версии в формате Universal Dependencies.
В работе исследуется цветовая константность MLLM на примере Qwen3-VL. Разработан физически корректный бенчмарк на основе гиперспектральных изображений, учитывающий спектральные свойства материалов и освещения, в отличие от RGB-аналогов. Проведён психофизически корректный эксперимент (метод асимметричного цветового сопоставления), адаптированный для модели как задача множественного выбора. Результаты проанализированы с помощью стандартных психофизических метрик (BR, CI).
Работа посвящена исследованию точности определения положения камеры при использовании цветных плоских шаблонов на основе фидуциальных маркеров. Рассмотрен метод поканальной обработки изображения двухцветного маркера, направленный на повышение устойчивости и точности оценки ориентации. Экспериментальное исследование выполнено на основе видеоданных, полученных откалиброванной камерой. В качестве метрики точности использован угол относительного поворота.