Конференции

67-я Всероссийская научная конференция МФТИ

Список разделов ФПМИ - Секция проблем интеллектуального анализа данных, распознавания и прогнозирования

Секция посвящена проблемам анализа данных, распознавания образов и прогнозирования

 

Формат проведения: очно-дистанционный

Дата и время проведения: 05.04.2025 с 13.00

Место проведения: МФТИ, 12:20-13:45-432 ГК
13:55-15:20- 424 Физтех. Арктика
15:30-20:00 Б.Физ

 Ссылка: https://m1p.org/go_zoom

 

  • Решение задачи порядковой классификации с помощью использования частично упорядоченных наборов признаков

    В исследовании рассматривается задача ранговой
    классификации. Каждому объекту соответствует некоторый
    ранг из фиксированного и конечного диапазона. Этот диапазон
    тот же самый, которому принадлежат признаки этих объектов. По имеющемуся набору объектов, каждый из которых задаётся
    множеством таких частично упорядоченных признаков, воссоздаётся
    ранг каждого из них. 

  • Рекомендательные системы на основе векторного представления эмбеддингов

    В работе сравниваются два подхода к построению взаимодополняющих рекомендаций через поиск ближайших векторов, полученных из эмбеддингов моделей матричной факторизации. Первый метод использует скрытые факторы из классического разложения user-item матрицы с дополнительными условиями на этапе поиска. Второй основан на факторизованных эмбеддингах из разложения item-item матрицы совстречаемости пар. Анализируются их преимущества, ограничения и влияние параметров на качество.

  • Использование модели BERT для выявления побочных эффектов лекарств в инструкциях с помощью выделения именованных сущностей

    Работа посвящена применению языковой модели BERT для анализа данных о лекарственных препаратах с целью выявления побочных эффектов, описанных в текстах инструкций. В работе акцентируется внимание на проблеме извлечения текстовых данных с использованием методов выделения именованных сущностей, что позволяет более точно идентифицировать и классифицировать побочные действия. В качестве примера используется база данных лекарственных препаратов, что демонстрирует практическую значимость исследования.

  • Спинорное описание состояния нейронной сети

    В работе предлагается описывать состояние обученности нейронной сети не традиционной матрицей ошибок, а спинором. При этом приходится перейти от вероятностей исходов распознавания бразов к соответствующим амплитудам вероятностей. Подобный подход имеет ряд преимуществ. Дает очевидную геометрическую интерпретацию традиционным метрикам нейронной сети. Описывает обученность нейронной сети сферой Блоха, широко используемой в ИТ для моделирования состояния кубита.

  • Критерий активного обучения на основе анализа локальных эмбеддингов

    Представлен новый критерий отбора данных для активного обучения детекторов объектов на основе глубоких нейронных сетей с архитектурой (FPN), основанный на выделении эмбеддингов объектов интереса. Операция выравнивания и сопоставления области интереса производится с помощью RoiAlign Локальные эмбеддинги, используются для отбора новых данных на основе косинусного расстояния и плотности. Показано улучшение метрик детекции в сравнении с традиционными критериями на датасетах COCO2017 и Pascal-VOC.

  • Улучшение декодирования фМРТ в условиях ограниченной выборки

    Функциональная магнитно-резонансная томография (фМРТ) служит важным инструментом в нейронауках и когнитивной психологии для изучения активности мозга. Однако анализ данных фМРТ сталкивается с рядом сложностей, таких как ограниченный объем данных, высокая вариативность выборок и значительные вычислительные затраты. В рамках данной работы предложена методология декодирования данных фМРТ. Подход сравнивается с нейросетевыми методами, которые требуют больших объемов данных для эффективного обучения.

  • Оценка влияния трёхканального подхода к предварительной обработке снимков УЗИ на точность их сегментации

    Компьютерное зрение и глубокое обучение в последние годы широко применяются для решения практических задач. К их числу относится сегментация анатомических структур на медицинских снимках, положительное влияние на точность выполнения которой может оказывать применение методов предварительной обработки. Работа посвящена оценке влияния трёхканального подхода к предварительной обработке снимков УЗИ на точность их сегментации моделями, имеющими архитектуры семейства U-Net.

  • Теоретические основы прогнозирования выручки компании с помощью регрессии новостных векторов

    В работе проводится обзор методов машинного обучения, применяемых для прогнозирования выручки компаний. Метод прогнозирования с помощью регрессии опорных векторов адаптируется для восстановления зависимости квартального роста выручки по новостным векторам, полученным посредством векторизации новостей.

  • Сравнительный анализ алгоритмов контролируемого машинного обучения для обнаружения неисправностей в системах жизнеобеспечения

    Проведен анализ алгоритмов контролируемого ML для обнаружения неисправностей в системах жизнеобеспечения. Использован набор данных с показаниями датчиков. Выполнена предварительная обработка: генерация пропусков, удаление выбросов, балансировка классов, нормализация. Рассмотрены ансамблевые методы, нейронные сети и алгоритмы на основе ядра. Обсуждаются вычислительная эффективность и оптимизация моделей с параллельными вычислениями.

  • Реконструкция спектрального образа по RGB-изображениям

    В работе рассматривается задача реконструкции спектрального образа на основе RGB-изображений. Анализ цвета играет важную роль в мониторинге состояния растительности. Гиперспектральные изображения содержат значительно больше информации по сравнению с традиционными RGB-снимками, однако их получение требует дорогостоящего оборудования. В работе обсуждаются современные методы восстановления спектральных данных из RGB-изображений, что открывает новые возможности для анализа окружающей среды.

  • Выбор предсказательной модели в режиме многозадачного обучения с применением символьных методов

    В данной работе исследуется, как индуктивное смещение, может быть определено за счет построения и анализа модели в рамках многозадачного обучения. Предлагается подход, который использует эволюционные алгоритмы в сочетании с символьной регрессией для поиска параметрического класса моделей, оптимальных для заданного набора выборок. Предполагается, что оптимальные для каждой выборки модели схожи, где оптимальность определяется максимальным качеством на отложенной выборке.

  • Шумоподавление и выделение признаков на основе неотрицательной матричной факторизации в изображениях

    В данной работе исследуется применение неотрицательной матричной факторизации в качестве метода для шумоподавления и выделения признаков изображений. Экспериментальные результаты демонстрируют высокую эффективность подхода на различных наборах данных.

  • Выбор оптимальной структуры модели глубокого обучения с контролем эксплуатационных характеристик

    В данной работе рассматривается задача оптимизации архитектуры модели глубокого обучения с одновременным контролем сложности и вычислительной эффективности на целевом устройстве. Предлагаемый метод базируется на дифференцируемом поиске архитектуры, развитом на основе метода DARTS-CC, и предусматривает интеграцию регуляризационного штрафа за задержки выполнения операций на целевом устройстве в единую оптимизационную задачу.

  • Сходимость поверхности функции потерь как признак достаточного размера выборки

    В работе анализируется сходимость ландшафта функции потерь нейронных сетей при увеличении выборки. Используются спектральные свойства матрицы Гессе, благодаря чему устанавливаются теоретические границы ее нормы в зависимости от глубины сети и размера слоев. Эксперименты на задачах классификации изображений подтверждают, что разность потерь уменьшается с ростом данных, а полученные критерии позволяют определять достаточный объем выборки для устойчивой оптимизации моделей.

  • Использование моделей градиентного бустинга в задаче предсказания спроса товаров с низкой оборачиваемостью

    В работе исследуются методы предсказания спроса с помощью моделей градиентного бустинга. Рассматривается метод, для предсказания спроса товаров с низкой оборачиваемостью. Модели тестируются на данных полученых из онлайн маркет плейса.

  • Учет неоднородности в данных последовательностей событий посредством многослойной непрерывной свёртки.

    В данной работе представлен новый подход к моделированию событийных последовательностей на базе сверточной нейросети COTIC (COntinuous-TIme Convolution), которая способна эффективно обрабатывать неравномерные по времени данные. Главная особенность подхода — использование непрерывных сверток, позволяющих учитывать любые интервалы между событиями без искусственного выравнивания или интерполяций. 

  • Топологический анализ математических доказательств, генерируемых большими языковыми моделями на формальном языке Lean 4

    Исследование посвящено анализу математических доказательств, генерируемых большими языковыми моделями (LLM) в формальном языке Lean4, с использованием методов топологического анализа. Рассматриваются свойства доказательств через призму топологических и геометрических характеристик, включая персистентные гомологии.

  • Ускоренные методы нулевого порядка в гладкой выпуклой стохастической оптимизации

     

    Данная работа посвящена задаче оптимизации без доступа к градиенту целевой функции. Рассматривается безградиентный метод, требующий O(1) оракульных вызовов на итерацию. Применяется координатная аппроксимация в ускоренном градиентном методе и доказывается его сходимость для выпуклой задачи оптимизации с доступом к оракулу с детерминированным ограниченным по модулю шумом. В вычислительных экспериментах демонстрируется превосходство предложенного метода над классическими методами.

  • Сходимость ландшафта свёрточных нейронных сетей: анализ матричных сетей на основе гессиана.

    В работе ииследуется взаимосвязь Гессиана нейронной сети и ландшафта функции потерь, а также приводятся результаты, связанные с оценкой нормы матрицы Гесса в сверточных нейронных сетях.

  • Оптимальное управление в системах машинного обучения с обратной связью: предотвращение деградации и оттока пользователей

    В работе изучена деградация систем машинного обучения с обратной связью. Показано, что жадные алгоритмы могут приводить к оттоку пользователей. Предложен модифицированный метод управления, снижающий риск деградации и обеспечивающий стабильность системы.

  • Методы редукции дисперсии не требуют вычисления полных градиентов: ускорение посредством шаффлинга

    Машинное обучение требует больших данных, поэтому используются стохастические методы, например SGD, слабо гарантируя сходимость. Улучшенные версии, такие как SVRG и SARAH, снижают дисперсию, но требуют полного градиента. Мы уменьшаем дисперсию без этого, используя шафлинг и идеи SAG/SAGA. Наш метод улучшает оценки: для невыпуклых функций он соответствует классическим, для сильно выпуклых — превосходит. Теоретический анализ и эксперименты подтверждают эффективность.

  • Применение смещенных операторов сжатия в задачах распределенной оптимизации

    В распределенной оптимизации остро строит проблема дороговизны общения между сервером и агентами. В связи с этим разрабатывается много техник сжатия передаваемой информации. Эта работа как раз посвящена новым методам, которые учитывают "важность" каждой из координат для передачи.

  • Статистический подход к коррекции распознавания текста

    Мы предлагаем собственный статистический алгоритм улучшения качества распознавания рукописного текста, который использует вероятности на выходе нейросетевой модели распознавания. Он требует меньше вычислительных ресурсов, чем нейронные сети, и имеет более высокий потенциал по сравнению с другими статистическими методами.

  • Метод проверки стабильности моделей прогнозирования спроса на авиабилеты

    В работе представлен метод проверки стабильности моделей прогнозирования спроса на авиабилеты. Предлагается последовательное исключение групп значений признаков (направление, день, час вылета) для оценки чувствительности модели к изменению входных данных. Эксперименты показывают, что исключение направления вылета значительно ухудшает точность, а исключение часа вылета может улучшать прогноз, что позволяет оптимизировать модель с учетом изменчивости входных данных.

  • Анализ применения мультимодальных данных в моделях предсказания финансовых временных рядов

    Целью исследования является сравнение методов включения мультимодальных данных в статистические модели. Для улучшения объясняющей способности модели новостные данные обрабатываются при помощи моделей BERT и VADER. Исследуются наиболее эффективные математические методы включения данных в модель, затем производится их сравнение

  • Сравнительный анализ методов сжатия KV-кэша в больших языковых моделях

    KV-кэш — стандартный метод ускорения работы больших языковых моделей, снижающий алгоритмическую сложность с квадратичной до линейной относительно длины входной последовательности токенов. В работе представлен сравнительный анализ существующих методов сжатия KV-кэша. Рассмотрены такие подходы как квантизация, удаление токенов, распределение данных между слоями модели. Сравнение точности и уровня сжатия проводилось на открытых моделях. Особое внимание уделено работе с длинным контекстом.

  • Выбор прогностических моделей в римановых фазовых пространствах

    Матрицы ковариации многомерных временных рядов лежат в римановом пространстве симметричных, положительно определенных матриц. Предлагается использовать свойства этого пространства, а именно, векторное представление матриц ковариации и метрику пространства, как описание взаимосвязи фазовых траекторий многомерных временных рядов для улучшения качества прогноза.

  • Применение синтетических данных, полученных с помощью генеративной нейросети, для повышения качества моделей детекции

    В работе предложен подход к созданию высококачественных аугментаций с использованием генеративных нейронных сетей для улучшения точности моделей детекции объектов. Для оценки эффективности предложенного метода проведен сравнительный анализ с существующими методами аугментации на датасетах COCO и Pascal VOC. Результаты анализа показывают, что предложенный метод превосходит существующие подходы по метрике mAP. Также был проведен анализ влияния отдельных компонентов на качество модели.

  • Сходимость с оценкой вероятностей больших отклонений для задач выпуклой оптимизации

    Классические результаты стохастической оптимизации, как правило, формулируются в терминах числа итераций, необходимых для достижения некоторой точности по математическому ожиданию функции. В данной работе проводится анализ сходимости алгоритма с оценкой вероятностей больших отклонений. На функцию были наложены лишь два ограничения: ее выпулость и гладкость.

  • Метод оценки снятия ограничений с пассажирского спроса на авиабилеты

    В данной работе предлагается метод оценки качества моделей снятия ограничений с пассажирского спроса на авиабилеты путем моделирования неограниченного спроса с дальнейшим накладыванием ограничений.

  • Исследование применения методов самообучения для семантической сегментации в медицинской визуализации

    В условиях ограниченности размеченных медицинских данных методы самообучения становятся ключевым инструментом для извлечения информативных представлений из неразмеченных изображений. В данной работе исследуется применение методов самообучения, адаптация модели DINOv2 к задаче сегментации патологий лёгких на рентгенограммах.

     

  • Предсказание вероятности наличия колоректального рака с использованием большой языковой модели «QWEN 2.5»

    В данной работе исследуется использование языковой модели «qwen2.5» для оценки вероятности наличия колоректального рака у пациента на основе данных из электронных медицинских карт, с использованием открытого датасета MIMIC-IV. Результаты показали, что несмотря на схожие значения ROC AUC Score в двух проведенных экспериментах, использование эмбеддингов улучшает метрики F1 score и увеличивает их корреляцию с объемом доступных данных.

  • Выравнивание представлений в подходе многозадачного обучения для детектирования машинно-сгенерированных текстов

    В работе рассмотрено применение техники многозадачного обучения для детектирования машинно-сгенерированных текстов от разных языковых моделей и на разные тематики. Данный метод позволяет получить более эффективное и компактное представление данных, а также способствует формированию кластерной структуры в обучаемой модели при сильном совместном использовании параметров сети.

  • Анализ изображений следов животных с использованием свёрточных нейронных сетей для оценки состояния здоровья и выявления поведенческих паттернов

    Современные методы анализа изображений на основе глубоких нейронных сетей позволяют значительно повысить точность идентификации объектов и прогнозирования их характеристик в рамках подверженных изменениям внешней среды. В рамках данного исследования рассматривается применение сверточных нейронных сетей (CNN) для анализа изображений следов животных с целью оценки их состояния здоровья и выявления поведенческих паттернов в ходе наблюдения в естественной среде обитания.

  • Генеративный причинно-следственный подход к анализу данных ИМК

    В данной работе предлагается генеративный причинно-следственный под-
    ход к анализу взаимодействия биосигналов. Главная цель — определить и
    количественно оценить причинно-следственные связи между мозговой ак-
    тивностью и движениями, опираясь на три взаимодополняющие методоло-
    гии: геометрическое представление сигналов на римановых многообразиях,
    физически-информированные нейронные сети (PINN) для реалистичного
    моделирования кинематики, и меры информационной теории и алгоритмы
    причинного анализа

  • Методы малоранговых разложений в распределенном и федеративном обучении


    В данной работе рассматривается подход к снижению коммуникационных затрат в задачах распределённого и федеративного обучения на основе методов малоранговых разложений, включая HOSVD и разложение Такера. Ключевая идея состоит в том, чтобы применять операторы сжатия, построенные на основе малоранговых аппроксимаций градиентов. Проводится анализ теоретических свойств предложенных операторов и исследуется эффективность их применения для оптимизации с использованием алгоритма EF21. 

  • Исследование open-vocabulary детекции на рентгеновских изображениях грудной клетки с применением слабо-размеченных данных

    Мы разрабатываем метод, позволяющий обучать модель находить различные патологии на рентгеновских изображениях грудной клетки по произвольным текстовым описаниям. Основная идея нашего подхода - это использование предварительно обученной модель и ее дообучение на данных со слабой разметкой, что даёт возможность эффективно масштабировать обучение и повышать точность детекции даже в условиях ограниченного объёма аннотированных данных.

  • Выделение синтаксических деревьев математических выражений из текста методом синтаксического анализа

    Рассматривается задача выделения синтаксического дерева математического выражения из предложения на естественном языке. Предлагается подход с использованием синтаксического анализа исходного предложения, результатом которого является дерево, связывающее слова в соответствии с их синтаксической ролью в предложении. При помощи системы правил, с использованием методов машинного обучения, это дерево может быть преобразовано в синтаксическое дерево математического выражения, закодированного в тексте.

  • Метод оценки сходства текстовых деревьев с помощью расстояния редактирования и языковых моделей

    В данной работе предложено и реализовано решение задачи сравнения текстовых деревьев. Для решения этой задачи используется алгоритм Чжана-Шаши, в котором семантическое расстояние между текстами используется в качестве стоимости обновления метки вершины. Для оценки семантического сходства текстовых меток используются BERT-подобные языковые модели. Кроме того, мы предлагаем несколько эвристических методов для повышения производительности предлагаемого алгоритма.

  • Порождающие модели для прогнозирования (наборов временных рядов) в метрическом вероятностном пространстве

    Решается задача прогнозирования наборов временных рядов с высокой ковариацией и высокой дисперсией. Предлагаемое решение задачи прогнозирования состоит из трех этапов. Во-первых, построение пространства парных расстояний. Во-вторых, прогнозируется матрица попарных расстояний. В-третьих, результат возвращается в исходное пространство. В данной работе предлагаются порождающие модели для прогнозирования наборов временных рядов в метрическом вероятностном пространстве.

  • Перевзвешивания по важности в задачах оценки риска для пространственного моделирования

    В работе рассматривается проблема оценки риска при применении моделей машинного обучения к новым неразмеченным данным, распределение которых может отличаться от исходного. В качестве метрики для оценки этого отличия была использована Locla Correlation Function. Классические методы, такие как Monte Carlo Estimation и Importance Sampling Weighting с KDE, демонстрируют неточные оценки риска, а Kernel Mean Matching (KMM) превосходит другие методы как на реальных, так и на искусственных данных.