Секция посвящена проблемам анализа данных, распознавания образов и прогнозирования
Формат проведения: очно-дистанционный
Дата и время проведения: 05.04.2025 с 13.00
Место проведения: МФТИ, 12:20-13:45-432 ГК
13:55-15:20- 424 Физтех. Арктика
15:30-20:00 Б.Физ
Ссылка: https://m1p.org/go_zoom
В исследовании рассматривается задача ранговой
классификации. Каждому объекту соответствует некоторый
ранг из фиксированного и конечного диапазона. Этот диапазон
тот же самый, которому принадлежат признаки этих объектов. По имеющемуся набору объектов, каждый из которых задаётся
множеством таких частично упорядоченных признаков, воссоздаётся
ранг каждого из них.
В работе сравниваются два подхода к построению взаимодополняющих рекомендаций через поиск ближайших векторов, полученных из эмбеддингов моделей матричной факторизации. Первый метод использует скрытые факторы из классического разложения user-item матрицы с дополнительными условиями на этапе поиска. Второй основан на факторизованных эмбеддингах из разложения item-item матрицы совстречаемости пар. Анализируются их преимущества, ограничения и влияние параметров на качество.
Работа посвящена применению языковой модели BERT для анализа данных о лекарственных препаратах с целью выявления побочных эффектов, описанных в текстах инструкций. В работе акцентируется внимание на проблеме извлечения текстовых данных с использованием методов выделения именованных сущностей, что позволяет более точно идентифицировать и классифицировать побочные действия. В качестве примера используется база данных лекарственных препаратов, что демонстрирует практическую значимость исследования.
В работе предлагается описывать состояние обученности нейронной сети не традиционной матрицей ошибок, а спинором. При этом приходится перейти от вероятностей исходов распознавания бразов к соответствующим амплитудам вероятностей. Подобный подход имеет ряд преимуществ. Дает очевидную геометрическую интерпретацию традиционным метрикам нейронной сети. Описывает обученность нейронной сети сферой Блоха, широко используемой в ИТ для моделирования состояния кубита.
Представлен новый критерий отбора данных для активного обучения детекторов объектов на основе глубоких нейронных сетей с архитектурой (FPN), основанный на выделении эмбеддингов объектов интереса. Операция выравнивания и сопоставления области интереса производится с помощью RoiAlign Локальные эмбеддинги, используются для отбора новых данных на основе косинусного расстояния и плотности. Показано улучшение метрик детекции в сравнении с традиционными критериями на датасетах COCO2017 и Pascal-VOC.
Функциональная магнитно-резонансная томография (фМРТ) служит важным инструментом в нейронауках и когнитивной психологии для изучения активности мозга. Однако анализ данных фМРТ сталкивается с рядом сложностей, таких как ограниченный объем данных, высокая вариативность выборок и значительные вычислительные затраты. В рамках данной работы предложена методология декодирования данных фМРТ. Подход сравнивается с нейросетевыми методами, которые требуют больших объемов данных для эффективного обучения.
Компьютерное зрение и глубокое обучение в последние годы широко применяются для решения практических задач. К их числу относится сегментация анатомических структур на медицинских снимках, положительное влияние на точность выполнения которой может оказывать применение методов предварительной обработки. Работа посвящена оценке влияния трёхканального подхода к предварительной обработке снимков УЗИ на точность их сегментации моделями, имеющими архитектуры семейства U-Net.
В работе проводится обзор методов машинного обучения, применяемых для прогнозирования выручки компаний. Метод прогнозирования с помощью регрессии опорных векторов адаптируется для восстановления зависимости квартального роста выручки по новостным векторам, полученным посредством векторизации новостей.
Проведен анализ алгоритмов контролируемого ML для обнаружения неисправностей в системах жизнеобеспечения. Использован набор данных с показаниями датчиков. Выполнена предварительная обработка: генерация пропусков, удаление выбросов, балансировка классов, нормализация. Рассмотрены ансамблевые методы, нейронные сети и алгоритмы на основе ядра. Обсуждаются вычислительная эффективность и оптимизация моделей с параллельными вычислениями.
В работе рассматривается задача реконструкции спектрального образа на основе RGB-изображений. Анализ цвета играет важную роль в мониторинге состояния растительности. Гиперспектральные изображения содержат значительно больше информации по сравнению с традиционными RGB-снимками, однако их получение требует дорогостоящего оборудования. В работе обсуждаются современные методы восстановления спектральных данных из RGB-изображений, что открывает новые возможности для анализа окружающей среды.
В данной работе исследуется, как индуктивное смещение, может быть определено за счет построения и анализа модели в рамках многозадачного обучения. Предлагается подход, который использует эволюционные алгоритмы в сочетании с символьной регрессией для поиска параметрического класса моделей, оптимальных для заданного набора выборок. Предполагается, что оптимальные для каждой выборки модели схожи, где оптимальность определяется максимальным качеством на отложенной выборке.
В данной работе исследуется применение неотрицательной матричной факторизации в качестве метода для шумоподавления и выделения признаков изображений. Экспериментальные результаты демонстрируют высокую эффективность подхода на различных наборах данных.
В данной работе рассматривается задача оптимизации архитектуры модели глубокого обучения с одновременным контролем сложности и вычислительной эффективности на целевом устройстве. Предлагаемый метод базируется на дифференцируемом поиске архитектуры, развитом на основе метода DARTS-CC, и предусматривает интеграцию регуляризационного штрафа за задержки выполнения операций на целевом устройстве в единую оптимизационную задачу.
В работе анализируется сходимость ландшафта функции потерь нейронных сетей при увеличении выборки. Используются спектральные свойства матрицы Гессе, благодаря чему устанавливаются теоретические границы ее нормы в зависимости от глубины сети и размера слоев. Эксперименты на задачах классификации изображений подтверждают, что разность потерь уменьшается с ростом данных, а полученные критерии позволяют определять достаточный объем выборки для устойчивой оптимизации моделей.
В работе исследуются методы предсказания спроса с помощью моделей градиентного бустинга. Рассматривается метод, для предсказания спроса товаров с низкой оборачиваемостью. Модели тестируются на данных полученых из онлайн маркет плейса.
В данной работе представлен новый подход к моделированию событийных последовательностей на базе сверточной нейросети COTIC (COntinuous-TIme Convolution), которая способна эффективно обрабатывать неравномерные по времени данные. Главная особенность подхода — использование непрерывных сверток, позволяющих учитывать любые интервалы между событиями без искусственного выравнивания или интерполяций.
Исследование посвящено анализу математических доказательств, генерируемых большими языковыми моделями (LLM) в формальном языке Lean4, с использованием методов топологического анализа. Рассматриваются свойства доказательств через призму топологических и геометрических характеристик, включая персистентные гомологии.
Данная работа посвящена задаче оптимизации без доступа к градиенту целевой функции. Рассматривается безградиентный метод, требующий O(1) оракульных вызовов на итерацию. Применяется координатная аппроксимация в ускоренном градиентном методе и доказывается его сходимость для выпуклой задачи оптимизации с доступом к оракулу с детерминированным ограниченным по модулю шумом. В вычислительных экспериментах демонстрируется превосходство предложенного метода над классическими методами.
В работе ииследуется взаимосвязь Гессиана нейронной сети и ландшафта функции потерь, а также приводятся результаты, связанные с оценкой нормы матрицы Гесса в сверточных нейронных сетях.
В работе изучена деградация систем машинного обучения с обратной связью. Показано, что жадные алгоритмы могут приводить к оттоку пользователей. Предложен модифицированный метод управления, снижающий риск деградации и обеспечивающий стабильность системы.
Машинное обучение требует больших данных, поэтому используются стохастические методы, например SGD, слабо гарантируя сходимость. Улучшенные версии, такие как SVRG и SARAH, снижают дисперсию, но требуют полного градиента. Мы уменьшаем дисперсию без этого, используя шафлинг и идеи SAG/SAGA. Наш метод улучшает оценки: для невыпуклых функций он соответствует классическим, для сильно выпуклых — превосходит. Теоретический анализ и эксперименты подтверждают эффективность.
В распределенной оптимизации остро строит проблема дороговизны общения между сервером и агентами. В связи с этим разрабатывается много техник сжатия передаваемой информации. Эта работа как раз посвящена новым методам, которые учитывают "важность" каждой из координат для передачи.
Мы предлагаем собственный статистический алгоритм улучшения качества распознавания рукописного текста, который использует вероятности на выходе нейросетевой модели распознавания. Он требует меньше вычислительных ресурсов, чем нейронные сети, и имеет более высокий потенциал по сравнению с другими статистическими методами.
В работе представлен метод проверки стабильности моделей прогнозирования спроса на авиабилеты. Предлагается последовательное исключение групп значений признаков (направление, день, час вылета) для оценки чувствительности модели к изменению входных данных. Эксперименты показывают, что исключение направления вылета значительно ухудшает точность, а исключение часа вылета может улучшать прогноз, что позволяет оптимизировать модель с учетом изменчивости входных данных.
Целью исследования является сравнение методов включения мультимодальных данных в статистические модели. Для улучшения объясняющей способности модели новостные данные обрабатываются при помощи моделей BERT и VADER. Исследуются наиболее эффективные математические методы включения данных в модель, затем производится их сравнение
KV-кэш — стандартный метод ускорения работы больших языковых моделей, снижающий алгоритмическую сложность с квадратичной до линейной относительно длины входной последовательности токенов. В работе представлен сравнительный анализ существующих методов сжатия KV-кэша. Рассмотрены такие подходы как квантизация, удаление токенов, распределение данных между слоями модели. Сравнение точности и уровня сжатия проводилось на открытых моделях. Особое внимание уделено работе с длинным контекстом.
Матрицы ковариации многомерных временных рядов лежат в римановом пространстве симметричных, положительно определенных матриц. Предлагается использовать свойства этого пространства, а именно, векторное представление матриц ковариации и метрику пространства, как описание взаимосвязи фазовых траекторий многомерных временных рядов для улучшения качества прогноза.
В работе предложен подход к созданию высококачественных аугментаций с использованием генеративных нейронных сетей для улучшения точности моделей детекции объектов. Для оценки эффективности предложенного метода проведен сравнительный анализ с существующими методами аугментации на датасетах COCO и Pascal VOC. Результаты анализа показывают, что предложенный метод превосходит существующие подходы по метрике mAP. Также был проведен анализ влияния отдельных компонентов на качество модели.
Классические результаты стохастической оптимизации, как правило, формулируются в терминах числа итераций, необходимых для достижения некоторой точности по математическому ожиданию функции. В данной работе проводится анализ сходимости алгоритма с оценкой вероятностей больших отклонений. На функцию были наложены лишь два ограничения: ее выпулость и гладкость.
В данной работе предлагается метод оценки качества моделей снятия ограничений с пассажирского спроса на авиабилеты путем моделирования неограниченного спроса с дальнейшим накладыванием ограничений.
В условиях ограниченности размеченных медицинских данных методы самообучения становятся ключевым инструментом для извлечения информативных представлений из неразмеченных изображений. В данной работе исследуется применение методов самообучения, адаптация модели DINOv2 к задаче сегментации патологий лёгких на рентгенограммах.
В данной работе исследуется использование языковой модели «qwen2.5» для оценки вероятности наличия колоректального рака у пациента на основе данных из электронных медицинских карт, с использованием открытого датасета MIMIC-IV. Результаты показали, что несмотря на схожие значения ROC AUC Score в двух проведенных экспериментах, использование эмбеддингов улучшает метрики F1 score и увеличивает их корреляцию с объемом доступных данных.
В работе рассмотрено применение техники многозадачного обучения для детектирования машинно-сгенерированных текстов от разных языковых моделей и на разные тематики. Данный метод позволяет получить более эффективное и компактное представление данных, а также способствует формированию кластерной структуры в обучаемой модели при сильном совместном использовании параметров сети.
Современные методы анализа изображений на основе глубоких нейронных сетей позволяют значительно повысить точность идентификации объектов и прогнозирования их характеристик в рамках подверженных изменениям внешней среды. В рамках данного исследования рассматривается применение сверточных нейронных сетей (CNN) для анализа изображений следов животных с целью оценки их состояния здоровья и выявления поведенческих паттернов в ходе наблюдения в естественной среде обитания.
В данной работе предлагается генеративный причинно-следственный под-
ход к анализу взаимодействия биосигналов. Главная цель — определить и
количественно оценить причинно-следственные связи между мозговой ак-
тивностью и движениями, опираясь на три взаимодополняющие методоло-
гии: геометрическое представление сигналов на римановых многообразиях,
физически-информированные нейронные сети (PINN) для реалистичного
моделирования кинематики, и меры информационной теории и алгоритмы
причинного анализа
В данной работе рассматривается подход к снижению коммуникационных затрат в задачах распределённого и федеративного обучения на основе методов малоранговых разложений, включая HOSVD и разложение Такера. Ключевая идея состоит в том, чтобы применять операторы сжатия, построенные на основе малоранговых аппроксимаций градиентов. Проводится анализ теоретических свойств предложенных операторов и исследуется эффективность их применения для оптимизации с использованием алгоритма EF21.
Мы разрабатываем метод, позволяющий обучать модель находить различные патологии на рентгеновских изображениях грудной клетки по произвольным текстовым описаниям. Основная идея нашего подхода - это использование предварительно обученной модель и ее дообучение на данных со слабой разметкой, что даёт возможность эффективно масштабировать обучение и повышать точность детекции даже в условиях ограниченного объёма аннотированных данных.
Рассматривается задача выделения синтаксического дерева математического выражения из предложения на естественном языке. Предлагается подход с использованием синтаксического анализа исходного предложения, результатом которого является дерево, связывающее слова в соответствии с их синтаксической ролью в предложении. При помощи системы правил, с использованием методов машинного обучения, это дерево может быть преобразовано в синтаксическое дерево математического выражения, закодированного в тексте.
В данной работе предложено и реализовано решение задачи сравнения текстовых деревьев. Для решения этой задачи используется алгоритм Чжана-Шаши, в котором семантическое расстояние между текстами используется в качестве стоимости обновления метки вершины. Для оценки семантического сходства текстовых меток используются BERT-подобные языковые модели. Кроме того, мы предлагаем несколько эвристических методов для повышения производительности предлагаемого алгоритма.
Решается задача прогнозирования наборов временных рядов с высокой ковариацией и высокой дисперсией. Предлагаемое решение задачи прогнозирования состоит из трех этапов. Во-первых, построение пространства парных расстояний. Во-вторых, прогнозируется матрица попарных расстояний. В-третьих, результат возвращается в исходное пространство. В данной работе предлагаются порождающие модели для прогнозирования наборов временных рядов в метрическом вероятностном пространстве.
В работе рассматривается проблема оценки риска при применении моделей машинного обучения к новым неразмеченным данным, распределение которых может отличаться от исходного. В качестве метрики для оценки этого отличия была использована Locla Correlation Function. Классические методы, такие как Monte Carlo Estimation и Importance Sampling Weighting с KDE, демонстрируют неточные оценки риска, а Kernel Mean Matching (KMM) превосходит другие методы как на реальных, так и на искусственных данных.