Конференции

66-я Всероссийская научная конференция МФТИ

Список разделов ФПМИ - Секция технологий искусственного интеллекта

Секция посвящена проблемам искусственного интеллекта

 

 

Формат проведения: очно-дистанционный

Дата проведения: 04.04.2024 в 14:00, МФТИ, корпус Цифры, поточная аудитория

  • Теория соседства

    https://www.researchgate.net/publication/371408887_TEORIA_SOSEDSTVA

  • Искусственный интеллект для определения наличия заболеваний сердца по ЭКГ на наборе данных PTB-XL

    Определение наличия у человека проблем с сердцем по записи ЭКГ – чрезвычайно актуальная и важная задача в медицине. В работе исследуется использование искусственного интеллекта для решения этой проблемы.

  • Multi-task training for better generalization in Structured Query Languages

    In this work we propose a semantic parsing training approach in multi-task paradigm. We evaluate our approach on two semantic parsing datasets, WikiSQL and LC-QuAD, in i.i.d. setting and in designed data splits to test models generalization abilitites. Our model outperforms standart pre-trained language models finetuning in i.i.d setting and in terms of generalization abilitites with a little compute overhead.

  • Языковая сложность в мультиязыковых моделях

    В рамках этой работы исследуются скрытые состояния BERT при переносе предсказания сложности текста. Задача формулировалась следующим образом: сравнить скрытые состояния модели BERT, обученной на английском языке, при предсказании на других языках. На данным момент показано наличие сходства активаций и выявлены характерные зависимости на скрытых слоях BERT в задачах многоклассового и бинарного предсказания сложности.

  • Определение тепловых свойств осадочных пород на основе данных каротажа с использованием методов машинного обучения

    В данной работе решается задача увеличения степени теплофизической изученности участков скважины без отбора кернового материала. С использованием машинного обучения произведен прогноз основных компонент тензора теплопроводности и объемной теплоемкости горных пород. Использованный подход позволил учесть тепловую анизотропию, что открыло возможности для детального расчета теплового потока и его вариаций.

  • Использование noisy intermediate-scale quantum устройств для обучения рекуррентных нейронных сетей

    Проделанная работа заключается в написании архитектуры квантовой рекуррентной нейронной сети на языке программирования Python при помощи библиотеки Pennylane, моделировании её обучения на классическом компьютере, последующем запуске процесса обучения сети на квантовом процессоре и, в конечном итоге, сравнении результатов предсказания модели с  результатами, полученными на уже существующих классических рекуррентных нейросетях.

  • Atari-фикация задачи маршрутизации транспорта со стохастическими клиентами

    Алгоритмы семейства DQN показали способность к генерализации на играх Atari, поэтому предлагается новый подход к решению задач – Atari-фикация: задача моделируется в виде Atari игры, а затем к ее решению применяется DQN (гиперпараметры алгоритма при этом не меняются). В рамках работы данный подход тестируется на конкретном примере: задача маршрутизации транспорта со стохастическими клиентами. Полученные результаты оказываются сравнимыми с SOTA подходами для данной задачи.   

  • Определение геопозиции по изображениям и лидарным сканам с помощью мультимодальной нейросетевой модели

    В работе предлагается использовать имеющиеся на беспилотных автомобилях устройства – лидары и камеры – как дополнительний способ локализации средства передвижения в пространстве с помощью мультимодальной нейросетевой модели.

  • Улучшение архитектуры нейросетевых алгоритмов для работы с аудио при помощи больших языковых моделей

    В работе предлагается модификация архитектуры алгоритмов глубокого обучения для обработки аудио, использующая идею меж-доменного обучения и привлекающая к обработке аудио большие языковые модели.

  • Обучение нейросетевой мультимодальной системы распознавания текста

    В работе предлагается новый вариант мультимодальной системы нейросетевых моделей для распознавания текста с использованием функции потерь CLIP, в том числе для встраивания неразмеченных данных в обучение, а также внешней предобучаемой языковой моделью.

  • Использование нейронных сетей для точной сегментации ребер на КТ снимках

    В работе  представлены результаты использования нейронных сетей в задаче сегментации ребер на КТ снимках. Проведено исследование существующих подходов по решению данной задачи. Особое внимание уделено конструированию ошибки потерь и алгоритму постпроцессинга для улучшения качества предсказаний.

  • Подход к повышению согласованности структурной интероперабельности

    В данной работе рассмотрены подходы к анализу согласованности в задаче поиска и склейки одинаковых товаров на маркетплейсе. Рассмотрены проблемы прямолинейного метода транзитивного замыкания, а именно рассогласованность внутри групп, и предложены методы, учитывающие похожесть объекта со всеми объектами группы при принятии решения о склейке.

  • Использование сверточных сетей и состязательного обучения для симметричного шифрования изображений

    В данной работе изучаются возможности использования нейронных сетей в качестве инструмента для симметричного шифрования изображений. Предложенная модель основана на состязательном обучении и имеет сверточную архитектуру, что позволяет достичь низкой ошибки восстановления.

  • Использование явной семантической информации в задаче распознавания места

    В данной работе рассматривается роль семантических масок сегментации в улучшении точности распознавания мест для автономной навигации. В экспериментах применяются различные подходы, включая использование изображений, семантических масок, и их комбинации, опираясь на архитектуру сверточной сети ResNet18. Исследование проводится на базе публичного датасета NCLT, а оценка эффективности моделей осуществляется с помощью метрик AR@1 и AR@1%.

  • Reinforcement Learning Control of a Wheeled Mobile Manipulator With Output Constraint

    An adaptive Wheeled Mobile Manipulator (WMM) controller with output constraints is designed based on the back-stepping method. Actor-critic reinforcement learning (RL) is used to compensate for dynamic uncertainties and external disturbance in the control law. At the same time, Barrier Lyapunov function (BLF) is used to constraint the position tracking error of the WMM within a time-varying range. The simulation in matlab shows that the tracking errors converges within a small area.

  • Анализ динамического расстояния и целеобусловленной стратегии при обучении в модели мира.

    В данной работе представлен анализ динамического расстояния для обучения целеобусловленной стратегии в модели мира, и предложен метод, позволяющий избежать проблему ложной экстраполяции динамического расстояния, что приводит к улучшению поведения агента на некоторых целях. Проблемой является повышенная зашумленность полученной стратегии, что сказывается на средней метрике достижения цели в худшую сторону.

  • Методы аугментации датасета на основе генеративных моделей

    Обзор методов аугментации набора данных для обучения нейронных сетей с помощью различных генеративных моделей. Были проанализированны выбранные методы на собранных данных и получены первые результаты.

  • К вопросу о подходе к децентрализованному многоагентному обучению, использующему модель оппонентов

    В данной работе приведён алгоритм мультиагентного обучения, позволяющий децентрализованно применять алгоритмы обучения с подкреплением с коррекцией на динамику обучения других агентов (т.н. "моделирование оппонентов") на основе модели мира

  • Обзор датасетов и методов для обнаружения дефектов дорожного полотна и краев дороги в неблагоприятных погодных условиях

    В данной работе исследуется актуальная задача обнаружения дефектов дорожного полотна и краев дороги в условиях неблагоприятной погоды. Традиционные сенсоры, такие как камеры и лидары, сталкиваются с ограничениями при сильном снегопаде, тумане и пыли. Проведен обзор существующих датасетов и методов для решения поставленной задачи.

  • Оценка неопределенности методом доказательного обучения для построения семантических нейронных полей яркости

    В работе рассматривается применение доказательного обучения для оценки неуверенности модели NeRF в предсказаниях семантических меток класса. Значение неопределенности необходимы для принятия решений в сферах, связанных с безопасностью, таких как управление беспилотным транспортом или промышленными роботами. Также применение данного подхода позволяет улучшить качество получаемой семантической разметки.

  • Переосмысление проблемы исследования в многоагентном обучении с подкреплением

    Для решения проблемы исследования в многоагентном обучении с подкреплением многие существующие алгоритмы используют дополнительные модели, усложняющие процесс обучения. В данной работе предлагается простая модификация популярного алгоритма QMIX, которая позволяет достичь результатов, сопоставимых SOTA алгоритмам, лишь немного изменив ϵ-жадную стратегию.

  • Автоматическая обработка текстовых ответов на вопросы

    Проект посвящен автоматической обработке текстовых ответов студентов на вопросы во время занятий. Решены 2 задачи: ранжирование ответов по близости идей и кластеризация основных мыслей в режиме онлайн. Использованы эмбеддинги из языковых моделей, методы понижения размерности, кластеризации и хеширования.

  • Применение глубоких нейронных сетей для задачи визуального контроля сварных соединений

    Рассмотрены методы решения задачи обнаружения визуальных дефектов (в частности задачи визуального контроля сварных соединений) при помощи глубоких нейронных сетей, а также проблемы потери информации при их использовании. Предложен вариант решения данной проблемы при помощи подхода «программируемой информации о градиенте», использующегося в YOLOv9.

  • Распознавание трехмерных объектов с использованием дифференцируемого представления сцены

    В данной работе описаны методы решения задачи детекции с использованием дифференцируемого представления сцены. Предложена и экспериментально апробирована гипотеза о обобщаемости детектора одного из методов.

  • Мультимодальные языковые модели для задач планирования действий роботом манипулятором

    Данная работа посвящена исследованию мультимодальных языковых моделей для задач планирования действий агентом в среде. LLM могут содержать много семантических знаний, полезных для роботов, но им может не хватать контекста для принятия решений в ситуациях реального мира. Изучая Visual-Language модели мы предлагаем три подхода: полная генерация, авторегрессионный подход и ранжирующий для построения плана выполнения сложных абстрактных задач, а также фреймворк для оценки и валидации подходов.

  • Методы обучения связей между метками в задаче temporal set prediction

    В работе проводится сравнительный анализ sota моделей в задаче temporal set prediction.