Секция посвящена проблемам искусственного интеллекта
Формат проведения: очно-дистанционный
Дата проведения: 04.04.2024 в 14:00, МФТИ, корпус Цифры, поточная аудитория
Определение наличия у человека проблем с сердцем по записи ЭКГ – чрезвычайно актуальная и важная задача в медицине. В работе исследуется использование искусственного интеллекта для решения этой проблемы.
In this work we propose a semantic parsing training approach in multi-task paradigm. We evaluate our approach on two semantic parsing datasets, WikiSQL and LC-QuAD, in i.i.d. setting and in designed data splits to test models generalization abilitites. Our model outperforms standart pre-trained language models finetuning in i.i.d setting and in terms of generalization abilitites with a little compute overhead.
В рамках этой работы исследуются скрытые состояния BERT при переносе предсказания сложности текста. Задача формулировалась следующим образом: сравнить скрытые состояния модели BERT, обученной на английском языке, при предсказании на других языках. На данным момент показано наличие сходства активаций и выявлены характерные зависимости на скрытых слоях BERT в задачах многоклассового и бинарного предсказания сложности.
В данной работе решается задача увеличения степени теплофизической изученности участков скважины без отбора кернового материала. С использованием машинного обучения произведен прогноз основных компонент тензора теплопроводности и объемной теплоемкости горных пород. Использованный подход позволил учесть тепловую анизотропию, что открыло возможности для детального расчета теплового потока и его вариаций.
Проделанная работа заключается в написании архитектуры квантовой рекуррентной нейронной сети на языке программирования Python при помощи библиотеки Pennylane, моделировании её обучения на классическом компьютере, последующем запуске процесса обучения сети на квантовом процессоре и, в конечном итоге, сравнении результатов предсказания модели с результатами, полученными на уже существующих классических рекуррентных нейросетях.
Алгоритмы семейства DQN показали способность к генерализации на играх Atari, поэтому предлагается новый подход к решению задач – Atari-фикация: задача моделируется в виде Atari игры, а затем к ее решению применяется DQN (гиперпараметры алгоритма при этом не меняются). В рамках работы данный подход тестируется на конкретном примере: задача маршрутизации транспорта со стохастическими клиентами. Полученные результаты оказываются сравнимыми с SOTA подходами для данной задачи.
В работе предлагается использовать имеющиеся на беспилотных автомобилях устройства – лидары и камеры – как дополнительний способ локализации средства передвижения в пространстве с помощью мультимодальной нейросетевой модели.
В работе предлагается модификация архитектуры алгоритмов глубокого обучения для обработки аудио, использующая идею меж-доменного обучения и привлекающая к обработке аудио большие языковые модели.
В работе предлагается новый вариант мультимодальной системы нейросетевых моделей для распознавания текста с использованием функции потерь CLIP, в том числе для встраивания неразмеченных данных в обучение, а также внешней предобучаемой языковой моделью.
В работе представлены результаты использования нейронных сетей в задаче сегментации ребер на КТ снимках. Проведено исследование существующих подходов по решению данной задачи. Особое внимание уделено конструированию ошибки потерь и алгоритму постпроцессинга для улучшения качества предсказаний.
В данной работе рассмотрены подходы к анализу согласованности в задаче поиска и склейки одинаковых товаров на маркетплейсе. Рассмотрены проблемы прямолинейного метода транзитивного замыкания, а именно рассогласованность внутри групп, и предложены методы, учитывающие похожесть объекта со всеми объектами группы при принятии решения о склейке.
В данной работе изучаются возможности использования нейронных сетей в качестве инструмента для симметричного шифрования изображений. Предложенная модель основана на состязательном обучении и имеет сверточную архитектуру, что позволяет достичь низкой ошибки восстановления.
В данной работе рассматривается роль семантических масок сегментации в улучшении точности распознавания мест для автономной навигации. В экспериментах применяются различные подходы, включая использование изображений, семантических масок, и их комбинации, опираясь на архитектуру сверточной сети ResNet18. Исследование проводится на базе публичного датасета NCLT, а оценка эффективности моделей осуществляется с помощью метрик AR@1 и AR@1%.
В данной работе представлен анализ динамического расстояния для обучения целеобусловленной стратегии в модели мира, и предложен метод, позволяющий избежать проблему ложной экстраполяции динамического расстояния, что приводит к улучшению поведения агента на некоторых целях. Проблемой является повышенная зашумленность полученной стратегии, что сказывается на средней метрике достижения цели в худшую сторону.
Обзор методов аугментации набора данных для обучения нейронных сетей с помощью различных генеративных моделей. Были проанализированны выбранные методы на собранных данных и получены первые результаты.
В данной работе приведён алгоритм мультиагентного обучения, позволяющий децентрализованно применять алгоритмы обучения с подкреплением с коррекцией на динамику обучения других агентов (т.н. "моделирование оппонентов") на основе модели мира
В данной работе исследуется актуальная задача обнаружения дефектов дорожного полотна и краев дороги в условиях неблагоприятной погоды. Традиционные сенсоры, такие как камеры и лидары, сталкиваются с ограничениями при сильном снегопаде, тумане и пыли. Проведен обзор существующих датасетов и методов для решения поставленной задачи.
В работе рассматривается применение доказательного обучения для оценки неуверенности модели NeRF в предсказаниях семантических меток класса. Значение неопределенности необходимы для принятия решений в сферах, связанных с безопасностью, таких как управление беспилотным транспортом или промышленными роботами. Также применение данного подхода позволяет улучшить качество получаемой семантической разметки.
Для решения проблемы исследования в многоагентном обучении с подкреплением многие существующие алгоритмы используют дополнительные модели, усложняющие процесс обучения. В данной работе предлагается простая модификация популярного алгоритма QMIX, которая позволяет достичь результатов, сопоставимых SOTA алгоритмам, лишь немного изменив ϵ-жадную стратегию.
Проект посвящен автоматической обработке текстовых ответов студентов на вопросы во время занятий. Решены 2 задачи: ранжирование ответов по близости идей и кластеризация основных мыслей в режиме онлайн. Использованы эмбеддинги из языковых моделей, методы понижения размерности, кластеризации и хеширования.
Рассмотрены методы решения задачи обнаружения визуальных дефектов (в частности задачи визуального контроля сварных соединений) при помощи глубоких нейронных сетей, а также проблемы потери информации при их использовании. Предложен вариант решения данной проблемы при помощи подхода «программируемой информации о градиенте», использующегося в YOLOv9.
В данной работе описаны методы решения задачи детекции с использованием дифференцируемого представления сцены. Предложена и экспериментально апробирована гипотеза о обобщаемости детектора одного из методов.
Данная работа посвящена исследованию мультимодальных языковых моделей для задач планирования действий агентом в среде. LLM могут содержать много семантических знаний, полезных для роботов, но им может не хватать контекста для принятия решений в ситуациях реального мира. Изучая Visual-Language модели мы предлагаем три подхода: полная генерация, авторегрессионный подход и ранжирующий для построения плана выполнения сложных абстрактных задач, а также фреймворк для оценки и валидации подходов.
В работе проводится сравнительный анализ sota моделей в задаче temporal set prediction.
An adaptive Wheeled Mobile Manipulator (WMM) controller with output constraints is designed based on the back-stepping method. Actor-critic reinforcement learning (RL) is used to compensate for dynamic uncertainties and external disturbance in the control law. At the same time, Barrier Lyapunov function (BLF) is used to constraint the position tracking error of the WMM within a time-varying range. The simulation in matlab shows that the tracking errors converges within a small area.