Секция посвящена когнитивным технологиям
Формат проведения: онлайн
Дата и время проведения: 05.04.2025 с 12.00
Место проведения: МФТИ
В данной работе предложена генеративная нейросетевая модель, заменяющая двумерные штрихкоды на изображениях. Это позволяет создавать аугментированные данные, решая проблемы нехватки обучающих наборов и несбалансированности классов, что помогает улучшить качество обучаемых алгоритмов компьютерного зрения.
Данная работа посвящена нейросетевой сегментации слоёв обонятельной луковицы на уникальных рентгеновских фазово-контрастных томографических изображениях. Ограниченность датасета, биологическая природа образца, неточность разметки, а также обилие деталей и высокий уровень шума, характерные для способа визуализации, делают традиционные подходы к сегментации малоэффективными. В работе предложены усовершенствования, направленные на повышение устойчивости модели к переобучению и точности сегментации.
В работе сравниваются два классических метода реконструкции изображений в компьютерной томографии (КТ): FBP и SIRT, с использованием фантомного изображения. Качество реконструкции оценивается с помощью метрик SSIM и MSE. Результаты показывают, что SIRT обеспечивает более высокое качество изображения с меньшим уровнем шума, но требует больше вычислительного времени, который быстрее, но менее точен. В будущих исследованиях планируется разработка методов, сочетающих скорость FBP и точность SIRT.
В работе предлагается система итеративного улучшения масок сегментации, позволяющая получать эталонную аннотацию путем редактирования предсказанных алгоритмом версий масок сегментации. Разработанный инструмент призван минимизировать стоимость разметки томографических данных, требующих высокой квалификации специалистов и высоких затрат ресурсов.
Создана система визуализации трёхмерных изображений. Система может визуализировать изображения, которые занимают больше памяти, чем доступно на видеокарте. Это полезно для отображения результатов томографии, потому что в последнее время они растут в размерах, и превышают ограничения памяти видеокарт.
Виртуальное разворачивание – процесс восстановления плоского изображения, нанесенного или выцарапанного на поверхности объекта, без механического воздействия. В данной работе будет рассмотрен алгоритм построения обучающей выборки для автоматического нейросетевого подхода виртуального разворачивания.
В настоящее время широкое применение нашли системы автоматического распознавания документов, удостоверяющих личность. В данной работе предложен метод ограничения размера описания документа в подходе, основанном на сопоставлении шаблонов документов.
В рамках работы предлагается простая сверточная модель для распознавания эмоций по ЭЭГ, основанная на контрастивном самоконтролируемом обучении, которая позволяет достичь соизмеримо высоких показателей по сравнению с SOTA моделями.
В данной статье предложен метод восстановления аудиоряда и изображения с помощью импульсной нейронной сети. Метод использует комбинацию синаптической пластичности и механизма распада весов, вдохновленный биологической структурой мозга. Мультисенсорный подход, объединяющий визуальные и аудиальные сигналы, позволяет улучшить качество восстановления. Модель показала высокую точность при тестировании на датасетах MNIST и Free Spoken Digit Dataset.