25 Октября 2022
📢 С 4 по 7 октября 2022 года в Санкт-Петербурге состоялась XXIV Международная конференция «Аналитика и управление данными в областях с интенсивным использованием данных» ( "Data Analytics and Management in Data Intensive Domains", DAMDID/RCDL’2022) на базе национального исследовательского университета ИТМО. В конференции приняли участие бауманцы-сотрудники стратегического проекта Bauman DeepAnalytics, реализуемого в рамках участия МГТУ в программе «Приоритет 2030».
Конференция DAMDID представляет собой мультидисциплинарный форум исследователей и практиков из разнообразных областей науки, содействующий сотрудничеству и обмену идеями в сфере анализа и управления данными в условиях их интенсивного использования. Конференция была образована в 2015 г. в результате трансформации конференции RCDL («Электронные библиотеки: перспективные методы и технологии, электронные коллекции») с целью создания форума, рассматривающего насущные проблемы анализа и управления данными в ходе исследований в различных областях с интенсивным использованием данных (data intensive domains – DID). При таком преобразовании была обеспечена преемственность трансформированной конференции по отношению к RCDL, а также сохранено RCDL-сообщество, сформировавшееся в течение 16 лет успешной работы RCDL.
Главная цель конференции – способствовать ускорению исследований и повышению их эффективности (качества, конкурентоспособности, видимости результатов) за счет совершенствования методов и средств анализа и управления данными в DID. Структура конференции традиционно включает пленарные приглашенные доклады и семинары ведущих иcследователей, стандартные сессии, на которых представляются полные и краткие доклады, посвященные результатам исследований в разных тематических областях конференции, а также демо/постерные сессии.
Сотрудники Bauman DeepAnalytics, представляющие проект «Создание интеллектуальных унифицированных систем поддержки принятия стратегических решений на базе глубокой и прогнозной аналитики больших данных», суммарно представили на конференции три тематических доклада:
1.«Simulated reference signals storage: basis for fast algorithms creation» (Ivan Deykin, Vladimir Syuzev, Elena Smirnova, Andrei Proletarsky)
Доклад посвящен организации хранилища эталонных многомерных сигналов и процессов для их дальнейшего использования в разработке новых быстрых алгоритмов моделирования в основе которых лежит универсальный адаптивный оператор преобразования матриц. В докладе представлены результаты проведенного анализа существующих подходов к созданию хранилищ, описан процесс выбора подхода к реализации доступа к данным, приведены примеры созданных наборов данных, а также приведены принципы построения онтологии, которая позволяет ускорить поиск нужного сигнала или процесса в созданном наборе данных. Дальнейшую работу команда исследователей видит в расширении и усовершенствовании и онтологии и набора данных, а также планирует разработать отдельное веб-приложение, которое позволило бы познакомить с различными методами имитации гармонических сигналов.
2. «A Method for creating structural models of text documents using neural networks» (Dmitry V. Berezkin, Ilya A. Kozlov, Polina A. Martynyuk, Artyom M. Panfilkin)
В докладе предлагается концепция использования нейросетевых NLP-моделей с целью создания структурной модели документа, представляющей из себя фрейм, параметры слотов которого настраиваются пользователем. Предлагается подход к построению модели документа путем формирования содержимого слотов фрейма (полей карточки модели) с использованием одного из двух предложенных алгоритмов. Продемонстрированы результаты экспериментов, проведенных над реализующей предложенный подход системой, с использованием архивов научных статей и национальных стратегий. Приведены выводы по текущим результатам работы и обозначены направления дальнейшей исследовательской работы.
3. «Sentence splitters benchmark» (Anna Zavyalova, Polina Martynyuk, Roman Samarev)
Доклад посвящен проблеме разбиения текстовых данных на предложения и включает в себя обзор программных библиотек, предоставляющих средства разбиения текста на предложения. В докладе предложена и реализована система, предназначенная для тестирования данных библиотек с получением метрик качества и производительности. Предложенная система реализована с использованием языка Julia с учетом его возможности выступать в качестве интеграционной платформы для библиотек, написанных на других языках программирования.
Участники выражают благодарность организаторам конференции DAMDID2022 за предоставление возможности публичной демонстрации результатов собственных исследований, ознакомления с научными работами коллег, а также участия в научных диспутах.
Bauman DeepAnalytics
25 Октября 2022