Работы автора

MMEmAsis: multimodal emotion and sentiment analysis (2024)

The paper presents a new multimodal approach to analyzing the psycho-emotional state of a person using nonlinear classifiers. The main modalities are the subject’s speech data and video data of facial expressions. Speech is digitized and transcribed using the Scribe library, and then mood cues are extracted using the Titanis sentiment analyzer from the FRC CSC RAS. For visual analysis, two different approaches were implemented: a pre-trained ResNet model for direct sentiment classification from facial expressions, and a deep learning model that integrates ResNet with a graph-based deep neural network for facial recognition. Both approaches have faced challenges related to environmental factors affecting the stability of results. The second approach demonstrated greater flexibility with adjustable classification vocabularies, which facilitated post-deployment calibration. Integration of text and visual data has significantly improved the accuracy and reliability of the analysis of a person’s psycho-emotional state

Издание: DISCRETE AND CONTINUOUS MODELS AND APPLIED COMPUTATIONAL SCIENCE
Выпуск: № 4, Том 32 (2024)
Автор(ы): Киселёв Г.А., Любишева Ярослава М., Вейценфельд Д.А.
Сохранить в закладках
Метод синтеза поведения когнитивного агента на основе обработки мультимодальных сигналов (2024)

В статье рассматривается проблема прогнозирования деятельности агента исходя из текстового описания задачи и визуального анализа среды. Предложено обновление подходов классической когнитивной архитектуры, позволяющее применять её в реальной среде. Разработано дополнение семиотического метода символьного обозначения авторским нейросетевым механизмом связывания векторов текстового и визуального пространств. Проведен ряд экспериментов с полученной моделью в комплексной среде эмулятора вождения автомобиля.

Издание: МОДЕЛИРОВАНИЕ И АНАЛИЗ ДАННЫХ
Выпуск: № 4, Том 14 (2024)
Автор(ы): Вейценфельд Д.А., Киселёв Г.А.
Сохранить в закладках