ISSN 2782-4799 · EISSN 2782-4802
Язык: ru

Архив статей журнала

ИНТЕЛЛЕКТУАЛЬНАЯ ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ: ОБЗОР АВТОМАТИЗИРОВАННЫХ МЕТОДОВ СУММАРИЗАЦИИ (2024)
Выпуск: Т. 3 № 3 (11) (2024)
Авторы: Сорокина Светлана Геннадьевна

Интерес к инновационным технологическим стратегиям и современным цифровым инструментам обработки информации значительно возрос в связи с необходимостью управления большими массивами неструктурированных данных. Автоматизированная суммаризация - важный инструмент в различных областях, требующих эффективного анализа и обработки больших объемов текстовой информации. В статье представлен обзор актуальных парадигм и сервисов автоматизированной суммаризации на основе междисциплинарных исследований в области лингвистики, компьютерных технологий и искусственного интеллекта. Особое внимание уделено синтаксическим и лексическим приемам, используемым нейросетевыми моделями для сжатия текста. В качестве примера рассмотрены сервисы QuillBot, Summate. it, WordTune, SciSummary, Scholarcy и OpenAI ChatGPT. Выявлено, что современные модели автоматизированной суммаризации успешно применяют экстрактивные и абстрактивные методы для создания резюме разного качества и объема. Экстрактивный подход основан на выделении наиболее значимых предложений в исходном тексте. Абстрактивные алгоритмы создают новые формулировки, сохраняя основную мысль оригинального текста. Автоматизированные суммаризаторы эффективно используют приемы сжатия текста (устранение избыточной информации, упрощение сложных конструкций и обобщение данных), присущие человеку в процессе обработки текстовой информации. Эти технологии обеспечивают высокую точность и связность генерируемых резюме, хотя каждая модель имеет свои ограничения. Для достижения оптимальных результатов важно учитывать специфику задачи и выбирать подходящую модель суммаризации: экстрактивную - для краткости и точности; абстрактивную - для более глубокой смысловой обработки текстовых данных.

Сохранить в закладках