SCI Библиотека

SciNetwork библиотека — это централизованное хранилище... ещё…

Результаты поиска: 763 док. (сбросить фильтры)
Статья: CONTROLLING IMPRESSION: MAKING RUGPT3 GENERATE SENTIMENT-DRIVEN MOVIE REVIEWS

In this research paper, I investigate the controlled text generation capabilities of ruGPT3Large through fine-tuning, specifically focusing on generating movie reviews based on a designated sentiment attribute. Controlled text generation is an active area of inquiry within the domain of Natural Language Processing, particularly for the Russian language. This study exemplifies a simple approach to controllable text generation by training ruGPT3 on a textual dataset containing sentiment-marked prompts, enabling the model to recognize patterns and generate analogous texts. The research provides a comprehensive analysis of the limitations, shortcomings and merits of fine-tuning a large language model using prompts embedded in a dataset. The generated texts exhibit coherence, logical structure, abundant coreferential links, and narratives and vocabularies characteristic of film reviews. Nevertheless, ruGPT3-generated reviews exhibit certain linguistic errors. I classify the most prevalent errors, such as named entity confusion, grammatical gender inconsistencies and sentiment fluctuations. Given that the primary objective is to evaluate the efficacy of basic fine-tuning with respect to the specified attribute, both automatic sentiment analysis and human evaluation are employed for output assessment. In comparing the outputs of the fine-tuned model and the baseline ruGPT3Large, I observe that positive sentiment generation is the most successful, while neutral and negative sentiments are produced by the models less accurately.

Формат документа: pdf
Год публикации: 2022
Кол-во страниц: 1
Язык(и): Русский, Английский
Доступ: Всем
Статья: ПРИЕМЫ И СПОСОБЫ ЛЕКСИКОГРАФИРОВАНИЯ УСТАРЕВШЕЙ ЛЕКСИКИ В "СЛОВАРЕ РУССКОГО ЯЗЫКА XXI В." КАК ПОКАЗ СВЯЗИ РАЗНЫХ ЭПОХ

В статье рассматривается словарное представление пласта устаревшей лексики, известной в современном русском языке, в «Словаре русского языка XXI в.», на основе чего делаются выводы о месте лексико-семантических единиц прошлого в языке другой эпохи, семантических и стилистических процессах, характерных для функционирования устаревшей лексики в современном языке. Реализуется методика изучения лексики по лексикографическим данным, при которой толковый словарь современного языка, создаваемый по принципам антропоцентрической лексикографии, выступает и как итог описания национального языка, и как источник его изучения. Была подтверждена принципиальная неоднородность пласта устаревшей лексики в современном языке, по разным принципам строится лексикографическое описание историзмов и архаизмов разного типа. Обязательным элементом толкования историзмов является указание на время бытования обозначаемой ими реалии, толкование содержит элементы энциклопедизма. Ряд историзмов в современном употреблении развивает переносную семантику. Эти значения по возможности фиксируются Словарем, хотя естественно запаздывание лексикографической фиксации. Активным процессом современного этапа развития языка является актуализация историзмов, таким образом, в языке происходит регулярное перераспределение лексики между активным и пассивным запасом. В антропоцентрически ориентированном словаре актуализированные значения историзмов помещаются выше генетически первичных, но устаревших в современном языке. В словарных статьях, описывающих архаизмы, специальные пометы и подтолкования демонстрируют роль архаизмов как мощного стилистического ресурса. Отмечается использование архаизмов в стилизованной речи, в функции поэтизмов, с особой эмоционально-экспрессивной окраской, очень подробно описываются семантические нюансы и стилистические особенности таких употреблений. Подробная лексикографическая интерпретация устаревшей лексики в Словаре дает читателям словарей важную информацию о грамотном использовании этого пласта лексики и показывает преемственность языка разных эпох, являющуюся важнейшим свойством живой языковой системы.

Формат документа: pdf
Год публикации: 2022
Кол-во страниц: 1
Загрузил(а): Генералова Елена
Язык(и): Русский, Английский
Доступ: Всем
Статья: A REVIEW OF A COLLECTIVE MONOGRAPH ‘COMMUNICATIVE ADAPTATION IN DIALOGUE: A PHONETICIAN’S POINT OF VIEW’ (AUTHORS: T. V. KACHKOVSKAYA, A. D. MAMUSHINA, D. A. KOCHAROV,A. KHOLYAVIN, A. P. MENSHIKOVA, S. V. ZIMINA, V. V. EVDOKIMOVA, A. A. PORTNOVA, D. D. GUSEVA; EDITED BY T. V. KACHKOVAKAYA. ST. PETERSBURG: ST. PETERSBURG UNIVERSITY PRESS, 2022)

In June 2022, the publishing house of Saint Petersburg State University published the monograph Communicative Adaptation in Dialogue: A phonetician’s point of view (Kachkovskaya 2022), the fruit of many years of work by a team of authors who are teachers, students and graduates of the Department of Phonetics and Methods of Teaching Foreign Languages. The book explores the manifestations of intra-speaker speech variability as a result of the adaptation of interlocutors to each other in the course of the process of communication. This is the first comprehensive study of the phonetic side of communicative adaptation based on Russian material that determines the relevance and innovative perspective of this work and its unconditional theoretical value. The subtitle of the publication (‘a phonetician’s point of view’) is of note and is able to arouse the interest of a prospective reader.

Формат документа: pdf
Год публикации: 2022
Кол-во страниц: 1
Загрузил(а): Степихов Антон
Язык(и): Русский, Английский
Доступ: Всем
Статья: КАК ЯЗЫК PYTHON ПОМОГАЕТ ЛЕКСИКОГРАФАМ

Современные средства компьютерной обработки текста позволили автоматизировать многие рутинные задачи лексикографов и терминологов. Помимо привычных программных средств, применяемых для вспомогательных задач прикладной лексикографии специалистами по составлению терминологических и других словарей, в решении таких задач может помочь язык программирования Python и его библиотеки, такие как NLTK (Natural Language Toolkit), pymorphy2, mystem и др. Python - один из самых распространенных и доступных в изучении языков программирования, который все шире применяется в прикладной лингвистике. Статья продолжает цикл публикаций, знакомящих практикующих лингвистов и лексикографов с Python и его возможностями для обработки текстов на естественном языке (natural language processing). Описываются техники, которые можно использовать для предварительной обработки текстов с целью последующего извлечения из них терминологии и составления терминологических словарей, в том числе для нужд письменного перевода. В настоящее время эта задача пересекается с использованием систем машинного перевода, в ряде которых реализована функция приоритетного использования пользовательского терминологического двуязычного словаря. Кроме того, некоторые из описанных приемов помогут извлечь информацию из больших корпусов текстов и проанализировать их содержание. В статье описывается порядок выполнения токенизации и лемматизации текста или корпуса текстов, приемы для выделения наиболее частотных лемм, рассматриваются разные подходы к поиску в тексте частотных словосочетаний методом нахождения n-грамм. Техники для автоматического нахождения потенциальных узкоспециальных терминов проиллюстрированы примерами из научно-технического текста. На материале художественного текста показаны методы анализа содержания, например, подсчет частотности определенных лемм в корпусе. Все приведенные примеры кода можно скопировать и запустить в облачной среде Google Colab без установки каких-либо программ на компьютер. Надеемся, что эти приемы облегчат повседневную работу лексикографов, а может быть, и побудят лингвистов к изучению языка Python.

Формат документа: pdf
Год публикации: 2022
Кол-во страниц: 1
Загрузил(а): Ладушина Мария
Язык(и): Русский, Английский
Доступ: Всем
Статья: ОСОБЕННОСТИ ИСКУССТВЕННОЙ АНГЛОЯЗЫЧНОЙ СРЕДЫ ДЛЯ ДЕТЕЙ ДОШКОЛЬНОГО ВОЗРАСТА В БИЛИНГВАЛЬНОМ РЕГИОНЕ: РЕЗУЛЬТАТЫ СОЦИОЛИНГВИСТИЧЕСКОГО ОПРОСА

В связи с укреплением статуса английского языка как языка международного общения все более распространенным становится его изучение детьми раннего дошкольного возраста в условиях искусственно созданной языковой среды, которое до сих пор остается малоизученным в билингвальных регионах РФ. В данном небольшом социолингвистическом исследовании представлены результаты анализа речевых особенностей детей дошкольного возраста, проживающих на территории Республики Татарстан и осваивающих родные русский, татарский языки и неродной английский язык в условиях семейного взаимодействия. В данной работе проанализированы данные выборочного опроса, в котором приняли участие 28 казанских семей, воспитывающих детей от 2,5 до 7 лет, систематические записи речи детей, которые родители проводили на протяжении 4-х лет, а также аудио- и видеоматериалы (общий объем - 11 часов). Мы обнаружили взаимовлияние трех языковых систем на разных уровнях детской речи и проанализировали детские формообразовательные межъязыковые русско-английские и татаро-английские инновации, представляющие интерес в области онтобилингвологии и онтолингвистики. Также было установлено, что дети респондентов в процессе коммуникации на трех языках уже в раннем возрасте используют не только номинативную, но и металингвистическую функцию языка. Наше исследование подтверждает, что взаимопроникновение языковых структур в речи детей в рамках ныне популярного явления изучения и усвоения неродного английского языка детьми дошкольного возраста в условиях билингвальных регионов требует более серьезного и детального изучения специалистами по детской речи.

Формат документа: pdf
Год публикации: 2022
Кол-во страниц: 1
Язык(и): Русский, Английский
Доступ: Всем
Статья: NEW LOANWORDS IN RUSSIAN AND HUNGARIAN: EVIDENCE FROM A DICTIONARY CORPUS

The article compares new foreign neologisms in the 19th and 21st century Hungarian and Russian dictionaries. Hence, not only two linguistic cultures, but also two historical periods come under scrutiny. To identify new loanwords, the corpora of major Russian and Hungarian dictionaries were compiled. The study analyses methods used in lexicographic description of new words in Hungarian and Russian dictionaries within the specified period. It also focuses on general observations made on specific linguistic material. A dictionary-based corpus (corpus in a square) proved to be effective in diachronic studies. It helped to reveal the main trends in lexical borrowing in two unrelated languages. Corpora provide data on the word origin from different time periods, the first inclusion of a lexical item, its origin, meaning, semantic evolution and thematic nearness, statistical data, etc. The scope of available data depends on the level of lexicographic description. It was found to be very different for the 19th and 21st century dictionaries with more extensive data provided by the latter. The study shows that corpora can be an important first step in linguistic research across a range of avenues.

Формат документа: pdf
Год публикации: 2022
Кол-во страниц: 1
Загрузил(а): Дягилева Ирина
Язык(и): Русский, Английский
Доступ: Всем
Статья: НОВЫЕ МУЗЫКАЛЬНЫЕ ПОНЯТИЯ И ТЕРМИНЫ В НЕМЕЦКОЯЗЫЧНЫХ СМИ ПЕРИОДА ПАНДЕМИИ COVID-19

Данное исследование посвящено выявлению новых понятий и терминов сферы музыки в текстах немецкоязычных средств массовой информации периода пандемии COVID-19. СМИ являются тем медиумом, через который новые понятия и термины доходят до широкого круга читателей, что способствует закреплению новообразований в языке. Пандемия коронавируса вынудила адаптироваться под условия «новой нормальности» все без исключения сферы человеческой деятельности, в том числе и сферу музыки. Полученные результаты исследования показали, что, используя метод кластерного анализа, все новые музыкальные понятия и термины, которые появились в немецком языке в период пандемии COVID-19, можно разделить на три относительно гомогенные группы: музыка «ковидной» эпохи (музыкальные понятия, связанные с пандемией COVID-19), цифровая музыка (музыкальные понятия, связанные с цифровизацией) и музыка под открытым небом (музыкальные понятия, связанные с арт-пространством под открытым небом). Лексика данных кластеров иллюстрирует, как музыкальная сфера преодолевала период, связанный с санитарными ограничениями. Было установлено, что наибольшее количество примеров в данных кластерах связано с форматом проведения мероприятий, при этом среди них преобладают лексемы, относящиеся к кластеру цифровой музыки. В ходе исследования был сделан вывод о том, что пандемия коронавируса послужила катализатором тех процессов, которые шли уже на протяжении нескольких лет, так как часть рассматриваемой лексики употреблялась в СМИ ещё в начале 21 века. Проведенное исследование новых музыкальных понятий и терминов позволяет говорить о том, что искусство в целом и музыка в частности способны преодолеть любые преграды, чтобы добраться до того, кто их оценит.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): Ивченко Максим
Язык(и): Русский
Доступ: Всем
Статья: САКРАЛЬНЫЙ, ХУДОЖЕСТВЕННЫЙ И РЕЛИГИОЗНО-ХУДОЖЕСТВЕННЫЙ ТЕКСТЫ: ОПЫТ ТЕКСТОТИПОЛОГИЧЕСКОГО АНАЛИЗА

Статья посвящена проблеме типологической квалификации текстов, являющейся актуальной для современной лингвистики. Акцентируется значимость структурно-семантических параметров речевых произведений и нерелевантность фактора эмпирического адресата и контекста функционирования при отнесении текста к определенному типу. Цель исследования - обосновать различный текстотипологический статус сакральных и художественных текстов и наметить перспективу лингвистического осмысления религиозно-художественных текстов. Поставленная цель решается посредством обращения к теоретическим положениям функционального моделирования языка и категориального моделирования текста. Исходя из тезиса Р. Якобсона о языковых функциях как критерии типологической квалификации текстовых образований, в статье постулируется различие лингвофункциональной основы сакральных и художественных речевых произведений и, следовательно, их разная текстотипологическая принадлежность. Если в художественном тексте доминантой является актуализация поэтической функции языка, то в сакральном тексте доминирующую актуализацию приобретает религиозная языковая функция. Анализ референциальных особенностей исследуемых текстов свидетельствует о том, что в основе их образования лежат различные категориальные модели: художественные тексты антропоцентричны, сакральные - теоцентричны. Рассмотрена категория художественного вымысла, являющаяся текстообразующей в литературной коммуникации. Для текста Библии текстообразующей категорией выступает сакральность, детерминирующая его семантику и структуру. Данная категория является фактором текстообразования в различных видах вербальной коммуникации, в том числе художественной, что приводит к появлению гносеологически гетерогенных текстов, в частности, религиозно-художественных. Данные тексты определяются как формы позитивно-художественной концептуализации сакральности.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): Пашков Сергей
Язык(и): Русский
Доступ: Всем
Статья: ЯЗЫКОВАЯ РЕПРЕЗЕНТАЦИЯ ПОЛОЖИТЕЛЬНОЙ НАРРАТИВНОЙ ДЕМОНСТРАТИВНОЙ ТОНАЛЬНОСТИ В СОВРЕМЕННОМ ПЕРСОНАЛЬНОМ ДИСКУРСЕ

В современном информационном обществе акцентированное продвижение себя средствами коммуникативной демонстративности в повествовании о себе признается повсеместной нормой. Акцентированная положительная демонстративная тональность в речи играет важную роль в ежедневной коммуникации, влияя на впечатление, которое создает говорящий о себе через свои высказывания. Эта форма тональности может быть направлена как на самого говорящего, так и на адресата, в зависимости от мотивов говорящего, принимая нарративную или манипулятивную форму. Цель исследования состоит в раскрытии понятия положительной нарративной коммуникативной демонстративности и выявлении языковых средств её выражения в персональном дискурсе. Методы исследования включают междисциплинарный подход и метод психолингвистического анализа речи коммуникантов. Материалом для выявления языковых средств актуализации положительной нарративной коммуникативной демонстративности послужили высказывания участников современных телевизионных интервью и авторского шоу на YouTube. В результате проведенного исследования устанавливается, что положительная нарративная коммуникативная демонстративность является тональностью взаимодействия, которая образуется ярким представлением говорящим своего образа, преувеличением масштаба достоинств, акцентированностью позитивной эмоции и реализуется в речи с помощью таких вербальных средств, как гиперболическая метафора и гиперболические эпитеты, лексический повтор, клишированные конструкции, обозначающие наименование титулов и наград, абстрактные существительные с положительной коннотацией, речевые клише, содержащие гиперболу, частое употребление местоимения «я», усилительное наречие «всегда» и определительное местоимение «весь». Подчеркивается, что положительная нарративная демонстративная тональность является механизмом констатации я-концепции личности, выполняет функцию формирования отрефлексированного позитивного личного опыта коммуниканта.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): Тисленкова Ирина
Язык(и): Русский
Доступ: Всем
Статья: ОПРЕДЕЛЕНИЕ КРИТЕРИЕВ ОЦЕНКИ КАЧЕСТВА ПИСЬМЕННОГО ПЕРЕВОДА

В статье рассматривается проблема оценки качества перевода и определяются ее основные критерии. Проведенный анализ теоретических источников показал, что если раньше оценка качества перевода была неразрывно связана с эквивалентностью и адекватностью, то с ростом числа исследований критерии качественного перевода стали включать большее количество параметров: естественность, читабельность, точность, ясность, плавность, гладкость, идиоматичность, надежность, понятность, легкость восприятия, пригодность к использованию и воспроизводимость. Важной характеристикой качественного перевода является гармония, которая служит его «аксиологической доминантой». Несмотря на широкий набор инструментов оценки качественного перевода, общепринятого понятия некачественного перевода в теоретической литературе не представлено, что свидетельствует о перспективности исследований в этой области. Анализ научных статей в англоязычной научной литературе показал, что к критериям оценки качества перевода относят такие свойства текста перевода, как readability, fluency, smoothness, idiomaticity, usability, naturalness, transparency, accuracy, acceptability, intelligibility, fidelity, fluency, adequacy, comprehension, clarity, truth, trust and understanding. При анализе качества переводов авторы указывают количественные критерии оценки - допустимую плотность ошибок, равную 0,07 на предложение. Для описания некачественного перевода в англоязычной научной литературе применяется термин «translationese» (в русскоязычной литературе наиболее близким является термин «переводизм»), используемый для определения буквального перевода. Следует отметить, что в последнее время качество переводов стало неуклонно снижаться, что, с одной стороны, свидетельствует об изменении отношения к качеству исполнения как к главному показателю профессионализма, а с другой стороны, отвечает требованиям отрасли, предпочитающей получать больший объем выполненной работы при минимальных вложениях.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): Шейко Анастасия
Язык(и): Русский
Доступ: Всем