В статье рассматриваются вопросы использования текстовых данных исторического корпуса «Манускрипт», содержащего транскрипции средневековых славянских рукописей X–XV вв., в историко-лингвистических исследованиях. Демонстрируются возможности модулей корпусного менеджера для извлечения и визуализации лингвистических единиц, их первичного анализа. Особое внимание уделено получению количественных и статистических сведений о распределении и сочетаемости слов. Основная часть статьи посвящена новому модулю корпуса – дистрибутивному словарю, предназначенному для автоматического выявления слов, близких по своей семантике. При создании процедур словаря использован метод word2vec. Параметры настроек поиска (выбор подкорпуса, типа единицы анализа, количественной или статистической оценки совместной встречаемости и др.) и визуализации результата (количество аналогов, величина косинусного расстояния, список, граф) позволяют решать различные задачи, связанные с исследованием лексической семантики в средневековых славянских текстах. В качестве иллюстративного материала использованы количественно-статистические характеристики слов брань и рать.
Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.
Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.
Все права на товарные знаки принадлежат их законным владельцам!
Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.
Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.
Спасибо, понятно.