Анализ тональности | Оценочные слова | Машинное обучение

Извлечение словаря оценочной лексики на русском языке для мета-области товаров

Анализ тональности, оценочные слова, настройка на предметную область, машинное обучение.

В данной работе рассматривается новый подход к извлечению предметно-ориентированного словаря оценочной лексики на русском языке. Мы предлагаем использовать совокупность статистических и лингвистических признаков, позволяющих выявлять оценочные слова, и комбинировать эти признаки с помощью алгоритмов машинного обучения. Модель извлечения создается для предметной области фильмов, а затем применяется в других предметных областях. Мы оцениваем качество полученных словарей оценочных слов посредством ручной разметки. Наконец, мы собираем из отдельных словарей общий словарь оценочных слов, рассматривая его как оценочный словарь в широкой области товаров. Мы демонстрируем полезность полученного общего лексикона в задаче переноса модели анализа тональности с одной области на другую для отзывов пользователей на русском языке.

Извлечение-словаря-оценочной-лексики-на-русском-языке-для-мета-области-товаров

Загрузить документ