МФЖ-101. Современные технологии поиска и обработки информации. Практическое задание №7. Структурный sentiment анализ информации с моделями MDS, ACM и оценкой дисперсии
|
Модель |
Текст 1 |
Текст 2 |
|
MDS-модель эмоциональной нагрузки текста |
Анализируя
представленные цвета, становится понятно, что статья несет скорее негативный
характер. Большая часть поля – синего оттенка, остальные поля и маленькие
островки – зеленого, что тоже не самый положительный результат. |
Тут мы видим, что
поле все так же синего цвета, однако, в отличие от первого текста, островков
с зеленым и желтым оттенком больше. И это верно, так как второй текст менее
негативный. |
|
Модели MDS и ACM (тональность) |
Почти все поле
синего цвета, что говорит о негативной окраске текста. И это верно.
Предложения с упоминанием аварии и смерти привлекли внимание, поэтому заняли
большую часть. |
В этой же модели
ситуация совсем иная. Все поле желтого цвет и всего одно предложение создает
остров синего оттенка. Это странно, так как текст все же негативный и такое
количество желтого – не верно. Предложения со словосочетаниями: «о диком
происшествии», « пострадавшим оказывается помощь», «сын попал под машину»,
«пострадал» и т.д., попали в желтую зону, что так же подтверждает ошибки в
графике. |
|
Модель
эмоциональных полей |
На
этой карте видно, как инструмент объединил абзацы на группы, анализируя,
какой эмоциональный тон используется в том или ином предложении. Опять же,
можно наблюдать такой же результат, как и на прошлой схеме. У нас имеется
одна сторона сгруппированных негативных абзацев и с противоположной стороны
малое количество положительных. |
Эта схема
идентична предыдущей и так же показывает больше позитивного, чем негативного.
Я не согласен с представленными данными.
|
|
График Feature Statistics |
Данная таблица
так же хорошо справилась. На графике видно, как показатели идут по
нарастающей. Так же и в тексте вся информация дается от общих сведений к
деталям (где в деталях упоминаются пострадавшие, алкогольное опьянение
водителя, смерти и т.д.) |
В этот раз график
так же хорошо справился и выдал верные данные. Показатели идут от меньшего к
большему (вся информация дается от общих сведений к деталям), далее данные
графика дублируются несколько раз, как раз на этом моменте в тексте
рассказываются разные негативные подробности аварии. |
Текст 1:
https://74.ru/text/incidents/2024/06/14/73707635/
Текст 2:
https://74.ru/text/incidents/2024/11/25/74373896/
Вывод: У
обоих текстов негативный посыл. Модель MDS хорошо
определяет это. Именно эта модель показывает нам всю картину целиком, помогая
определить с помощью цветных областей, какой эмоциональный фон превалирует.
Возможно, этот метод не самый идеальный, однако MDS лучше с этим справляется,
чем тот же АСМ, который во втором тексте показал совершено иные, не верные
показатели. График Feature Statistics в
данной ситуации хорош в поиске конкретно негативных областей в тексте.
Комментарии
Отправить комментарий