Сообщения

Сообщения за март, 2025

задание №5. Автоматизированный кластерный анализ

Изображение
  1. Я использовала 10 текстов (детские рассказы про зиму) 2 . Выбранные мной тексты разделились на 2 группы: первая верхняя меньшая группа (1,3,4 и 10 текст) рассказывает о зиме, могу предположить, что именно они попали в общую группу, потому что это единственные тексты в которых была прямая речь от лица зимы. А во второй большой группе (оставшиеся тексты), содержат обычное красочное описание времени года (без прямой речи) 3. Да, число групп меняется при изменении уровня кластеризации. Если перемещать этот пунктир слева направо - количество групп увеличивается. При перемещении разделителя в левую сторону количество групп уменьшалось. 

Практика № 4 Автоматизированный контент-анализ с моделью текста

Изображение
Для анализа я выбрала две рецензии с разных источников на  ремейк культового произведения Фридриха Мурнау на фильма "Носферату" 2024 1.  1 рецензия 2. 2 рецензия  Вывод: В каждом тексте  модель текста среди ключевых слов в основном выделяет предлоги, союзы и частицы, которые не дают чёткого понимания о содержании текста. Но  Word cloud гораздо лучше справляется с задачей чем topic modelling.  Поэтому на мой взгляд, легче и удобнее по методике Word cloud.

Практика №3 Sentiment Analysis в социальных медиа

Изображение
  Я сравнивала три бренда одежды (Balenciaga, Saint Laurent и Prada) 1. Balenciaga Соотношение позитивного к негативному равно 4:1. Позитива больше.  Репрезентацию Balenciaga можно увидеть практически в одинаковом количестве фотографии и видео. Ссылки и статусы отстают. .  По ключевым словам, можно сделать вывод о том, что пользователей интересуют "sunglasses" - то есть элементы одежды, и далее уже лучшие коллекции, модные недели и т.д 2.  Saint Laurent Соотношение позитивного к негативному равно 9:1. Преимущественно негатив можно увидеть только на YouTube  Наиболее часто встречается на фото, но также присутствует в видео (но в меньшем количестве). А ссылки и статусы совсем на минимуме.  Ключевые запросы, в основном, связаны с поиском самого названия бренда и его продукции. Можно увидеть еще из ключевых слов - wb духи :).  2. Prada Так же как и у  Saint Laurent  cоотношение позитивного к негативному равно 9:1. Позитива намного больше. Репрез...

Практика №2 Структурный sentiment анализ информации.

Изображение
ТЕКСТ №1 (Негативный) ТЕКСТ № 2 (Положительный) Вывод:  Анализ двух текстов — одного о хакерстве (с негативным посылом), другого о лемурах (с позитивным посылом) — показал разницу в эмоциональной окраске. Первый текст, хотя и негативный, отличается более эмоциональной выразительностью. Второй текст, напротив, насыщен позитивными эмоциями и отличается менее высоким уровнем эмоциональности. Модель анализа смыслового содержания (АСМ) обеспечила более точную идентификацию типа эмоций, в то время как модель Feature Statistics более точно определила степень их выраженности.