Оглавление:
Определение - Что означает «Text Data Mining»?
Анализ текстовых данных включает в себя прохождение через текстовый документ или ресурс для получения ценной структурированной информации. Это требует сложных аналитических инструментов, которые обрабатывают текст для того, чтобы выделить конкретные ключевые слова или ключевые данные из того, что считается относительно необработанным или неструктурированным форматом.
Анализ текстовых данных также известен как анализ текста или анализ текста.
Techopedia объясняет добычу текстовых данных
При извлечении текстовых данных инженерные системы используют такие вещи, как таксономия и лексический анализ, чтобы определить, какие части текстового документа ценны как добытые данные. Статистические модели обычно полезны, и системы могут также использовать эвристику или алгоритмическое предположение, чтобы попытаться определить, какие части текста важны. Другие системы управления включают тегирование и анализ ключевых слов, где инструменты ищут конкретные собственные существительные или другие теги и ключевые слова, чтобы выяснить, о чем пишется.
Еще один уникальный компонент интеллектуального анализа текста часто называют анализом настроений. В анализе настроений, который, как правило, намного сложнее, чем в статистическом анализе, аналитические инструменты пытаются выяснить настроение или настроения, стоящие за письменным текстом, и другие аспекты того, к чему он обращается, на очень субъективном и интуитивном уровне. С появлением инструментов искусственного интеллекта был сделан большой прогресс в анализе настроений, так что современный интеллектуальный анализ текстовых данных - это больше, чем просто сбор количественных ссылок и вовлечение концептуальных моделей высокого уровня в интеллектуальный анализ текста, чтобы найти новые и уникальные способы. агрегировать ценные данные.