Оглавление:
Определение - Что означает веб-майнинг?
Веб-майнинг - это процесс использования методов и алгоритмов интеллектуального анализа данных для извлечения информации непосредственно из Интернета путем извлечения ее из веб-документов и служб, веб-содержимого, гиперссылок и журналов сервера. Цель веб-майнинга - искать закономерности в веб-данных, собирая и анализируя информацию, чтобы понять тенденции, отрасль и пользователей в целом.Techopedia объясняет Web Mining
Веб-майнинг - это отрасль интеллектуального анализа данных, в которой основное внимание уделяется Всемирной паутине как первичному источнику данных, включая все его компоненты, от веб-контента, журналов сервера до всего, что находится между ними. Содержимое данных, добываемых из Интернета, может представлять собой набор фактов, которые веб-страницы должны содержать, и они могут состоять из текста, структурированных данных, таких как списки и таблицы, и даже изображений, видео и аудио.
Категории веб-майнинга:
- Анализ веб-контента - это процесс поиска полезной информации из содержимого веб-страниц и веб-документов, которые в основном представляют собой текст, изображения и аудио / видео файлы. Методы, используемые в этой дисциплине, в значительной степени основаны на обработке естественного языка (NLP) и поиске информации.
- Анализ структуры веб-сайтов - это процесс анализа узлов и структуры соединений веб-сайта с использованием теории графов. Из этого можно извлечь две вещи: структуру веб-сайта с точки зрения того, как он связан с другими сайтами, и структуру документа самого веб-сайта относительно того, как каждая страница связана.
- Анализ использования веб-ресурсов - это процесс извлечения шаблонов и информации из журналов сервера, чтобы получить представление о пользовательской активности, включая информацию о том, откуда пользователи, сколько человек щелкнуло по какому элементу на сайте и какие виды действий выполняются на сайте.
