Интеллектуальный анализ данных ( data mining )

– процесс выявления значимых корреляций, образцов и тенденций в больших объёмах данных. Роль такого анализа возрастает с увеличением объёма информационных хранилищ ( Data Warehouse ). Он в основном применяется в бизнес-приложениях аналитиками и руководителями компаний. Для этих категорий пользователей разрабатываются высокоуровневые инструментальные средства, позволяющие решать достаточно сложные практические задачи без специальной математической подготовки.

В бизнес-приложениях наибольший интерес представляет интеграция методов интеллектуального анализа данных с технологией оперативной аналитической обработки данных ( OLAP – On - Line Analytical Processing ). Термин OLAP ввёл Кодд в 1993 г. В своей статье он рассмотрел недостатки реляционной модели, в первую очередь невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений». При этом имеется в виду именно многомерное концептуальное представление информации, а не структура таблиц базы данных, хотя в последнее время появились СУБД, уходящие от реляционных отношений в сторону многомерных банков данных.

Пример:

Пусть нам необходимо создать базу данных земельных участков. Каждый участок задается координатами узлов ломаной линии, ограничивающей его по периметру. В этом случае спроектировать реляционную таблицу невозможно, т.к. заранее не известно количество узлов для всех участков. Также невозможно написать общие процедуры (вычисление площади, нахождение пересечения и т.д.) для всех случаев.

назад главная вперед