BaseGroup.ru :: Apriori - масштабируемый алгоритм поиска ассоциативных правил
| | | | Apriori - масштабируемый алгоритм... Адрес страницы в Интернете: http://www.basegroup.ru/library/analysis/association_rules/apriori/ -
A priori - масштабируемый алгоритм поиска ассоциативных правил
Современные имеют очень большие размеры, достигающие гига- и терабайтов, и тенденцию к дальнейшему увеличению. И поэтому, для нахождения ассоциативных правил требуются эффективные масштабируемые алгоритмы, позволяющие решить задачу за приемлемое время. Об одном из таких алгоритмов и пойдет речь в данной статье. Мы опишем алгоритм Apriori. Терминология и обозначения, которыми мы будем пользоваться, даны в статье .
Для того, чтобы было возможно применить алгоритм, необходимо провести предобработку данных: во-первых, привести все данные к бинарному виду; во-вторых, изменить структуру данных.
Обычный вид базы данных транзакций:
Номер транзакции
Наименование элемента
Нормализованный вид:
Количество столбцов в таблице равно количеству элементов, присутствующих в множестве транзакций D. Каждая запись соответствует транзакции, где в соответствующем столбце стоит 1, если элемент присутствует в транзакции, и 0 в противном случае. (см. ). Заметим, что исходный вид таблицы может быть отличным от приведенного в таблице 1. Главное, чтобы данные были преобразованы к нормализованному виду, иначе алгоритм не применим.
source
Комментариев нет:
Отправить комментарий