понедельник, 21 января 2013 г.

алгоритм построения ассоциативных правил "apriori


BaseGroup.ru :: Apriori - масштабируемый алгоритм поиска ассоциативных правил

| | | | Apriori - масштабируемый алгоритм... Адрес страницы в Интернете: http://www.basegroup.ru/library/analysis/association_rules/apriori/ -

A priori - масштабируемый алгоритм поиска ассоциативных правил

Современные имеют очень большие размеры, достигающие гига- и терабайтов, и тенденцию к дальнейшему увеличению. И поэтому, для нахождения ассоциативных правил требуются эффективные масштабируемые алгоритмы, позволяющие решить задачу за приемлемое время. Об одном из таких алгоритмов и пойдет речь в данной статье. Мы опишем алгоритм Apriori. Терминология и обозначения, которыми мы будем пользоваться, даны в статье .

Для того, чтобы было возможно применить алгоритм, необходимо провести предобработку данных: во-первых, привести все данные к бинарному виду; во-вторых, изменить структуру данных.

Обычный вид базы данных транзакций:

Номер транзакции

Наименование элемента

Нормализованный вид:

Количество столбцов в таблице равно количеству элементов, присутствующих в множестве транзакций D. Каждая запись соответствует транзакции, где в соответствующем столбце стоит 1, если элемент присутствует в транзакции, и 0 в противном случае. (см. ). Заметим, что исходный вид таблицы может быть отличным от приведенного в таблице 1. Главное, чтобы данные были преобразованы к нормализованному виду, иначе алгоритм не применим.


source

Комментариев нет:

Отправить комментарий