Деревья решений являются прекрасным инструментом в системах поддержки принятия решений, интеллектуального анализа данных (data mining).
В состав многих пакетов, предназначенных для интеллектуального анализа данных, уже включены методы построения деревьев решений. В областях, где высока цена ошибки, они послужат отличным подспорьем аналитика или руководителя
· Деревья решений успешно применяются для решения практических задач в следующих областях:
· Банковское дело. Оценка кредитоспособности клиентов банка при выдаче кредитов.
· Промышленность. Контроль за качеством продукции (выявление дефектов), испытания без разрушений (например проверка качества сварки) и т.д.
· Медицина. Диагностика различных заболеваний.
· Молекулярная биология. Анализ строения аминокислот.
дерево решение классификация управленческий
Это далеко не полный список областей где можно использовать деревья решений. Не исследованы еще многие потенциальные области применения.
На сегодняшний день существует значительное число алгоритмов, реализующих построение деревьев решений, из которых наибольшее распространение и популярность получили следующие:
· CART (Classification and Regression Tree), разработанный Л. Брейманом с соавторами [Breiman et al., 1984], представляет собой алгоритм построения бинарного дерева решений - дихотомической классификационной модели; каждый узел дерева при разбиении имеет только двух потомков; как видно из его названия, алгоритм решает задачи как классификации, так и регрессии;
· C4.5 - алгоритм построения дерева решений с неограниченным количеством потомков у узла, разработанный Р. Куинленом [Quinlan, 1993]; не умеет работать с непрерывным целевым полем, поэтому решает только задачи классификации;
· QUEST (Quick, Unbiased, Efficient Statistical Trees) - программа, разработанная В. Ло и И. Ши [Loh, Shih, 1997], в которой используются улучшенные варианты метода рекурсивного квадратичного дискриминантного анализа, позволяющие реализовать многомерное ветвление по линейным комбинациям порядковых предикторов; содержит ряд новых средств для повышения надежности и эффективности индуцируемых деревьев классификации.
Задание
Компания решает вопрос о предоставлении нового продукта на общенациональный рынок. Неопределенность заключается в том, как отреагирует рынок на новый продукт. Рассматривается вопрос об апробации нового продукта первоначально на некотором региональном рынке. Таким образом, первоначальное решение, которое необходимо принять компании - это проводить ли первоначальный маркетинг продукта на региональном уровне.
Компания предполагает, что выход на региональный уровень потребует затрат на 3 млн. грн., а выход на общенациональный рынок потребует вложения 90 млн. грн. Если не проводить первоначальных пробных продаж на региональном уровне, то решение о выходе на общенациональный рынок можно принять незамедлительно.
Компания рассматривает результаты продаж как успешные, средние или отрицательные в зависимости от объемов продаж. Для регионального уровня этим градациям соответствуют объемы в 200, 100 и 30 тыс. экземпляров, а для общенационального 6000, 3000 и 900 тыс. экземпляров соответственно. Исходя из данных по результатам региональных тестирований аналогичных видов продукции компания оценивает вероятности указанных трех исходов как 0,2, 0,5 и 0,3. Кроме того, исследуя данные о соотношении результатов региональных продаж с последующими продажами на общенациональном рынке, компания сумела оценить следующие условные вероятности (табл.).
Вариант №2 |
Условные вероятности продаж на общенациональном рынке | |
|
успешные |
средние |
отрицательные |
Вероятности продаж на региональном рынке |
0,2 |
успешные |
0,6 |
0,2 |
0,2 | |
0,5 |
средние |
0,7 |
0,2 |
0,1 | |
0,3 |
отрицательные |
0,1 |
0,2 |
0,7 |
|