HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-03-10
1 <ul><li><a>Типы информации</a></li>
1 <ul><li><a>Типы информации</a></li>
2 <li><a>Анализ - это</a><ul><li><a>Виды анализа</a><ul><li><a>Описательный метод</a></li>
2 <li><a>Анализ - это</a><ul><li><a>Виды анализа</a><ul><li><a>Описательный метод</a></li>
3 <li><a>Разведочный</a></li>
3 <li><a>Разведочный</a></li>
4 <li><a>Индуктивный метод</a></li>
4 <li><a>Индуктивный метод</a></li>
5 <li><a>Прогностический метод</a></li>
5 <li><a>Прогностический метод</a></li>
6 <li><a>Причинно-следственное изучение</a></li>
6 <li><a>Причинно-следственное изучение</a></li>
7 </ul></li>
7 </ul></li>
8 </ul></li>
8 </ul></li>
9 <li><a>Методы анализирования и обработки информации</a></li>
9 <li><a>Методы анализирования и обработки информации</a></li>
10 <li><a>Майнинг - это</a><ul><li><a>Свойства</a></li>
10 <li><a>Майнинг - это</a><ul><li><a>Свойства</a></li>
11 <li><a>Задачи майнинга</a></li>
11 <li><a>Задачи майнинга</a></li>
12 <li><a>Классификация</a><ul><li><a>Кластеризация</a></li>
12 <li><a>Классификация</a><ul><li><a>Кластеризация</a></li>
13 <li><a>Ассоциация</a></li>
13 <li><a>Ассоциация</a></li>
14 <li><a>Последовательная ассоциация</a></li>
14 <li><a>Последовательная ассоциация</a></li>
15 <li><a>Регрессия и прогнозирование</a></li>
15 <li><a>Регрессия и прогнозирование</a></li>
16 </ul></li>
16 </ul></li>
17 <li><a>Дополнительные задачи</a></li>
17 <li><a>Дополнительные задачи</a></li>
18 <li><a>Сферы применения</a><ul><li><a>Бизнес-задачи</a><ul><li><a>Электронная коммерция и производство</a></li>
18 <li><a>Сферы применения</a><ul><li><a>Бизнес-задачи</a><ul><li><a>Электронная коммерция и производство</a></li>
19 </ul></li>
19 </ul></li>
20 </ul></li>
20 </ul></li>
21 </ul></li>
21 </ul></li>
22 </ul><p>Информационные технологии стремительно развиваются. Вместе с тем совершенствуются методы обработки электронных материалов. Это помогает аналитикам и IT-специалистам быстрее и лучше применять получаемые сведения на практике для тех или иных целей.</p>
22 </ul><p>Информационные технологии стремительно развиваются. Вместе с тем совершенствуются методы обработки электронных материалов. Это помогает аналитикам и IT-специалистам быстрее и лучше применять получаемые сведения на практике для тех или иных целей.</p>
23 <p>Некоторые понятия, которые еще вчера были неизвестны, сегодня - обыденное дело. Пример - data mining. На соответствующей технологии будет заострено внимание в данной статье. Все это из-за того, что выбранное направление в условиях современности является весьма перспективным и продвинутым. Но освоить его не так-то просто.</p>
23 <p>Некоторые понятия, которые еще вчера были неизвестны, сегодня - обыденное дело. Пример - data mining. На соответствующей технологии будет заострено внимание в данной статье. Все это из-за того, что выбранное направление в условиях современности является весьма перспективным и продвинутым. Но освоить его не так-то просто.</p>
24 <h2>Типы информации</h2>
24 <h2>Типы информации</h2>
25 <p>Перед тем, как изучать методы, согласно которым ведется обработка данных, важно разобраться в особенностях самой информации. Она бывает нескольких видов:</p>
25 <p>Перед тем, как изучать методы, согласно которым ведется обработка данных, важно разобраться в особенностях самой информации. Она бывает нескольких видов:</p>
26 <ul><li>численной;</li>
26 <ul><li>численной;</li>
27 <li>интервальной;</li>
27 <li>интервальной;</li>
28 <li>ранговой;</li>
28 <li>ранговой;</li>
29 <li>номинальной.</li>
29 <li>номинальной.</li>
30 </ul><p>К первой категории относят числа (стоимость), ко второй - доли (рынка компании в качестве примера). В качестве ранговых материалов используют получаемые данные о продукции и потребителях. Пример - лояльность публики. Номинальными сведениями могут выступать профессии и навыки человека.</p>
30 </ul><p>К первой категории относят числа (стоимость), ко второй - доли (рынка компании в качестве примера). В качестве ранговых материалов используют получаемые данные о продукции и потребителях. Пример - лояльность публики. Номинальными сведениями могут выступать профессии и навыки человека.</p>
31 <p>Все перечисленные материалы могут быть структурированы, собраны воедино, а затем проанализированы посредством специальных формальных методов.</p>
31 <p>Все перечисленные материалы могут быть структурированы, собраны воедино, а затем проанализированы посредством специальных формальных методов.</p>
32 <h2>Анализ - это</h2>
32 <h2>Анализ - это</h2>
33 <p>Слово "анализ" произошло от древнегреческого сочетания ana + luo. В переводе на русский - "освобождать" или "распутать". Это - скрытый смысл рассматриваемого термина, независимо от выбранного метода реализации.</p>
33 <p>Слово "анализ" произошло от древнегреческого сочетания ana + luo. В переводе на русский - "освобождать" или "распутать". Это - скрытый смысл рассматриваемого термина, независимо от выбранного метода реализации.</p>
34 <p>Анализ - изучение предоставленных сведений с последующим преобразованием в выводы. На основе оных в будущем принимаются те или иные решения, а также строятся планы и алгоритмы действий.</p>
34 <p>Анализ - изучение предоставленных сведений с последующим преобразованием в выводы. На основе оных в будущем принимаются те или иные решения, а также строятся планы и алгоритмы действий.</p>
35 <p>Реализацией поставленной задачи занимаются специально обученные люди. Их называют аналитиками. Соответствующие лица хорошо разбираются в видах анализа данных, а также в построении выводов на основе полученных материалов.</p>
35 <p>Реализацией поставленной задачи занимаются специально обученные люди. Их называют аналитиками. Соответствующие лица хорошо разбираются в видах анализа данных, а также в построении выводов на основе полученных материалов.</p>
36 <h3>Виды анализа</h3>
36 <h3>Виды анализа</h3>
37 <p>Ученые давно научились классифицировать виды анализирования информации. Джеффри Лик смог выделить 6 типов реализации поставленной задачи:</p>
37 <p>Ученые давно научились классифицировать виды анализирования информации. Джеффри Лик смог выделить 6 типов реализации поставленной задачи:</p>
38 <ul><li>описательный;</li>
38 <ul><li>описательный;</li>
39 <li>разведочный;</li>
39 <li>разведочный;</li>
40 <li>индуктивный;</li>
40 <li>индуктивный;</li>
41 <li>прогностический;</li>
41 <li>прогностический;</li>
42 <li>казуальный;</li>
42 <li>казуальный;</li>
43 <li>механический.</li>
43 <li>механический.</li>
44 </ul><p>Последний имеет большее отношение к IT, но и другие варианты достойны внимания. В предложенной классификации методы изучения данных представлены от самого простого к наиболее сложному.</p>
44 </ul><p>Последний имеет большее отношение к IT, но и другие варианты достойны внимания. В предложенной классификации методы изучения данных представлены от самого простого к наиболее сложному.</p>
45 <h4>Описательный метод</h4>
45 <h4>Описательный метод</h4>
46 <p>Является наиболее простым. Называется также "дескриптивным". Отвечает за количественное описание набора предоставляемых материалов. Относится к выборке данных, относительно которых проводится анализ. Совокупность, из которой взяты сведения, вследствие реализации не подлежат описанию. Помогает формировать информацию, представленную в дашбордах.</p>
46 <p>Является наиболее простым. Называется также "дескриптивным". Отвечает за количественное описание набора предоставляемых материалов. Относится к выборке данных, относительно которых проводится анализ. Совокупность, из которой взяты сведения, вследствие реализации не подлежат описанию. Помогает формировать информацию, представленную в дашбордах.</p>
47 <p>Яркий пример - размещение новых заказов на веб-портале с самого начала отчетного периода. Сюда же можно отнести то, сколько новых пользователей посетили сервис в Сети за прошедшую неделю.</p>
47 <p>Яркий пример - размещение новых заказов на веб-портале с самого начала отчетного периода. Сюда же можно отнести то, сколько новых пользователей посетили сервис в Сети за прошедшую неделю.</p>
48 <h4>Разведочный</h4>
48 <h4>Разведочный</h4>
49 <p>Описательный метод - это только начало, хоть и очень важное. "Голых" цифр недостаточно для того, чтобы сделать не или иные выводы. Числа, полученные аналитиком, могут распределяться совершенно по-разному. Чтобы найти оптимальное решение, на помощь приходит разведочный метод.</p>
49 <p>Описательный метод - это только начало, хоть и очень важное. "Голых" цифр недостаточно для того, чтобы сделать не или иные выводы. Числа, полученные аналитиком, могут распределяться совершенно по-разному. Чтобы найти оптимальное решение, на помощь приходит разведочный метод.</p>
50 <p>При нем соблюдаются следующие правила и принципы:</p>
50 <p>При нем соблюдаются следующие правила и принципы:</p>
51 <ul><li>графики - приблизительные, а числовые данные - точные;</li>
51 <ul><li>графики - приблизительные, а числовые данные - точные;</li>
52 <li>статистические материалы предусматривают один набор вычислений;</li>
52 <li>статистические материалы предусматривают один набор вычислений;</li>
53 <li>сложные расчеты - наиболее верное решение для получения результатов.</li>
53 <li>сложные расчеты - наиболее верное решение для получения результатов.</li>
54 </ul><p>Методы анализа, опирающиеся на "голое" изучение данных, способны ввести в заблуждение. Разведочный метод дает возможность подтверждения или опровержения ранее сделанных выводов и полученных сведений.</p>
54 </ul><p>Методы анализа, опирающиеся на "голое" изучение данных, способны ввести в заблуждение. Разведочный метод дает возможность подтверждения или опровержения ранее сделанных выводов и полученных сведений.</p>
55 <h4>Индуктивный метод</h4>
55 <h4>Индуктивный метод</h4>
56 <p>Предыдущие два варианта - это то, что выступает под широкой зонтичной структурой. Они описывают характеристики предполагаемых наборов данных. Но без статистических исследований добиться желаемых результатов проблематично.</p>
56 <p>Предыдущие два варианта - это то, что выступает под широкой зонтичной структурой. Они описывают характеристики предполагаемых наборов данных. Но без статистических исследований добиться желаемых результатов проблематично.</p>
57 <p>Индуктивный метод анализа в своей основе содержит логическое извлечение материалов. Позволяет проводить тестирование гипотез.</p>
57 <p>Индуктивный метод анализа в своей основе содержит логическое извлечение материалов. Позволяет проводить тестирование гипотез.</p>
58 <p>Статистические выводы позволяют отвечать на следующие вопросы:</p>
58 <p>Статистические выводы позволяют отвечать на следующие вопросы:</p>
59 <ul><li>стандартная ошибка;</li>
59 <ul><li>стандартная ошибка;</li>
60 <li>доверительный интервал;</li>
60 <li>доверительный интервал;</li>
61 <li>статистическая погрешность;</li>
61 <li>статистическая погрешность;</li>
62 <li>математическое ожидание по предоставленной выборке;</li>
62 <li>математическое ожидание по предоставленной выборке;</li>
63 <li>разница средних значений по двум выборкам;</li>
63 <li>разница средних значений по двум выборкам;</li>
64 <li>определение размера выборки и анализ мощности статистического характера%</li>
64 <li>определение размера выборки и анализ мощности статистического характера%</li>
65 <li>распределение данных;</li>
65 <li>распределение данных;</li>
66 <li>регрессия;</li>
66 <li>регрессия;</li>
67 <li>определение критериев соответствия и ассоциированности.</li>
67 <li>определение критериев соответствия и ассоциированности.</li>
68 </ul><p>Вследствие применения данного алгоритма человек получает уникальную возможность - строить гипотезы и проверять их, снижая ложноположительные результаты по максимуму.</p>
68 </ul><p>Вследствие применения данного алгоритма человек получает уникальную возможность - строить гипотезы и проверять их, снижая ложноположительные результаты по максимуму.</p>
69 <h4>Прогностический метод</h4>
69 <h4>Прогностический метод</h4>
70 <p>Опирается на индуктивный анализ. Цель - изучение взаимосвязей между переменными на основе имеющихся наборов сведений, а также разработать статистическую модель. При помощи последней человек должен получить возможность прогнозировать значения для новых, неполных или будущих точек данных.</p>
70 <p>Опирается на индуктивный анализ. Цель - изучение взаимосвязей между переменными на основе имеющихся наборов сведений, а также разработать статистическую модель. При помощи последней человек должен получить возможность прогнозировать значения для новых, неполных или будущих точек данных.</p>
71 <p>Часто используется в следующих областях:</p>
71 <p>Часто используется в следующих областях:</p>
72 <ul><li>утилиты для знакомств;</li>
72 <ul><li>утилиты для знакомств;</li>
73 <li>приложения для игр на биржах и фондовых рынках;</li>
73 <li>приложения для игр на биржах и фондовых рынках;</li>
74 <li>спам-фильтры;</li>
74 <li>спам-фильтры;</li>
75 <li>выдача рекомендаций по контенту;</li>
75 <li>выдача рекомендаций по контенту;</li>
76 <li>социальные сети;</li>
76 <li>социальные сети;</li>
77 <li>кросс-продажи;</li>
77 <li>кросс-продажи;</li>
78 <li>объявления рекламного характера/купоны;</li>
78 <li>объявления рекламного характера/купоны;</li>
79 <li>прогнозы пользовательской активности;</li>
79 <li>прогнозы пользовательской активности;</li>
80 <li>политические кампании.</li>
80 <li>политические кампании.</li>
81 </ul><p>Прогностический анализ служит мощным инструментом в арсенале каждой корпорации. За счет него управление данными производится в несколько раз проще и быстрее.</p>
81 </ul><p>Прогностический анализ служит мощным инструментом в арсенале каждой корпорации. За счет него управление данными производится в несколько раз проще и быстрее.</p>
82 <h4>Причинно-следственное изучение</h4>
82 <h4>Причинно-следственное изучение</h4>
83 <p>Позволяет обнаруживать причинно-следственные связи, на основании которых аналитики в будущем строят собственные гипотезы. Иногда данный прием предусматривает внедрение НЛП-технологий в целях повышения эффективности работы бизнеса.</p>
83 <p>Позволяет обнаруживать причинно-следственные связи, на основании которых аналитики в будущем строят собственные гипотезы. Иногда данный прием предусматривает внедрение НЛП-технологий в целях повышения эффективности работы бизнеса.</p>
84 <p>Основная идея: провести эксперимент (или их серию) с корректировкой параметров и контролем предельного количества остальных составляющих. Пример - эксперимент с электронной почтовой рассылкой клиентам по разным продуктам.</p>
84 <p>Основная идея: провести эксперимент (или их серию) с корректировкой параметров и контролем предельного количества остальных составляющих. Пример - эксперимент с электронной почтовой рассылкой клиентам по разным продуктам.</p>
85 <h2>Методы анализирования и обработки информации</h2>
85 <h2>Методы анализирования и обработки информации</h2>
86 <p>На сегодняшний день в мире существуют различные методы обработки данных. Все они предусматривают свои нюансы и особенности.</p>
86 <p>На сегодняшний день в мире существуют различные методы обработки данных. Все они предусматривают свои нюансы и особенности.</p>
87 <p>К соответствующим алгоритмам относят:</p>
87 <p>К соответствующим алгоритмам относят:</p>
88 <ul><li>анализ кластерного типа;</li>
88 <ul><li>анализ кластерного типа;</li>
89 <li>факторный анализ;</li>
89 <li>факторный анализ;</li>
90 <li>нейронные сети;</li>
90 <li>нейронные сети;</li>
91 <li>древа решений;</li>
91 <li>древа решений;</li>
92 <li>регрессионный анализ;</li>
92 <li>регрессионный анализ;</li>
93 <li>дискриминантное изучение;</li>
93 <li>дискриминантное изучение;</li>
94 <li>корреляционный анализ.</li>
94 <li>корреляционный анализ.</li>
95 </ul><p>Отдельно современность выделяет интеллектуальный анализ. Сюда относят так называемый майнинг. Он выходит на передовые позиции у всех аналитиков, позволяя получать полезные данные и эффективно проводить разработку стратегий поведения на рынках.</p>
95 </ul><p>Отдельно современность выделяет интеллектуальный анализ. Сюда относят так называемый майнинг. Он выходит на передовые позиции у всех аналитиков, позволяя получать полезные данные и эффективно проводить разработку стратегий поведения на рынках.</p>
96 <h2>Майнинг - это</h2>
96 <h2>Майнинг - это</h2>
97 <p>Data Mining с иностранного языка дословно переводится как "раскопка/добыча данных". Это - интеллектуальный метод изучения информации. Появился термин в 90-х годах, когда началось стремительное развитие информационных технологий и IT. Объем материалов электронного характера активно растет, его требуется не только хранить, но и использовать с пользой.</p>
97 <p>Data Mining с иностранного языка дословно переводится как "раскопка/добыча данных". Это - интеллектуальный метод изучения информации. Появился термин в 90-х годах, когда началось стремительное развитие информационных технологий и IT. Объем материалов электронного характера активно растет, его требуется не только хранить, но и использовать с пользой.</p>
98 <p>Стоит запомнить следующие определения:</p>
98 <p>Стоит запомнить следующие определения:</p>
99 <ul><li>это - способ обнаружения в базах данных нетривиальных и полезных на практике закономерностей;</li>
99 <ul><li>это - способ обнаружения в базах данных нетривиальных и полезных на практике закономерностей;</li>
100 <li>процесс выделения, моделирования, а также исследования биг даты в целях обнаружения неизвестных ранее структур;</li>
100 <li>процесс выделения, моделирования, а также исследования биг даты в целях обнаружения неизвестных ранее структур;</li>
101 <li>целью майнинга служит обнаружение новых значимых корреляций, образов, тенденций вследствие просеивания Big Data посредством статистических и математических методов;</li>
101 <li>целью майнинга служит обнаружение новых значимых корреляций, образов, тенденций вследствие просеивания Big Data посредством статистических и математических методов;</li>
102 <li>майнингом называют изучение и обнаружение алгоритмами ("машинами", искусственным интеллектом) в сырых данных скрытых ранее знаний нетривиального характера, являющихся полезными практически, доступными для понимания человеком.</li>
102 <li>майнингом называют изучение и обнаружение алгоритмами ("машинами", искусственным интеллектом) в сырых данных скрытых ранее знаний нетривиального характера, являющихся полезными практически, доступными для понимания человеком.</li>
103 </ul><p>Mining - своеобразный процесс, помогающий обнаруживать "в общей массе" информации полезные знания о бизнесе и предпринимательской деятельности.</p>
103 </ul><p>Mining - своеобразный процесс, помогающий обнаруживать "в общей массе" информации полезные знания о бизнесе и предпринимательской деятельности.</p>
104 <h3>Свойства</h3>
104 <h3>Свойства</h3>
105 <p>Данные, которые обнаруживаются при помощи такого метода, как майнинг, обладают определенными свойствами. А именно:</p>
105 <p>Данные, которые обнаруживаются при помощи такого метода, как майнинг, обладают определенными свойствами. А именно:</p>
106 <ol><li>Неизвестность. Информация должна быть ранее неизвестной, новой. Усилия и ресурсы, потраченные да получение оных, никак не окупаются. Соответственно, ценность имеют только новшества.</li>
106 <ol><li>Неизвестность. Информация должна быть ранее неизвестной, новой. Усилия и ресурсы, потраченные да получение оных, никак не окупаются. Соответственно, ценность имеют только новшества.</li>
107 <li>Нетривиальность. Результаты проводимого анализа отражают то, что неочевидно, неожиданно, хоть и закономерно. Майнинг должен предоставлять ранее скрытые знания. Если полученные результаты могли быть получены более простыми методами, mining является неоправданным. Он требует существенных затрат от предприятия.</li>
107 <li>Нетривиальность. Результаты проводимого анализа отражают то, что неочевидно, неожиданно, хоть и закономерно. Майнинг должен предоставлять ранее скрытые знания. Если полученные результаты могли быть получены более простыми методами, mining является неоправданным. Он требует существенных затрат от предприятия.</li>
108 <li>Полезность.</li>
108 <li>Полезность.</li>
109 <li>Доступность для человеческого понимания. Знания, которые получает аналитик, должны быть обязательно объяснимы логически. Иначе можно предположить, что соответствующие результаты - чистая случайность.</li>
109 <li>Доступность для человеческого понимания. Знания, которые получает аналитик, должны быть обязательно объяснимы логически. Иначе можно предположить, что соответствующие результаты - чистая случайность.</li>
110 </ol><p>Для того, чтобы представить публике полученную информацию, используются разнообразные модели. Их разновидности напрямую зависят от методов создания. Самые распространенные - это: правила, деревья решений, математические функции, а также всевозможные кластеры.</p>
110 </ol><p>Для того, чтобы представить публике полученную информацию, используются разнообразные модели. Их разновидности напрямую зависят от методов создания. Самые распространенные - это: правила, деревья решений, математические функции, а также всевозможные кластеры.</p>
111 <h3>Задачи майнинга</h3>
111 <h3>Задачи майнинга</h3>
112 <p>В основе рассматриваемого приема лежит шаблонная концепция, которая представлена теми или иными закономерностями. Когда обнаруживаются скрытые данные, происходит решение DataMining.</p>
112 <p>В основе рассматриваемого приема лежит шаблонная концепция, которая представлена теми или иными закономерностями. Когда обнаруживаются скрытые данные, происходит решение DataMining.</p>
113 <p>Пока нет единого мнения относительно того, какие именно задачи относятся к майнингу. В основной массе источников указаны следующие варианты:</p>
113 <p>Пока нет единого мнения относительно того, какие именно задачи относятся к майнингу. В основной массе источников указаны следующие варианты:</p>
114 <ul><li>кластеризация;</li>
114 <ul><li>кластеризация;</li>
115 <li>анализ связей;</li>
115 <li>анализ связей;</li>
116 <li>ассоциация;</li>
116 <li>ассоциация;</li>
117 <li>визуализация отклонений;</li>
117 <li>визуализация отклонений;</li>
118 <li>прогнозирование;</li>
118 <li>прогнозирование;</li>
119 <li>подведение конкретных итогов.</li>
119 <li>подведение конкретных итогов.</li>
120 </ul><p>Это - наиболее распространенные цели, которым отвечает метод работы с информацией, обозначенный как mining. Далее каждый вариант будет рассмотрен более детально.</p>
120 </ul><p>Это - наиболее распространенные цели, которым отвечает метод работы с информацией, обозначенный как mining. Далее каждый вариант будет рассмотрен более детально.</p>
121 <h3>Классификация</h3>
121 <h3>Классификация</h3>
122 <p>Одна из самых важных задач майнинга. Применяется при:</p>
122 <p>Одна из самых важных задач майнинга. Применяется при:</p>
123 <ul><li>оценке кредитоспособности населения;</li>
123 <ul><li>оценке кредитоспособности населения;</li>
124 <li>получения информации о лояльности клиентуры;</li>
124 <li>получения информации о лояльности клиентуры;</li>
125 <li>распознавании образов;</li>
125 <li>распознавании образов;</li>
126 <li>медицинской диагностике.</li>
126 <li>медицинской диагностике.</li>
127 </ul><p>Когда аналитик знает свойства объектов каждого класса, новые наблюдения относятся к определенному "типу", данные свойства автоматически на него распространяются.</p>
127 </ul><p>Когда аналитик знает свойства объектов каждого класса, новые наблюдения относятся к определенному "типу", данные свойства автоматически на него распространяются.</p>
128 <p>Если классов два, имеет место так называемая бинарная классификация. К ней сводятся более сложные задачи. Пример - вместо степеней риска кредитного характера вывести информацию о возможности выдачи займа - "да" или "нет".</p>
128 <p>Если классов два, имеет место так называемая бинарная классификация. К ней сводятся более сложные задачи. Пример - вместо степеней риска кредитного характера вывести информацию о возможности выдачи займа - "да" или "нет".</p>
129 <p>При классификации используются разнообразные модели:</p>
129 <p>При классификации используются разнообразные модели:</p>
130 <ul><li>нейронные сети;</li>
130 <ul><li>нейронные сети;</li>
131 <li>машинные опорные векторы;</li>
131 <li>машинные опорные векторы;</li>
132 <li>древа решений;</li>
132 <li>древа решений;</li>
133 <li>метод k-ближайших соседей;</li>
133 <li>метод k-ближайших соседей;</li>
134 <li>алгоритм покрытия.</li>
134 <li>алгоритм покрытия.</li>
135 </ul><p>Вследствие рассматриваемой задачи пространство признаков разбивается на области. В каждом "блоке" многомерные векторы рассматриваются под видом идентичных. Так, если объект отнесли к области пространства, ассоциированную с конкретным классом, он будет относиться к оному.</p>
135 </ul><p>Вследствие рассматриваемой задачи пространство признаков разбивается на области. В каждом "блоке" многомерные векторы рассматриваются под видом идентичных. Так, если объект отнесли к области пространства, ассоциированную с конкретным классом, он будет относиться к оному.</p>
136 <h4>Кластеризация</h4>
136 <h4>Кластеризация</h4>
137 <p>Это - логическое продолжение идеи классификации. Более сложный процесс, так как изначально class информации не предопределен. Результат - это разбиение полученных материалов на различные группы.</p>
137 <p>Это - логическое продолжение идеи классификации. Более сложный процесс, так как изначально class информации не предопределен. Результат - это разбиение полученных материалов на различные группы.</p>
138 <h4>Ассоциация</h4>
138 <h4>Ассоциация</h4>
139 <p>Поиск закономерностей между связанными событиями в наборе данных. Отличается тем, что реализация поставленной задачи осуществляется между несколькими событиями. Они должны произойти одновременно.</p>
139 <p>Поиск закономерностей между связанными событиями в наборе данных. Отличается тем, что реализация поставленной задачи осуществляется между несколькими событиями. Они должны произойти одновременно.</p>
140 <p>Самый известный алгоритм ассоциаций - Apriori.</p>
140 <p>Самый известный алгоритм ассоциаций - Apriori.</p>
141 <h4>Последовательная ассоциация</h4>
141 <h4>Последовательная ассоциация</h4>
142 <p>Обнаружение временных закономерностей между несколькими транзакциями. Вариант похож на ассоциации, но с другой целью. А именно - установить закономерности между событиями, которые связаны не случайно, а во времени.</p>
142 <p>Обнаружение временных закономерностей между несколькими транзакциями. Вариант похож на ассоциации, но с другой целью. А именно - установить закономерности между событиями, которые связаны не случайно, а во времени.</p>
143 <p>Правило последовательности: после события А через определенный промежуток времени обязательно произойдет событие Б.</p>
143 <p>Правило последовательности: после события А через определенный промежуток времени обязательно произойдет событие Б.</p>
144 <h4>Регрессия и прогнозирование</h4>
144 <h4>Регрессия и прогнозирование</h4>
145 <p>При прогнозировании оцениваются пропущенные или будущие значения целевых численных данных. Чтобы реализовать соответствующие задачи, используют:</p>
145 <p>При прогнозировании оцениваются пропущенные или будущие значения целевых численных данных. Чтобы реализовать соответствующие задачи, используют:</p>
146 <ul><li>математическую статистику;</li>
146 <ul><li>математическую статистику;</li>
147 <li>нейронные сети.</li>
147 <li>нейронные сети.</li>
148 </ul><p>При воплощении задумки в жизнь учитываются нюансы исторических материалов.</p>
148 </ul><p>При воплощении задумки в жизнь учитываются нюансы исторических материалов.</p>
149 <h3>Дополнительные задачи</h3>
149 <h3>Дополнительные задачи</h3>
150 <p>Data Mining имеет несколько дополнительных задач. К ним относят:</p>
150 <p>Data Mining имеет несколько дополнительных задач. К ним относят:</p>
151 <ul><li>определение отклонений и выбросов;</li>
151 <ul><li>определение отклонений и выбросов;</li>
152 <li>оценивание;</li>
152 <li>оценивание;</li>
153 <li>анализ связей;</li>
153 <li>анализ связей;</li>
154 <li>визуализация;</li>
154 <li>визуализация;</li>
155 <li>подытоживание;</li>
155 <li>подытоживание;</li>
156 <li>свободный поиск (автоматическое исследование и открытие);</li>
156 <li>свободный поиск (автоматическое исследование и открытие);</li>
157 <li>объяснение и описание.</li>
157 <li>объяснение и описание.</li>
158 </ul><p>Сейчас майнинг встречается повсеместно. Его используют в самых разных направлениях человеческой деятельности.</p>
158 </ul><p>Сейчас майнинг встречается повсеместно. Его используют в самых разных направлениях человеческой деятельности.</p>
159 <h3>Сферы применения</h3>
159 <h3>Сферы применения</h3>
160 <p>Чаще всего DataMining встречается при решении различных бизнес-задач. Именно в этой области эффективности задействования инструментария достигает максимума. А еще удается быстро окупить стоимость понесенных расходов на воплощение метода в жизнь.</p>
160 <p>Чаще всего DataMining встречается при решении различных бизнес-задач. Именно в этой области эффективности задействования инструментария достигает максимума. А еще удается быстро окупить стоимость понесенных расходов на воплощение метода в жизнь.</p>
161 <p>В основном майнинг применяется в:</p>
161 <p>В основном майнинг применяется в:</p>
162 <ul><li>науке;</li>
162 <ul><li>науке;</li>
163 <li>бизнесе;</li>
163 <li>бизнесе;</li>
164 <li>правительственных исследованиях;</li>
164 <li>правительственных исследованиях;</li>
165 <li>веб-направлениях.</li>
165 <li>веб-направлениях.</li>
166 </ul><p>Это - четыре основные области, в которых без рассматриваемой методики стало крайне трудно добиться эффективности и принимать грамотные решения.</p>
166 </ul><p>Это - четыре основные области, в которых без рассматриваемой методики стало крайне трудно добиться эффективности и принимать грамотные решения.</p>
167 <h4>Бизнес-задачи</h4>
167 <h4>Бизнес-задачи</h4>
168 <p>Основном "работает" в направлениях:</p>
168 <p>Основном "работает" в направлениях:</p>
169 <ul><li>банковская деятельность;</li>
169 <ul><li>банковская деятельность;</li>
170 <li>финансы;</li>
170 <li>финансы;</li>
171 <li>услуги по страхованию;</li>
171 <li>услуги по страхованию;</li>
172 <li>телекоммуникации;</li>
172 <li>телекоммуникации;</li>
173 <li>электронная коммерция;</li>
173 <li>электронная коммерция;</li>
174 <li>маркетинг;</li>
174 <li>маркетинг;</li>
175 <li>фондовые рынки;</li>
175 <li>фондовые рынки;</li>
176 <li>производство;</li>
176 <li>производство;</li>
177 <li>CRM.</li>
177 <li>CRM.</li>
178 </ul><p>При помощи майнинга удается не только распознать мошенников по кредитным картам, но и привлечь новых клиентов, а также провести сегментацию рынков.</p>
178 </ul><p>При помощи майнинга удается не только распознать мошенников по кредитным картам, но и привлечь новых клиентов, а также провести сегментацию рынков.</p>
179 <h5>Электронная коммерция и производство</h5>
179 <h5>Электронная коммерция и производство</h5>
180 <p>Используется Data Mining для того, чтобы сформировать рекомендательные системы и решения задач классификации посетителей веб-страничек. За счет этого удается делить "клиентов" на группы, а затем осуществлять маркетинг, который будет предельно отвечать потребностям, интересам и нуждам клиентуры.</p>
180 <p>Используется Data Mining для того, чтобы сформировать рекомендательные системы и решения задач классификации посетителей веб-страничек. За счет этого удается делить "клиентов" на группы, а затем осуществлять маркетинг, который будет предельно отвечать потребностям, интересам и нуждам клиентуры.</p>
181 <p>В промышленном производстве соответствующее направление отвечает за решение следующих задач:</p>
181 <p>В промышленном производстве соответствующее направление отвечает за решение следующих задач:</p>
182 <ul><li>анализ производственных ситуаций;</li>
182 <ul><li>анализ производственных ситуаций;</li>
183 <li>составление прогнозов по развитию производства (краткосрочного и долгосрочного характера);</li>
183 <li>составление прогнозов по развитию производства (краткосрочного и долгосрочного характера);</li>
184 <li>разработка оптимизационных решений;</li>
184 <li>разработка оптимизационных решений;</li>
185 <li>составление прогнозов относительно качества изделий в зависимости от тех или иных параметров технологических процессов;</li>
185 <li>составление прогнозов относительно качества изделий в зависимости от тех или иных параметров технологических процессов;</li>
186 <li>выявление скрытых перспектив и закономерностей развития производства;</li>
186 <li>выявление скрытых перспектив и закономерностей развития производства;</li>
187 <li>получение данных о скрытых факторах влияния;</li>
187 <li>получение данных о скрытых факторах влияния;</li>
188 <li>выявление сред взаимодействия производственных процессов и выдвижение гипотез по корректировке их параметров;</li>
188 <li>выявление сред взаимодействия производственных процессов и выдвижение гипотез по корректировке их параметров;</li>
189 <li>выработка оптимизационных рекомендации по отношению управления производством;</li>
189 <li>выработка оптимизационных рекомендации по отношению управления производством;</li>
190 <li>визуализация проведенных анализов;</li>
190 <li>визуализация проведенных анализов;</li>
191 <li>составление отчетов и проектов по допустимым решениям.</li>
191 <li>составление отчетов и проектов по допустимым решениям.</li>
192 </ul><p>За счет всего этого удается минимизировать затраты на создание продукции, которая максимально точно будет удовлетворять все запросы и потребности клиентов.</p>
192 </ul><p>За счет всего этого удается минимизировать затраты на создание продукции, которая максимально точно будет удовлетворять все запросы и потребности клиентов.</p>
193 <p>Продолжение статьи читайте<a>здесь</a>.</p>
193 <p>Продолжение статьи читайте<a>здесь</a>.</p>
194 <p>Хотите стать профессионалом в сфере обработки данных? Добро пожаловать на курсы в Otus:</p>
194 <p>Хотите стать профессионалом в сфере обработки данных? Добро пожаловать на курсы в Otus:</p>
195 <ul><li><a>Промышленный ML на больших данных</a></li>
195 <ul><li><a>Промышленный ML на больших данных</a></li>
196 <li><a>Data Warehouse Analyst</a></li>
196 <li><a>Data Warehouse Analyst</a></li>
197 <li><a>Data Engineer</a></li>
197 <li><a>Data Engineer</a></li>
198 </ul>
198 </ul>