Видео: Защита кандидатской диссертации 2025
Естественным примером самоорганизующейся группы, которую вы можете применить в прогностическом анализе, является колония муравьев, охотящихся за едой. Муравьи коллективно оптимизируют свой трек, так что он всегда берет кратчайший путь к продовольственной цели.
Даже если вы попытаетесь потревожить марширующую колонию муравьев и не дать им добраться до продовольственной цели, они быстро вернутся в путь и (опять же) находят самый короткий путь к продовольственной цели, все они избегают тех же препятствий глядя на еду. Эта однородность поведения возможна, потому что каждый муравей откладывает след феромонов на земле.
Подумайте, как армия муравьев простаивает в своем гнезде. Когда они начинают искать пищу, у них нет абсолютно никакой информации о том, где ее найти. Они маршируют случайным образом, пока отдельный муравей не найдет пищу; теперь удачливый муравей (назовем его Ant X) должен сообщить свою находку остальным муравьям - и для этого он должен найти свой путь обратно в гнездо.
К счастью, Ant X выпускал свои феромоны все время, когда искал пищу; он может следовать за своим тропом феромонов обратно в гнездо. На обратном пути к гнезду, следуя собственным тропам феромонов, Ant X ставит больше феромонов на один и тот же след.
В результате запах на тропе Ант Х будет самым сильным среди всех троп других муравьев. Самый сильный след феромонов привлечет всех других муравьев, которые все еще ищут пищу. Они будут следить за самым сильным ароматом. По мере того как больше муравьев присоединяется к тропе Ant X, они добавляют к ней больше феромонов; запах усиливается. Довольно скоро все остальные муравьи имеют сильный запах.
Если несколько муравьев обнаружили тот же источник пищи, муравьи, которые взяли кратчайший путь, сделают больше поездок по сравнению с муравьями, которые следуют за более длинными путями, - поэтому большее количество феромонов будет произведено на кратчайшем пути. Соотношение между индивидуальным и коллективным поведением является естественным примером.
Каждая точка представляет собой документ. Предположим, что черные точки - это документы о прогнозной аналитике, а белые точки - это документы об антропологии. Точки, представляющие различные типы документов, распределяются случайным образом в сетке из пяти ячеек.
«Муравьи» беспорядочно развертываются в сетке для поиска похожих документов. Каждая ячейка со значением в ней представляет собой экземпляр «феромона». «Используя матрицу документов, значение« феромона »каждой ячейки рассчитывается из соответствующего документа.
Хорошо, как коллективный разум муравьиной колонии создает модель для эффективной кластеризации данных? Ответ заключается в простой аналогии: муравьи ищут пищу в своей среде, так же, как мы ищем кластеры в наборе данных - ищем похожие документы в большом наборе документов.
Рассмотрим набор данных документов, которые вы хотите организовать по темам. Аналогичные документы будут сгруппированы в одном кластере. Вот где колония муравьев может дать подсказки о том, как группировать подобные документы.
Представьте себе двумерную (2D) сетку, где вы можете представлять документы в виде точек. 2D-сетка делится на ячейки. Каждая ячейка имеет связанный с ней «феромон» (значение). Вкратце, значение «феромона» различает каждый документ в данной ячейке.
Точки сначала распределяются случайным образом - и каждая точка в сетке представляет собой уникальный документ. Следующим шагом будет случайное развертывание других точек в 2D-сетке, имитирующая поиск муравьиной колонии пищи в окружающей среде. Эти точки сначала рассеиваются в одной и той же 2D-сетке с документами.
Каждая новая точка, добавленная в сетку, представляет муравья. Те «муравьи», которые часто упоминаются в алгоритме муравьиной колонии как агенты , перемещаются в 2D-сетке. Каждый «муравей» будет либо собирать, либо убирать другие точки (документы), в зависимости от того, где лучше всего подходят документы. В этой аналогии «еда» имеет форму документов, достаточно похожих, чтобы их можно было сгруппировать.
«муравей» случайно перемещается по сетке; если он сталкивается с документом, он может выполнить одно из двух действий: выбрать или удалить. Каждая ячейка имеет «интенсивность феромонов», которая указывает, насколько похож документ на другие документы (точки), находящиеся рядом с документом, о котором идет речь, - тот, который «муравей» собирается либо забрать, либо упасть.
Обратите внимание, что «муравей» в ячейке 3 будет забирать черно-пунктирный документ, потому что преобладает белое значение «феромона»; и переместитесь в ячейку, где значение близко (похоже) к тому, что находится в Cell 4 (несколько черных точек). Поиск продолжается до тех пор, пока не сформируются кластеры.
По сути, «муравей» перемещает документы из одной ячейки в другую для формирования кластеров, выполняя либо одно из двух действий: сбор документа или удаление документа.
Когда «муравьи» начали беспорядочно перемещаться по сетке, столкновение с точкой (документом) приводит к тому, что «муравей» собирает документ из своей текущей ячейки, перемещаясь с ним и отбрасывая его в ячейку, в которой он достаточное сходство с положением.
Как бы «муравей» определял лучшую ячейку, в которой нужно было удалить документ? Ответ заключается в том, что значения в ячейках действуют как «феромоны» - и каждая ячейка в 2D-сетке содержит числовое значение, которое может быть рассчитано таким образом, который представляет документ в ячейке.
Помните, что каждый документ представлен как набор чисел или вектор числовых значений. «Интенсивность феромона» (числовое значение) увеличивается, когда в ячейку выпадает больше документов, и это значение уменьшается, если числа, представляющие документы, перемещаются из ячейки.
