Дом Личные финансы Основы K-Means и DBSCAN Модели кластеризации для предсказательной аналитики - манекены

Основы K-Means и DBSCAN Модели кластеризации для предсказательной аналитики - манекены

Видео: Лекция 3. Кластеризация 2025

Видео: Лекция 3. Кластеризация 2025
Anonim

У неконтролируемого обучения есть много проблем для интеллектуальной аналитики, в том числе не зная, чего ожидать при запуске алгоритма. Каждый алгоритм будет давать разные результаты; вы никогда не будете уверены, что один результат лучше, чем другой, или даже результат любого значения.

Когда вы знаете, какими должны быть результаты, вы можете настроить алгоритмы для получения желаемых результатов. В реальных наборах данных у вас не будет этой роскоши. Вы должны будете зависеть от некоторых предварительных знаний о данных - или интуиции - для определения параметров и алгоритмов инициализации, которые будут использоваться при создании вашей модели.

Однако в реальных неконтролируемых учебных задачах эти предварительные знания недоступны, и желаемый результат трудно найти. Выбор правильного количества кластеров является ключевой проблемой. Если вы случайно наткнулись на правильное количество кластеров, ваши данные дадут проницательность, которые вы можете сделать очень точными предсказаниями. С другой стороны, угадывание неправильного количества кластеров может привести к результатам подпара.

Алгоритм K-средних - хороший выбор для наборов данных, которые имеют небольшое количество кластеров с пропорциональными размерами и линейно разделяемыми данными, - и вы можете масштабировать его, чтобы использовать алгоритм на очень больших наборах данных.

Представьте линейно разделяемые данные как кучу точек в графе, которые можно разделить по прямой. Если данные не являются линейно разделяемыми, то должны использоваться более продвинутые версии K-средств, которые станут более дорогостоящими в вычислительной области и могут не подходить для очень больших наборов данных. В стандартной реализации сложность вычисления центров кластеров и расстояний низкая.

K-средства широко используются для решения проблем с большими данными, поскольку они просты в использовании, эффективны и масштабируемы. Неудивительно, что большинство коммерческих поставщиков используют алгоритм K-mean как ключевой компонент своих пакетов прогнозирующей аналитики.

Реализация DBSCAN (на основе плотности пространственной кластеризации приложений с помехами) в scikit-learn не требует каких-либо определяемых пользователем параметров инициализации для создания экземпляра. Если вы хотите, вы можете переопределить параметры по умолчанию во время инициализации. К сожалению, если вы используете параметры по умолчанию, алгоритм не может обеспечить близкое соответствие желаемому результату.

DBSCAN лучше подходит для наборов данных с диспропорциональными размерами кластеров и данные которых могут быть разделены нелинейным образом.Подобно K-средству, DBSCAN является масштабируемым, но использование его на очень больших наборах данных требует большего объема памяти и вычислительной мощности.

Основы K-Means и DBSCAN Модели кластеризации для предсказательной аналитики - манекены

Выбор редактора

Adobe Acrobat 6 PDF для чайников Шпаргалка - манекены

Adobe Acrobat 6 PDF для чайников Шпаргалка - манекены

Познакомиться с Adobe Acrobat 6 до облегчите ваши усилия с помощью файлов PDF (Portable Document Format). Откройте сочетания клавиш для инструментов Acrobat; ознакомьтесь с командами меню меню для открытия, закрытия и сохранения файлов PDF; и когда вы будете готовы, распечатайте файлы PDF.

Аудио для мобильных веб-манекенов

Аудио для мобильных веб-манекенов

Получение звука, выходящего из iPhone или iPad, похоже на без проблем, не так ли? В конце концов, они были предназначены для воспроизведения звуков и даже синхронизации с аудио-библиотеками пользователей iTunes. Если вы еще не добавили аудиоконтент в микс на своем веб-сайте, взгляните на некоторые из возможных новаторских применений для аудио, которые ...

Adobe CS5 Design Premium All-in-One для чайников Чит-лист - манекены

Adobe CS5 Design Premium All-in-One для чайников Чит-лист - манекены

, Когда вы думаете об управлении визуальными средами, Adobe CS5 Design Premium автоматически приходит на ум. Меню в приложениях Adobe CS5 предлагает множество опций и инструментов, которые помогут вам отредактировать и установить изображения и активную графику. И вы всегда можете использовать ярлыки, чтобы работать быстрее.

Выбор редактора

Фильтр Pen и Ink в Photoshop Elements - манекены

Фильтр Pen и Ink в Photoshop Elements - манекены

Фильтр Pen and Ink в Photoshop Elements создает эффект, который выглядит как рисованный эскиз ручек и чернил. В диалоговом окне «Фильтр пера и чернил» выберите один из четырех предустановок. Каждая предустановка окрашивает изображение синим, фиолетовым, серым или зеленым цветом соответственно. Кредит: © istockphoto. com / iconogenic Затем вы можете настроить настройку ползунков по умолчанию для ...

Инструмент «Исцеляющая кисть» в Photoshop Elements 13 - манекены

Инструмент «Исцеляющая кисть» в Photoshop Elements 13 - манекены

Инструмент «Исцеляющая кисть» в Elements похож на Штамп инструмент. Оба инструмента позволяют клонировать пиксели из одной области и применять их к другой области. Но вот в чем сходство заканчивается, и Исцеляющая Кисть оставляет инструмент Клона Штампа в пыли. Проблема с инструментом Clone Stamp заключается в том, что ...

Настройки Camera Raw Window в Photoshop Elements 11 - манекены

Настройки Camera Raw Window в Photoshop Elements 11 - манекены

Окно Camera Raw в Photoshop Elements 11 имеет большое количество настроек, как описано в следующем списке. Ознакомьтесь с этими настройками, чтобы максимально использовать ваши изображения. Инструменты: в окне появляются девять инструментов: Масштаб: этот инструмент масштабирует и выводит изображение из предварительного просмотра. Рука: эта опция перемещается ...

Выбор редактора

Отображение внешних веб-сайтов в Wrapper на вашем сайте Joomla - манекены

Отображение внешних веб-сайтов в Wrapper на вашем сайте Joomla - манекены

Модуль Wrapper позволяет отображать внешние сайты в обертках (квадратные рамки) на вашем сайте Joomla. Вот отличное объяснение реальной жизни от разработчика Joomla о том, как модуль Wrapper можно ввести в эксплуатацию: «Мой клиент - это локальная библиотека. Как и большинство библиотек, их поиск в каталоге каталогов обеспечивается ...

Работа с наследованием к коду с JavaScript-манекенами

Работа с наследованием к коду с JavaScript-манекенами

При создании объектов с JavaScript, не ограничиваясь только созданием конкретных объектов, таких как гитара, ваш автомобиль, ваша кошка или ваш сэндвич. Реальная красота объектов заключается в том, что вы можете использовать их для создания типов объектов, из которых могут быть созданы другие объекты. Здесь новый объект ...

Добавить и настроить поисковый модуль на вашем сайте Joomla - манекены

Добавить и настроить поисковый модуль на вашем сайте Joomla - манекены

Один из большие достопримечательности Joomla - это модуль поиска, который позволяет пользователям выполнять поиск всех ваших статей. Это часто очень сложно реализовать на сайте, который вы создаете из HTML, но в Joomla, где хранятся статьи в базе данных MySQL, поиск является быстрым. При работе с ...