Arhlit - информационные технологии

Публикации по теме 'statistics'


ML23: обработка пропущенных значений
Подходы, помимо вменения среднего, медианы или моды Общие способы работы с пропущенными значениями включают отбрасывание, а также вменение среднего, медианы или моды. Кроме того, существуют расширенные подходы, такие как Random Forest и BayesianRidge . Тогда как обеспечить наилучшую практику обработки пропущенных значений, избегая недообучения и переобучения? Обзор (1) Предпосылки (2) Два вида отсутствующих значений (3) Методы обработки отсутствующих значений (4)..

Иногда вам нужно гораздо больше данных, чем вы думаете
В этой статье рассказывается о работе Нассима Талеба. Работа Талеба сосредоточена на распределениях с толстыми хвостами и на том, что на самом деле все не так нормально распределено, как предполагалось или приближалось к нему, и каковы последствия этого. В этой статье основное внимание уделяется некоторым из основ его размышлений о распределениях с толстыми хвостами, тому, как Центральная предельная теорема и Закон больших чисел не всегда работают в реальных сценариях, как мысли, и как на..

Модуль 16 —  Биномиальное распределение
Биномиальное распределение — мощная статистическая концепция, которая расширяет один эксперимент до нескольких испытаний. Это руководство расскажет вам о тонкостях биномиального распределения, его связи с распределением Бернулли и о том, как оно используется в реальных сценариях. С четкими примерами кода мы погрузимся в суть этого дистрибутива. Шаг 1  — Понимание основ Биномиальное распределение вступает в игру, когда мы расширяем один эксперимент до серии испытаний. Если мы..

Как я могу выполнить анализ основных компонентов в R?
Часть Мой дневник кодирования с R В предыдущей статье я показал, как сгенерировал треугольную сеть на многоугольнике. Как создать треугольную сеть с помощью R? Часть моего дневника кодирования с помощью R medium.com Получившаяся сеть показана ниже. Красными точками я нанес позиции наблюдательных пунктов. Данные о солнечном излучении, собранные на этих участках, — это то, что я хочу интерполировать. Зачем мне EOF данных?..

Контролируемое машинное обучение для анализа текста в R
В современном мире, управляемом данными, крайне важно извлекать значимую информацию из огромных объемов текстовых данных. В вашем распоряжении есть один мощный инструмент — контролируемое машинное обучение для анализа текста в R. Эта статья проведет вас через основные этапы освоения этой технологии и эффективного ее использования в ваших проектах. Давайте погрузимся! Контролируемое машинное обучение для анализа текста в R Контролируемое машинное обучение для анализа текста в R — это..

Обзор статистических тестов: методы анализа данных и проверки гипотез
Статистические тесты используются для анализа и интерпретации данных, помогая исследователям делать выводы и выводы о популяциях на основе выборочных данных. Доступны различные статистические тесты, каждый из которых предназначен для решения конкретных исследовательских вопросов и типов данных. Вот некоторые общие статистические тесты, классифицированные в зависимости от их применения: 1. Параметрические тесты: Т-тест: используется для сравнения средних значений двух групп...

Объясните меры дисперсии?
Дисперсия — это не что иное, как рассеянный или спред. Меры дисперсии, используемые для интерпретации видимости данных, то есть для определения того, насколько данные однородны и неоднородны. Он показывает, как данные сжимаются или разбрасываются. Меры дисперсии предоставляют информацию о том, как значения в наборе данных распределяются вокруг центральной тенденции (например, среднего или медианы). Меры дисперсии помогают нам понять, в какой степени точки данных отклоняются от..

Новые материалы

12 сайтов с искусственным интеллектом, которые поразят вас
Приготовьтесь поразить воображение Сегодня существует несколько веб-сайтов, использующих искусственный интеллект (ИИ). От индивидуальных рекомендаций по новостям до более умных поисковых..

Скрытый технический долг в системах машинного обучения [NeurIPS 2015]
Что такое технический долг? Технический долг — это метафора, введенная Уордом Каннингемом в 1992 году, чтобы объяснить долгосрочные затраты, связанные с быстрым продвижением в разработке..

Алгоритм быстрой сортировки в Python
Всем привет, добро пожаловать на programminginpython.com . Здесь я покажу вам, как реализовать алгоритм быстрой сортировки в Python. В предыдущих статьях я рассмотрел Сортировку вставкой ,..

Как использовать манипулирование объектами в JavaScript
Объекты являются важным строительным блоком JavaScript. Они позволяют группировать свойства и методы вместе. Объект представляет собой набор свойств. Свойства идентифицируются с..

Разработка игр с помощью Godot Engine: мощный инструмент с открытым исходным кодом
Разработка игр — творческий и сложный процесс, требующий множества навыков и инструментов. Одним из наиболее важных инструментов является игровой движок, который представляет собой программную..

От XML к аннотациям: переход к современной конфигурации Spring
Введение Фреймворк Spring претерпел значительную эволюцию с момента своего создания. Одним из заметных изменений стал переход от конфигураций на основе XML к конфигурациям, управляемым..

Я люблю Руби!
Я люблю Руби! Мне это нравится по той же причине, по которой мне нравится программировать на Python. Он настолько интуитивно понятен, а встроенные методы упрощают решение проблем. Если вы..