Публикации по тегам statistics

Публикации по теме 'statistics'

ML23: обработка пропущенных значений

Подходы, помимо вменения среднего, медианы или моды Общие способы работы с пропущенными значениями включают отбрасывание, а также вменение среднего, медианы или моды. Кроме того, существуют расширенные подходы, такие как Random Forest и BayesianRidge . Тогда как обеспечить наилучшую практику обработки пропущенных значений, избегая недообучения и переобучения? Обзор (1) Предпосылки (2) Два вида отсутствующих значений (3) Методы обработки отсутствующих значений (4)..

Иногда вам нужно гораздо больше данных, чем вы думаете

В этой статье рассказывается о работе Нассима Талеба. Работа Талеба сосредоточена на распределениях с толстыми хвостами и на том, что на самом деле все не так нормально распределено, как предполагалось или приближалось к нему, и каковы последствия этого. В этой статье основное внимание уделяется некоторым из основ его размышлений о распределениях с толстыми хвостами, тому, как Центральная предельная теорема и Закон больших чисел не всегда работают в реальных сценариях, как мысли, и как на..

Модуль 16 — Биномиальное распределение

Биномиальное распределение — мощная статистическая концепция, которая расширяет один эксперимент до нескольких испытаний. Это руководство расскажет вам о тонкостях биномиального распределения, его связи с распределением Бернулли и о том, как оно используется в реальных сценариях. С четкими примерами кода мы погрузимся в суть этого дистрибутива. Шаг 1 — Понимание основ Биномиальное распределение вступает в игру, когда мы расширяем один эксперимент до серии испытаний. Если мы..

Как я могу выполнить анализ основных компонентов в R?

Часть Мой дневник кодирования с R В предыдущей статье я показал, как сгенерировал треугольную сеть на многоугольнике. Как создать треугольную сеть с помощью R? Часть моего дневника кодирования с помощью R medium.com Получившаяся сеть показана ниже. Красными точками я нанес позиции наблюдательных пунктов. Данные о солнечном излучении, собранные на этих участках, — это то, что я хочу интерполировать. Зачем мне EOF данных?..

Контролируемое машинное обучение для анализа текста в R

В современном мире, управляемом данными, крайне важно извлекать значимую информацию из огромных объемов текстовых данных. В вашем распоряжении есть один мощный инструмент — контролируемое машинное обучение для анализа текста в R. Эта статья проведет вас через основные этапы освоения этой технологии и эффективного ее использования в ваших проектах. Давайте погрузимся! Контролируемое машинное обучение для анализа текста в R Контролируемое машинное обучение для анализа текста в R — это..

Обзор статистических тестов: методы анализа данных и проверки гипотез

Статистические тесты используются для анализа и интерпретации данных, помогая исследователям делать выводы и выводы о популяциях на основе выборочных данных. Доступны различные статистические тесты, каждый из которых предназначен для решения конкретных исследовательских вопросов и типов данных. Вот некоторые общие статистические тесты, классифицированные в зависимости от их применения: 1. Параметрические тесты: Т-тест: используется для сравнения средних значений двух групп...

Объясните меры дисперсии?

Дисперсия — это не что иное, как рассеянный или спред. Меры дисперсии, используемые для интерпретации видимости данных, то есть для определения того, насколько данные однородны и неоднородны. Он показывает, как данные сжимаются или разбрасываются. Меры дисперсии предоставляют информацию о том, как значения в наборе данных распределяются вокруг центральной тенденции (например, среднего или медианы). Меры дисперсии помогают нам понять, в какой степени точки данных отклоняются от..

Новые материалы

12 сайтов с искусственным интеллектом, которые поразят вас

Приготовьтесь поразить воображение Сегодня существует несколько веб-сайтов, использующих искусственный интеллект (ИИ). От индивидуальных рекомендаций по новостям до более умных поисковых..

Скрытый технический долг в системах машинного обучения [NeurIPS 2015]

Что такое технический долг? Технический долг — это метафора, введенная Уордом Каннингемом в 1992 году, чтобы объяснить долгосрочные затраты, связанные с быстрым продвижением в разработке..

Алгоритм быстрой сортировки в Python

Всем привет, добро пожаловать на programminginpython.com . Здесь я покажу вам, как реализовать алгоритм быстрой сортировки в Python. В предыдущих статьях я рассмотрел Сортировку вставкой ,..

Как использовать манипулирование объектами в JavaScript

Объекты являются важным строительным блоком JavaScript. Они позволяют группировать свойства и методы вместе. Объект представляет собой набор свойств. Свойства идентифицируются с..

Разработка игр с помощью Godot Engine: мощный инструмент с открытым исходным кодом

Разработка игр — творческий и сложный процесс, требующий множества навыков и инструментов. Одним из наиболее важных инструментов является игровой движок, который представляет собой программную..

От XML к аннотациям: переход к современной конфигурации Spring

Введение Фреймворк Spring претерпел значительную эволюцию с момента своего создания. Одним из заметных изменений стал переход от конфигураций на основе XML к конфигурациям, управляемым..

Я люблю Руби!

Я люблю Руби! Мне это нравится по той же причине, по которой мне нравится программировать на Python. Он настолько интуитивно понятен, а встроенные методы упрощают решение проблем. Если вы..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Coding Web Development Deep Learning AI React Nodejs Software Engineering Front End Development Java Computer Science Typescript Development Algorithms Data Programming Languages Reactjs Startup NLP React Native Tech ChatGPT HTML Learning Developer Javascript Tips Computer Vision Statistics Data Visualization Open Source CSS Angular Business