Arhlit - информационные технологии

Публикации по теме 'data'


Справочник Essential Data Science Notebook
Единый справочник по EDA, проектированию признаков, подбору модели и т. д. Недавно я завершил процесс внутреннего перевода, чтобы присоединиться к команде Meta Core Data Science. Готовясь к этим интервью с моими коллегами, Барри Чжаном и Николасом Лепором, мы обнаружили, что не было единого ресурса для типичных функций кодирования в науке о данных, таких как построение графиков EDA, очистка данных, преобразование данных, оптимизация гиперпараметра, подбор модели, неконтролируемое..

Связь методов машинного обучения с реальной жизнью.
Объяснять типы моделей машинного обучения настолько просто, насколько это возможно. Машинное обучение В этой статье мы расскажем, как работает машинное обучение и каковы разные типы алгоритмов машинного обучения. для подробного объяснения каждого алгоритма я начну серию статей, которые будут известны « все о ‹algorithm_name› ». Итак, приступим. Чтобы не усложнять, я сначала объясню технические определения, а затем попытаюсь связать эту технику с повседневной жизнью для лучшего..

Что такое федеративное обучение?
С появлением последних новостей о шпионаже данных со стороны технологических гигантов и правительств мы все стали скептически относиться к нашим данным, которые хранятся на наших устройствах. Видите ли, в мире ИИ данные — это топливо. Без данных модели, используемые для прогнозирования, не могут стать более точными. Но опять же, зачем нам делиться своими данными. Есть так много причин, по которым мы не хотели бы делиться своими данными. Это может быть частным для нас. Это может..

Разработка алгоритмов тестирования, часть 2: машинное обучение
Если мы точно не знаем, что мы тестируем, как мы можем тестировать? В моей предыдущей статье по тестированию алгоритмов я обсуждал тестирование и анализ более классических алгоритмов, таких как бинарный поиск. Хотя общее тестирование алгоритмов может быть сложным, большинство классических алгоритмов можно описать как имеющие достаточно четко определенные входы, выходы и их отношения. В этой последующей статье я обсуждаю тестирование и анализ применительно к другому типу алгоритма,..

Поддержка произвольных моделей машинного обучения с помощью MlFlow (на примере PyCaret)
МлФлоу великолепен. Мы постоянно используем его для отслеживания наших моделей машинного обучения и их артефактов. Тренировочные прогоны модели ведения журнала очень просты, и если вам нужна какая-либо пользовательская логика, API также довольно прост в использовании. Одно небольшое предостережение заключается в том, что модель должна уже поддерживаться MlFlow. См. следующий список для всех моделей, которые MlFlow…

Тематическое моделирование и LDA: тематическое исследование Quora
Как специалист по данным, в какой бы области вы ни находились, вы, скорее всего, столкнетесь с проблемой и задачей демистификации огромного количества неразмеченных текстовых данных. Если вы работаете в новостях и СМИ, вас могут попросить классифицировать новостные статьи и выявить закономерности в немаркированных обсуждениях в социальных сетях. Если вы работаете в сфере здравоохранения, вам может быть поручено извлекать ценную информацию из клинических заметок и медицинских журналов...

Визуализация сетей в Python
Практическое руководство по инструментам, которые помогут вам «увидеть» сеть. Каждый код из этой статьи публикуется в этом репозитории . Обновление от 2 февраля 2021 года. Недавно я выпустил Jaal , пакет Python для визуализации сети. Его можно рассматривать как четвертый вариант в списке, обсуждаемом ниже. Попробуйте. Подробнее см. Этот отдельный блог . Спасибо! Вступление Сеть или График - это особое представление сущностей, которые связаны между собой. Он состоит..

Новые материалы

12 сайтов с искусственным интеллектом, которые поразят вас
Приготовьтесь поразить воображение Сегодня существует несколько веб-сайтов, использующих искусственный интеллект (ИИ). От индивидуальных рекомендаций по новостям до более умных поисковых..

Скрытый технический долг в системах машинного обучения [NeurIPS 2015]
Что такое технический долг? Технический долг — это метафора, введенная Уордом Каннингемом в 1992 году, чтобы объяснить долгосрочные затраты, связанные с быстрым продвижением в разработке..

Алгоритм быстрой сортировки в Python
Всем привет, добро пожаловать на programminginpython.com . Здесь я покажу вам, как реализовать алгоритм быстрой сортировки в Python. В предыдущих статьях я рассмотрел Сортировку вставкой ,..

Как использовать манипулирование объектами в JavaScript
Объекты являются важным строительным блоком JavaScript. Они позволяют группировать свойства и методы вместе. Объект представляет собой набор свойств. Свойства идентифицируются с..

Разработка игр с помощью Godot Engine: мощный инструмент с открытым исходным кодом
Разработка игр — творческий и сложный процесс, требующий множества навыков и инструментов. Одним из наиболее важных инструментов является игровой движок, который представляет собой программную..

От XML к аннотациям: переход к современной конфигурации Spring
Введение Фреймворк Spring претерпел значительную эволюцию с момента своего создания. Одним из заметных изменений стал переход от конфигураций на основе XML к конфигурациям, управляемым..

Я люблю Руби!
Я люблю Руби! Мне это нравится по той же причине, по которой мне нравится программировать на Python. Он настолько интуитивно понятен, а встроенные методы упрощают решение проблем. Если вы..