Arhlit - информационные технологии

Публикации по теме 'nlp'


Данные для обучения машинному обучению или защищены авторским правом и являются частными?
В котором мы спрашиваем — что лучше, защита авторских прав на опубликованные работы или обучение мегамоделей, более способных справиться с любой поставленной задачей? Быстрые успехи в обработке естественного языка (NLP) открыли новые возможности для использования опубликованной информации для расширения возможностей систем ИИ. Утверждается, что обучение моделей НЛП на различных источниках информации, включая твиты, книги и сценарии фильмов, может значительно обогатить их понимание и..

Анализ настроений, часть 3
Машинное обучение с помощью Spark в облаке Google 1. Введение 2. Создание кластера GCP Hadoop 3. Получение данных из кластера Atlas 4. Базовые модели с конвейерами Spark ML 5. Использование пользовательских трансформеров 6. N-граммы и настройка параметров с помощью поиска по сетке 7. Выводы Первоначально опубликовано в 2019 году. Введение В первой части этой серии блогов из трех частей я рассмотрел основы ETL с PySpark, а во второй..

Процесс разработки продукта для интеллектуального генератора маркетинговых текстов : мультимодальное обобщение текста…
Авторы: Цзинсюань Ли , Ту Сюэ , Вэньсюань Тан , Вивиан Чан, Фенни Цзинь , Гуаньюань Шуай Наш клиент, компания XYZ, занимается розничной торговлей одеждой, специализирующейся на онлайн-каналах. Компания является одним из таких международных брендов быстрой моды, который предлагает лучшую модную одежду, включая женскую одежду, мужскую одежду, детскую одежду и одежду, модные аксессуары и другие модные товары и аксессуары. XYZ служит посредником, связывающим большое количество..

Перевод "Бессмысленные намерения" - Часть I
Генеративные состязательные сети при отображении намерений Бьюсь об заклад, вы слышали историю в двух разных СМИ и задавались вопросом, говорят ли они об одном и том же. На Lang.ai такое случается очень часто. Дело не в том, что мы кормим контент для обслуживания всего спектра СМИ. Напротив, мы анализируем данные с многонациональным охватом, написанные на многих языках, со всеми их культурными особенностями, способами выражения и личными условиями. Если вам посчастливилось..

Обработка естественного языка (NLP): практическое введение
Мы генерируем данные больше, чем когда-либо. Очень хороший процент этого текста. Твиты, комментарии, обзоры, поисковые запросы, запросы - все в тексте, потому что так мы общаемся, это наш язык. Компьютеры просто знают 0 и 1, давай научим этому больше Предварительные требования: Основы Python Концепции НЛП, такие как токенизация, стоп-слова, стемминг и векторизация Основы Word2Vec Примечание. В этой истории не рассматривается теория НЛП, а показано, как начать работу с..

DALL-E2 выпущен для модели свободной стабильной диффузии
Одним из своеобразных и освобождающих аспектов машинного обучения является его масштабируемость и доступность для широкой публики. Марк Тененхольц сегодня написал в Твиттере такое замечательное наблюдение, как частная компания недавно выпустила DALL-E за платным доступом для коммерческого использования. Несколько дней назад некоторые независимые исследователи выпустили открытую и бесплатную версию той же модели. Через несколько дней его веса доступны на Reddit. Скорость, с которой..

Извлеченные уроки точной настройки BERT для распознавания именованных объектов
Что можно и чего нельзя делать для тонкой настройки многогранных задач НЛП В Части 1 этой серии из двух частей я представил задачу тонкой настройки BERT для распознавания именованных сущностей, обрисовал в общих чертах необходимые предварительные условия и предварительные знания, а также дал пошаговое описание процесса тонкой настройки. Здесь я расскажу об интересных практических задачах, которые возникли при создании проекта, а также о том, что я планирую делать по-другому в следующий..

Новые материалы

12 сайтов с искусственным интеллектом, которые поразят вас
Приготовьтесь поразить воображение Сегодня существует несколько веб-сайтов, использующих искусственный интеллект (ИИ). От индивидуальных рекомендаций по новостям до более умных поисковых..

Скрытый технический долг в системах машинного обучения [NeurIPS 2015]
Что такое технический долг? Технический долг — это метафора, введенная Уордом Каннингемом в 1992 году, чтобы объяснить долгосрочные затраты, связанные с быстрым продвижением в разработке..

Алгоритм быстрой сортировки в Python
Всем привет, добро пожаловать на programminginpython.com . Здесь я покажу вам, как реализовать алгоритм быстрой сортировки в Python. В предыдущих статьях я рассмотрел Сортировку вставкой ,..

Как использовать манипулирование объектами в JavaScript
Объекты являются важным строительным блоком JavaScript. Они позволяют группировать свойства и методы вместе. Объект представляет собой набор свойств. Свойства идентифицируются с..

Разработка игр с помощью Godot Engine: мощный инструмент с открытым исходным кодом
Разработка игр — творческий и сложный процесс, требующий множества навыков и инструментов. Одним из наиболее важных инструментов является игровой движок, который представляет собой программную..

От XML к аннотациям: переход к современной конфигурации Spring
Введение Фреймворк Spring претерпел значительную эволюцию с момента своего создания. Одним из заметных изменений стал переход от конфигураций на основе XML к конфигурациям, управляемым..

Я люблю Руби!
Я люблю Руби! Мне это нравится по той же причине, по которой мне нравится программировать на Python. Он настолько интуитивно понятен, а встроенные методы упрощают решение проблем. Если вы..