Публикации по теме 'nlp'
Данные для обучения машинному обучению или защищены авторским правом и являются частными?
В котором мы спрашиваем — что лучше, защита авторских прав на опубликованные работы или обучение мегамоделей, более способных справиться с любой поставленной задачей?
Быстрые успехи в обработке естественного языка (NLP) открыли новые возможности для использования опубликованной информации для расширения возможностей систем ИИ. Утверждается, что обучение моделей НЛП на различных источниках информации, включая твиты, книги и сценарии фильмов, может значительно обогатить их понимание и..
Анализ настроений, часть 3
Машинное обучение с помощью Spark в облаке Google
1. Введение
2. Создание кластера GCP Hadoop
3. Получение данных из кластера Atlas
4. Базовые модели с конвейерами Spark ML
5. Использование пользовательских трансформеров
6. N-граммы и настройка параметров с помощью поиска по сетке
7. Выводы
Первоначально опубликовано в 2019 году.
Введение
В первой части этой серии блогов из трех частей я рассмотрел основы ETL с PySpark, а во второй..
Процесс разработки продукта для интеллектуального генератора маркетинговых текстов : мультимодальное обобщение текста…
Авторы: Цзинсюань Ли , Ту Сюэ , Вэньсюань Тан , Вивиан Чан, Фенни Цзинь , Гуаньюань Шуай
Наш клиент, компания XYZ, занимается розничной торговлей одеждой, специализирующейся на онлайн-каналах. Компания является одним из таких международных брендов быстрой моды, который предлагает лучшую модную одежду, включая женскую одежду, мужскую одежду, детскую одежду и одежду, модные аксессуары и другие модные товары и аксессуары. XYZ служит посредником, связывающим большое количество..
Перевод "Бессмысленные намерения" - Часть I
Генеративные состязательные сети при отображении намерений
Бьюсь об заклад, вы слышали историю в двух разных СМИ и задавались вопросом, говорят ли они об одном и том же. На Lang.ai такое случается очень часто.
Дело не в том, что мы кормим контент для обслуживания всего спектра СМИ. Напротив, мы анализируем данные с многонациональным охватом, написанные на многих языках, со всеми их культурными особенностями, способами выражения и личными условиями.
Если вам посчастливилось..
Обработка естественного языка (NLP): практическое введение
Мы генерируем данные больше, чем когда-либо. Очень хороший процент этого текста. Твиты, комментарии, обзоры, поисковые запросы, запросы - все в тексте, потому что так мы общаемся, это наш язык.
Компьютеры просто знают 0 и 1, давай научим этому больше
Предварительные требования:
Основы Python Концепции НЛП, такие как токенизация, стоп-слова, стемминг и векторизация Основы Word2Vec
Примечание. В этой истории не рассматривается теория НЛП, а показано, как начать работу с..
DALL-E2 выпущен для модели свободной стабильной диффузии
Одним из своеобразных и освобождающих аспектов машинного обучения является его масштабируемость и доступность для широкой публики. Марк Тененхольц сегодня написал в Твиттере такое замечательное наблюдение, как частная компания недавно выпустила DALL-E за платным доступом для коммерческого использования.
Несколько дней назад некоторые независимые исследователи выпустили открытую и бесплатную версию той же модели. Через несколько дней его веса доступны на Reddit. Скорость, с которой..
Извлеченные уроки точной настройки BERT для распознавания именованных объектов
Что можно и чего нельзя делать для тонкой настройки многогранных задач НЛП
В Части 1 этой серии из двух частей я представил задачу тонкой настройки BERT для распознавания именованных сущностей, обрисовал в общих чертах необходимые предварительные условия и предварительные знания, а также дал пошаговое описание процесса тонкой настройки.
Здесь я расскажу об интересных практических задачах, которые возникли при создании проекта, а также о том, что я планирую делать по-другому в следующий..
Новые материалы
12 сайтов с искусственным интеллектом, которые поразят вас
Приготовьтесь поразить воображение
Сегодня существует несколько веб-сайтов, использующих искусственный интеллект (ИИ). От индивидуальных рекомендаций по новостям до более умных поисковых..
Скрытый технический долг в системах машинного обучения [NeurIPS 2015]
Что такое технический долг?
Технический долг — это метафора, введенная Уордом Каннингемом в 1992 году, чтобы объяснить долгосрочные затраты, связанные с быстрым продвижением в разработке..
Алгоритм быстрой сортировки в Python
Всем привет, добро пожаловать на programminginpython.com . Здесь я покажу вам, как реализовать алгоритм быстрой сортировки в Python. В предыдущих статьях я рассмотрел Сортировку вставкой ,..
Как использовать манипулирование объектами в JavaScript
Объекты являются важным строительным блоком JavaScript. Они позволяют группировать свойства и методы вместе.
Объект представляет собой набор свойств. Свойства идентифицируются с..
Разработка игр с помощью Godot Engine: мощный инструмент с открытым исходным кодом
Разработка игр — творческий и сложный процесс, требующий множества навыков и инструментов. Одним из наиболее важных инструментов является игровой движок, который представляет собой программную..
От XML к аннотациям: переход к современной конфигурации Spring
Введение
Фреймворк Spring претерпел значительную эволюцию с момента своего создания. Одним из заметных изменений стал переход от конфигураций на основе XML к конфигурациям, управляемым..
Я люблю Руби!
Я люблю Руби! Мне это нравится по той же причине, по которой мне нравится программировать на Python. Он настолько интуитивно понятен, а встроенные методы упрощают решение проблем. Если вы..