Машинное обучение в лингвистике

Почему машинное обучение похоже на демократию, как краудсорсинг помогает в обработке текстов и как обстоят дела с анализом малых языков

Сохранить в закладки
16 ноября 2017
Сохранить в закладки

Малая выборка — Данные, объем которых невелик по сравнению с Big Data, либо небольшая выборка из общей совокупности, которые плохо подходят для моделей машинного обучения

В 2017 году сотрудник компании «Яндекс» Григорий Бакунов придумал макияж, с помощью которого можно обмануть систему распознавания лиц.

Хеттский язык — Древнейший индоевропейский язык, зафиксированный в письменных памятниках. Был распространен на территории Хеттского царства в Малой Азии. Вымер около X в. до н. э.

null
null
null

Идиш — еврейский язык германской группы

null
null

Древне-ирландский язык — Использовался на территории Ирландии, Шотландии, Уэльса и острова Мэн в VI–X веках.

Амхарский язык — Государственный язык Эфиопии. Распространен в Эритрее, Сомали, и восточных районах Судана.

Лонгриды: Машинное обучение в лингвистике

ImageNet — База данных аннотированных изображений, предназначенная для отработки и тестирования методов распознавания образов и компьютерного зрения