Лекция 10. Введение в обработку естественного языка. Кластеризация: распространённые методы. Brown clustering

in dtube •  5 years ago 


Лекция №10 курса «Введение в обработку естественного языка» (осень 2019).
Преподаватель — Антон Михайлович Алексеев
Страница лекции на сайте CSC: https://bit.ly/2ke7nrT

21:13 На самом деле формула purity на слайде верна. Для каждого предсказанного кластера вычисляется мощность наибольшего пересечения с кластером из "истинных". Затем эти величины не усредняются, а делятся на N — то есть число кластеризуемых объектов.

1:23:59 Речь о тексте Себастиана по мотивам EMNLP-2017. Вот он: http://ruder.io/highlights-of-emnlp-2...


▶️ DTube
▶️ YouTube
Authors get paid when people like you upvote their post.
If you enjoyed what you read here, create your account today and start earning FREE STEEM!