Татьяна Евгеньевна, добрый день! Мне тоже очень нравится такой формат конференций, поскольку никто не ограничен жесткими рамками регламента на выступление и дискуссию. Спасибо вам, что принимаете активное участие в обсуждении!
Когда я проходил обучение в Яндексе (9 месячный курс по data science), то не раз слышал о том, что в машинном обучении нельзя ограничиваться сугубо инженерами, разработчиками и лингвистами. Хотя сейчас уже можно с легкостью говорить об отдельных специалистах по ML (machine learning), которые работают с самыми разными языковыми моделями. И вы абсолютно правы, когда спрашиваете о наличии экспертизы в той или иной области, поскольку сложно масштабировать универсальные алгоритмы на условную науку. Не случайно коллеги разрабатывают свои модели (https://elibrary.ru/projects/news/SciRus-tiny.asp):
Только дело тут в том, что основные отличия заключаются как раз в исходных базах. То есть алгоритмы схожи, а вот информационная база для обучения - отличается. В этой связи многие сейчас как раз занимаются охотой за датасетами =)
Все это, конечно же, на мой дилетантский взгляд.