Мартин Боянов е работил по проблеми като sentiment analysis и influencer identification в Komfo, document clustering и business event classification в Commetric и recommendation systems в Smule. Той се опитва да намери най-практичните употреби на съвременните алгоритми за машинно самообучение и анализ на данни. Специалността му е да участва в целия процес по разработката на ML решения – от прототип до production, че и след това. С него ще ви срещнем на събитието Implicit Data: Video Game Recommendations. Преди това му зададохме няколко въпроса. Прочетете как ни отговори той.

Ти беше лектор в групата малко повече от година, какво се е промени в ML света през това време?

Миналият път говорих за различните начини за моделиране на естествения език, така че да го предствавим в разбираем за машината вид. Малко по-късно излезе BERT (Bidirectional Encoder Representations from Transformers), който предизвика много вълнение в NLP света. Някои смятат, че това е ImageNet момента за NLP сцената – трансферирането на знанието на един модел в друг модел ще позволи бързата разработка на иновативни модели с малко данни.
Също така, виждаме машинното самообучение да бъде предизвиквано с все по-сложни задачи – от картинки минаваме към видео, звук, 3D модели, self-driving коли и други. Увеличават се и броя домейни, в които се прилага – в медицината, back office, човешки ресурси, икономика и много други.
Наблюдаваме и еволюция в инфраструктурата. В последната година излязоха Tensorflow 2.0 и Pytorch 1.0, които освен предоставянето на нови и по-стабилни модели, улесняват и деплойването на моделите в production среда, дори и edge compute(на мобилно устройство).
Живеем в интересни времена!

Ще замести ли машината човека? Какво е твоето мнение по този така обсъждан от всички въпрос?

В кратък план, смятам че ще се появяват все повече и повече системи, в които наблюдаваме симбиоза между човек и машина. Според мен работа ще има, че даже и недостиг. Професиите ще се променят и според мен преквалифицирането ще е голямо предизвикателство за пазара на труда.
Трябва да се мисли и за етичната страна на проблема. В такива симбиозни системи, човекът трябва да възприема инструкциите на машината като препоръки. Когато отказваш на някого кредит или работа, не е ОК да се оправдаеш с „Машината така ми каза“ – трябва да правиш лични, съзнателни решения, от които може да зависят човешки съдби. В тази връзка, ще трябва да се разработят повече инструменти, които да обясняват на потребителя препоръките, дадени от системата.

Какво е мнението ти за използването на ML в България – разкрива ли се пълния му потенциал?

Екосистемата в България се развива – виждаме магистърски и докторантски програми по университетите, гъмжи от стартъпи и не-толкова-стартъпи, появяват се всякакви академии и курсове, организират се meetup-и и хакатони. Ускорение има. За нас остава да го подържаме.
Какви промени и новости да очакваме с ML в следващите 3 години?

Струва ми се, че на този етап най-горещо развитие има в NLP сферата – ще виждаме всякакви вариации и приложения на Transformer архитектурата. Предстои да видим какви са границите на възможностите й – например, вече е доказано, че BERT не разбира отрицание.
Reproducibility, open source и interpretability аспектите ще стават все по-важни.
За съжаление, очаквам да видим и още malicious употреби на новите технологии – deepfakes, fake news, fake reviews.


Регистрирай се за събитието


Стани част от потребителска група на на Machine Learning. Абонирай се и ще ти изпращаме информация за всичко, което предстои в групата.

Визия: Личен архив

Прочети още:
Васил Люнчев: Machine Learning има изключително широко приложение
Разговор за Machine Learning с Борис Даскалов

Share This