Анализа и работата със свободен текст е все по-важна за компаниите в наши дни. Какво е моделиране на текст и как се прави ще разкаже на събитието Advances in Language Modeling: Text Generation for Fun and ___ Мартин Боянов. Мартин е Data Scientist в Komfo, където разработва модели за sentiment analysis и идентифициране на влиятелни профили в социалните мрежи. Как започва да се занимава с machine learning и кой е най-интересният аспект от работата му, разберете в интервюто.

Как започна да се занимаваш с Machine Learning?

В университета, в който следвах, някои съвсем базови модели се изучаваха дори в първи курс и още тогава се възхитих на разнообразните проблеми, които могат да се решат с подобни методи. С течение на времето взех няколко курса по извличане на информация, машинно самообучение и логика и реших да се посветя на тези дисциплини.

Кой е най-интересният аспект от работата с Machine Learning?

Безспорно най-интересният аспект е визуализацията/интерпретацията/аргументацията на резултатите от даден експеримент. По някакъв начин това внасяне на яснота доставя чувство на удовлетворение, че си постигнал целта си.

Какво те мотивира в работата ти?

По-скоро бих използвал думата „предизвиква“. Работата с machine learning е ежедневно предизвикателство. Постоянно срещаш нови проблеми, които изискват нови решения. Научава се изключително много и това ми харесва.

Кое най-голямото технологично предизвикателство, с което си се сблъсквал? Как го разреши?

Мониторинг на точността в реално време. Добра практика е когато работиш по подобрението на даден модел, да можеш да сравниш поведението му с предишната версия. За целта A/B тестване би свършило чудесна работа, но ние направихме нещо малко по-различно. Вместо пълноправно A/B тестване, третираме текущия модел като „избран“ и резултатите от него се показват на потребителите. През това време паралелно пресмятаме точността и на няколко други кандидат-модели. В крайна сметка, подменяме „избрания“, ако за 1-2 седмици друг модел достига по-добри резултати ежедневно.

Какво би посъветвал всички, които сега започват да се занимават с Machine Learning?

Материята е сложна, но изключително интересна. Хубаво е да се положат добри основи като се обърне повече внимание на най-основните модели и техните компоненти и параметри. Също така, полезно е да колаборираш с други ентусиасти, за да си допълвате пропуските. Не на последно място, участието по различни състезания е чудесен начин да се сблъскаш с реален проблем.


Стани част от потребителската група Machine Learning. Абонирай се и ще ти изпращаме информация за всичко, което предстои в групата.

Визия: Личен архив

Прочети още:
„Програмирането е магия. А machine learning е следващото ниво на магията“ – Георги Стоянов, Lucid App
6 от най-популярните Machine Learning алгоритми – приложения и възможности

Share This