Анализа и работата със свободен текст е все по-важна за компаниите в наши дни. Какво е моделиране на текст и как се прави ще разкаже на събитието Advances in Language Modeling: Text Generation for Fun and ___ Мартин Боянов. Мартин е Data Scientist в Komfo, където разработва модели за sentiment analysis и идентифициране на влиятелни профили в социалните мрежи. Как започва да се занимава с machine learning и кой е най-интересният аспект от работата му, разберете в интервюто.
Как започна да се занимаваш с Machine Learning?
В университета, в който следвах, някои съвсем базови модели се изучаваха дори в първи курс и още тогава се възхитих на разнообразните проблеми, които могат да се решат с подобни методи. С течение на времето взех няколко курса по извличане на информация, машинно самообучение и логика и реших да се посветя на тези дисциплини.
Кой е най-интересният аспект от работата с Machine Learning?
Безспорно най-интересният аспект е визуализацията/интерпретацията/аргументацията на резултатите от даден експеримент. По някакъв начин това внасяне на яснота доставя чувство на удовлетворение, че си постигнал целта си.
По-скоро бих използвал думата „предизвиква“. Работата с machine learning е ежедневно предизвикателство. Постоянно срещаш нови проблеми, които изискват нови решения. Научава се изключително много и това ми харесва.
Кое най-голямото технологично предизвикателство, с което си се сблъсквал? Как го разреши?
Мониторинг на точността в реално време. Добра практика е когато работиш по подобрението на даден модел, да можеш да сравниш поведението му с предишната версия. За целта A/B тестване би свършило чудесна работа, но ние направихме нещо малко по-различно. Вместо пълноправно A/B тестване, третираме текущия модел като „избран“ и резултатите от него се показват на потребителите. През това време паралелно пресмятаме точността и на няколко други кандидат-модели. В крайна сметка, подменяме „избрания“, ако за 1-2 седмици друг модел достига по-добри резултати ежедневно.
Какво би посъветвал всички, които сега започват да се занимават с Machine Learning?
Материята е сложна, но изключително интересна. Хубаво е да се положат добри основи като се обърне повече внимание на най-основните модели и техните компоненти и параметри. Също така, полезно е да колаборираш с други ентусиасти, за да си допълвате пропуските. Не на последно място, участието по различни състезания е чудесен начин да се сблъскаш с реален проблем.
Стани част от потребителската група Machine Learning. Абонирай се и ще ти изпращаме информация за всичко, което предстои в групата.
Визия: Личен архив
Прочети още:
„Програмирането е магия. А machine learning е следващото ниво на магията“ – Георги Стоянов, Lucid App
6 от най-популярните Machine Learning алгоритми – приложения и възможности