Борис Даскалов води екип в HyperScience, който се занимава с различни Machine Learning и Computer Vision проекти, включително разпознаване на ръкописен текст. Преди това е работил по препоръчващи системи в Soundcloud и audio/video fingerpriting в Google. На събитието на 10-ти април той ще изнесе презентация на тема „End-to-end Learning for Handwriting Recognition“. Сега, Борис ни разказва кой е най-интересният аспект от работата с Machine Learning.

Как започна да се занимаваш с Machine Learning и кой е най-интересният аспект от работата с Machine Learning?

Още в университета участвах в екип, с който работихме по проект за Netflix Prize (състезание за препоръчващи системи). Не постигнахме кой знае какви резултати, но ми стана интересно и започнах да уча целенасочено в тази област. След това, по време на магистратурата ми в ЕТH Zurich, специално си подбирах курсове, така че да се концентрирам върху Machine Learning, тъй като тогава нямаше подобна специализация. След това ми се наложи да работя по един проект за разпознаване на изображения.

Какво те мотивира в работата ти?

Осъзнах, че дълбоките невронни мрежи носят коренна промяна в тази област, тъй като позволяват на малки екипи въоръжени с подходящ изчислителен ресурс да атакуват проблеми, които до преди 10 години бяха по силите само на огромни компании.



 

Събитие на фокус:

Analytics tools for Mobile Applications

 


 

Кое най-голямото технологично предизвикателство, с което си се сблъсквал?

Голямо предизвикателство е скоростта, с която се развива областта в момента. Практически се налага да се дообразовам, буквално всеки ден, за да съм в крак с новостите. Напоследък, може би най-голямото предизвикателство е как да изграждам и водя екип, без да се откъсвам от техническата работа. Един от технологичните проблеми, с които се сблъскваме постоянно, е че ни се налага да тренираме Machine Learning системи, за който имаме съвсем малко или никакви тренировъчни данни.

Как разрешавате това?

Развихме серия от инструменти, с който да генерираме синтетични данни. Също така, наехме екип от хора, които да анотират тренировъчни данни. Комбинацията от двете се оказа изключително ценна, тъй като ни позволи да тренираме върху синтетичните данни и да оценяваме алгоритмите върху данните, които нашите анотатори генерират. Така, постепенно успяваме да направим синтетичните данни неразличими от истинските и резултатите ни се оказват приложими в реалния свят.

Какво би посъветвал всички, които сега започват да се занимават с Machine Learning?

Да не подценят необходимостта от базови академични знания като линейна алгебра, статистика, вероятности и оптимизация. В същото време, пропуските в тях не трябва да ги плашат, понеже могат да бъдат наваксани относително бързо. Смятам ,че в наши дни човек има невероятни възможности за самообучение и трябва да се възползва.

Другата страна на нещата е, че винаги се учи по-лесно върху конкретен проект. Бих препоръчал на всеки да си намери проект, който му е интересен и да го реализира. Дори и да не се получи, обикновено наученото си заслужава.

Стани част по потребителската група Machine Learning. Абонирай се и ще ти изпращаме информация за всичко, което предстои в групата.

Визия: Личен архив

Прочети още:
6 от най-популярните Machine Learning алгоритми – приложения и възможности
Какво означава една система да е „reactive“? Основна концепция на Reactive programming

Share This