Васил Люнчев е Founder & CEO в Homeheed. Работил е по автоматично разпознаване на музикалните жанрове в SoundCloud. Той ни сподели кой е най-интересният му анспект от работата му с Machine Learning и кои са трите най-важни неща, които ИТ обществото може да научи от темата на предстоящата ти презентация – Computer Vision Keypoint Matching.

Как започна да се занимаваш с Machine Learning?
Първият ми сблъсък с AI беше във ФМИ, където в курса по AI ни казаха „организираме състезание за целия поток по писане на AI бот, който да играе Reversi (игра подобна на шах). Накрая ще пуснем ботовете да играят турнир един срещу друг. Победителят от турнира получава шестица за курса без изпити и контролни“. Аз много се зарибих, вкарах какви ли не оптимизации в бота си, и в крайна сметка ботът спечели турнира без нито една загуба (даже половината срещи спечели със 60 на 0). До ден днешен не познавам човек, който може да победи този AI бот.

Кой е най-интересният аспект от работата ти с Machine Learning?
Изключително интересно е да правиш нещо, което като кажеш на познати че го правиш, те не ти вярват, защото мислят, че компютър не може да прави такива неща. В SoundCloud работех по разпознаване на жанра на дадена песен само по аудио сигнала ѝ. Веднъж разказах на моя чичо върху какво работя, а неговата реакция беше „т.е. ти по цял ден слушаш песни и цъкаш какъв жанр са, така ли?“. Той не можеше да повярва, че компютър може да прави това и че аз само пиша кода.

Кое е най-голямото технологично предизвикателство, с което си се сблъсквал?
Безспорно това е работата с изключително шумния dataset от обявите за недвижими имоти в София. Положението е толкова страшно, че за един апартамент може да има 10 обяви (от различни агенции) в един и същи сайт. И не стига това, ами в една обява пише, че апартаментът е 3-стаен в Лозенец, в друга пише че апартаментът е 3-стаен в Младост, а в трета е дори 2-стаен в Гео Милев. Говорим за един и същи апартамент!? Никога до сега не съм виждал толкова шумен dataset. То не знам дали изобщо може да се нарече шум или е нещо повече.

Как го разреши/разрешихте?
Снимките! Снимките на обявите са много по-трудни за манипулиране, а и с добри алгоритми може да се разбере, че две снимки са на един и същи апартамент, дори и да са манипулирани.  Така “виждаш” за какво става дума дори и в текста да пише, че единият е в Младост, а другият е в Лозенец.

Ще споделиш ли трите най-важни неща, които ИТ обществото може да научи от темата на предстоящата ти презентация?
Темата е keypoint matching. Това е доста основна тема в Computer Vision. Ползва се за страшно много проблеми, свързани с изображения и видео – от разпознаване на обекти, следене на обектите във видео, минавайки през „как работи функционалността Panorama в телефона ни“, та се стига чак до роботика и анализ на ЯМР снимки на мозъчна активност. Наистина е тема с изключително широко приложение.

Какво би посъветвал всички, които сега започват да се занимават с Machine Learning?
Бих ги посъветвал първо да разберат добре данните си. Като цяло да разберат проблема си. От моя опит, най-големите проблеми винаги са били свързани с данните (дали са шумни, дали са малко, дали са различни от production данните…). Аз винаги първо съм гледал данните, затова и съветът ми е такъв – фокусирайте се върху данните.


Стани част от потребителската група Machine Learning. Абонирай се и ще ти изпращаме информация за всичко, което предстои в групата.

Визия: Личен архив

Прочети още:
„Програмирането е магия. А machine learning е следващото ниво на магията“ – Георги Стоянов, Lucid App
6 от най-популярните Machine Learning алгоритми – приложения и възможности

Share This