Александър Ефремов е участвал в разработването на системи за откриване на измами, моделиране на кредитен риск, препоръчващи системи за е-търговия, оптимизация на маркетингови кампании, оптимизация на поръчки и други, позовавайки се на повече от 18 години опит в моделирането и оптимизацията. На събитието „Автоматизирано моделиране на кредитен риск“ на 15 януари той ще говори за това как може да се моделира кредитният риск с помощта на data mining. С него си поговорихме за това как вижда ролята на data mining и кой е най-интересният аспект от работата с Machine Learning.

 

Как започна да се занимаваш с Machine Learning?

Университетът ме вдъхнови да тръгна по този път и по-точно преподавателите. В ТУ – София завърших Автоматика. Там учих Идентификация на системи (така в техническата област наричаме Data Mining), Адаптивни системи, Калманова филтрация и т.н. Тогава разбрах как да правя алгоритми, които без човешка намеса се обучават и адаптират в реално време като използват данни от сензори, а също и предварителни знания, несъдържащи се в данните. Започнах докторантура, а първата ми работа, през 2000 г., беше адаптивни системи в химическата индустрия. После продължих в спътниковата комуникация, в пазарния сектор, във финансите, маркетинга и т.н. Давам си сметка, че минах през много приложни области, но не съм се откъсвал от пътя, свързан с ML.

Кой е най-интересният аспект от работата с Machine Learning?

На много хора им е интересно да работят с конкретни данни и да извличат интересни неща от тях… Това, което мен ме вдъхновява, не е решаването на конкретна задача, а на общия проблем, като разработвам мои алгоритми правейки ги по-добри от съществуващите, а също и като създавам цели автоматизирани приложения. Тук предизвикателствата са по-различни. Страхотно е, когато конструираш алгоритъм за обучение на невронни мрежи, който е винаги сходящ, осигурява неизместени оценки, числено устойчив е и е няколко пъти по-бърз от официално приетия. А най-важното е, че знаеш силните му страни и ограниченията му. Ако решаването на конкретна задача е като да стигнеш от т. А до т. Б, то разработката на алгоритъм е като да направиш по-добър всъдеход – който минава успешно през по-трудни терени…

Още по-вдъхновяващо е да разработиш цялостно решение, например за оптимизация на стратегия за поръчки. То включва моделиране, прогнозиране на търсенето на продукти и оптимизация при ограничения като: максимално допустим брак, пропуснати ползи, капацитет на склада/производството и т.н. Това приложение формира на дневна база оптимални поръчки, за ритейл обект, без участието на човек и най-важното – задачата е решена в общия случай и може да се използва за различни бизнеси. Ако проектирането на алгоритъм е като да направиш всъдеход, то последното е като да построиш автоматизиран завод, произвеждащ регулярни услуги за бизнеса.

Какво те мотивира в работата ти?

Имам мечта, която още не съм реализирал. Целият ми професионален живот е инвестиция в една идея. Инвестицията е работата ми в индустрията, в университета и за съжаление част от времето за семейството. Искам да създам организация, в която хора се занимават с R&D в областта Data Science и работят по проекти, по които всъщност и сега работя, но в момента съм сам. Интересувам се от Art of Hosting, групова динамика и всякакви методи, които допринасят за това средата и процесите в организацията да са вдъхновяващи и осмислящи, а не агресивни и отблъскващи.  Все още не съм попадал в такава структура и затова искам да я създам. И да, понеже съм доцент съм в ТУ – София, основен момент е, че хората ще имат възможност да станат доктори. Също работейки заедно, групата ще подпомага личния път на всеки и хората по-ефективно ще учат и ще стигнат по-далеч за времето, в което са докторанти.

Всъщност, от няколко години всичко необходимо е налице – връзката с образованието, с индустрията и проектите, с докторантите, но имам външни ограничения, които ме спират – засега.

Кое най-голямото технологично предизвикателство, с което си се сблъсквал?

В работата ми предизвикателствата не са точно технологични. Като инженер по автоматика в съзнанието ми е заложен стремежът да изключвам човешкото участие от места, където ролята на анализатори, експерти и т.н. е по традиция решаваща. И всъщност това е най-голямото ми предизвикателство – как човек с познания, умения и опит да бъде заменен от алгоритъм и едновременно с това да не се стесняват рамките на задача, която той решава. Добър пример е приложението, което разработих за автоматизирано изграждане на скоркарти и което представям на събитието на DEV.BG. Обикновено времето за моделиране отнема минимум месец, а трудността е да се заложи в модела (скоркартата) изискваната от бизнеса логика, която донякъде е в противоречие с това, което наблюдаваме в данните. Затова са нужни анализатори и ролята им е решаваща… поне досега. Това приложение използваме в А4Е – компания, в която съм съдружник. С него се изграждат моделите на риска, с които подпомагаме бизнеса на финтех компании.


 

Събитие на фокус:

Continuous Integration on AWS

 


Как го разреши / разрешихте?

В рамките на няколко години, в „свободното“ ми време систематизирах знанията си за това как анализаторите решават задачата – какво следят, какви решения (и как ги) взимат, какво правят, за да постигнат крайната цел… Направих различни версии на приложението, къде успешни, къде не – вложих доста творчество и накрая успях да изградя завършена концепция, с която да гарантирам формирането на модел, който е баланс между информацията в данните и тази в бизнес изискванията. Тепърва предстои много работа по усъвършенстването на това приложение. Това, което беше ключово при създаването му е, че всички алгоритми разработих сам и знам всеки техен аспект. Така в работата ми не използвам код, който е черна кутия и това ми дава възможност да изменям и синхронизирам работата на алгоритмите така, както поискам.

Какво би посъветвал всички, които сега започват да се занимават с Machine Learning?

В днешно време интернет е неизчерпаем източник на информация за ML, на готов код, на данни, както и на задачи за решаване. Не се задоволявайте с това да сте добри user-и на код, разработван от други хора, а инвестирайте в по-дълбоко разбиране на ML и в свои алгоритми – това е инвестиция, която със сигурност ще се възвърне и то многократно. Вярвам в това и затова в курсовете ми в ТУ за следдипломна квалификация се опитвам да вдъхновя хората да разбират повече от математиката и да пишат свои алгоритми. Радвам се на всяка възможност, когато помагам на хората, прохождащи в областта, а и когато работя с докторанти по нетривиални задачи. ML може да ни изглежда като безбрежна област, но основните принципи не са много – и точно те ни помагат да се ориентираме, когато се сблъскаме с нещо ново. Важното е да не се отказваме при първата, втората и т.н. трудност на пътя ни.


Стани част от потребителската група Machine Learning. Абонирай се и ще ти изпращаме информация за всичко, което предстои в групата.

Визия: Личен архив

„Често се „заравям“ в данните, експериментирам с различни подходи“. Разговор за Machine Learning с Ива Иванова
„Дълбоките невронни мрежи носят коренна промяна в тази област“. Разговор за Machine Learning с Борис Даскалов

Share This