Кога
септември 11, 2017 @ 7:30 pm – 9:00 pm
2017-09-11T19:30:00+03:00
2017-09-11T21:00:00+03:00
Къде
Betahaus Sofia
ул. "Крум Попов" 58

Това събитие е част от потребителската група Machine Learning:

ПРОГРАМА:

В презентацията можем да очакваме да видим машинното обучение като смесица от вероятности, числени методи и крайни автомати, които ще използваме като средство за нормализация на исторически текстове.

Това са текстове, писани преди няколко стотин години, когато не е имало ясни правила за писане и една и съща дума се е пишела по различни начини дори и в рамките на един и същи документ.

Нормализацията на такива текстове предоставя възможността за по-лесно автоматично търсене на думи и фрази. Освен това нормализацията прави текстовете по-разбираеми за читатели, които не са професионални историци.

Нормализацията моделираме с максимизиращ ентропията log-линеен модел, който ни позволява да комбинираме различни характеристики на нормализиращи кандидати като ортографски тегла и тегла от езиков модел. Моделът оптимизираме с градиентен метод, като за ефективното пресмятане на градиента използваме крайни автомати. Нормализацията можем да извършваме както в supervised вариант, така и без да разполагаме с корпус от нормализирани документи в unsupervised вариант.

Някога питагорейците твърдяли, че всичко е число. Днес лекторът твърди, че всичко е краен автомат…

ЛЕКТОР: Петър Митанкин

>>> Към настоящия момент Петър Митанкин работи като старши програмист в Онтотекст и като главен асистент в СУ, ФМИ към катедра по математическа логика и приложенията ѝ.
>>> Ръководител на магистърска програма по компютърна лингвистика в СУ, ФМИ от 2014 г. до 2016 г.
>>> Доктор по „Информатика“ в БАН, Институт по паралелна обработка на информацията.
>>> Магистър по „Информатика“ във ФМИ, СУ.

С ПОДКРЕПАТА НА: HyperScience & Skyscanner & Ontotext

HyperScience brings AI to the office. Through ML solutions we help various enterprises and government institutions to automate the hectic back office work.

Skyscanner е най-големият световен сайт за търсене на пътувания, a инженерният им офис в София се фокусира върху проекти свързани с datascience, recommendation и natural language processing.

Ontotext е глобален разработчик на семантични технологии на базата на изкуствения интелект, които се прилагат към управление и използване на масиви от данни и текстов анализ.

ЗАДЪЛЖИТЕЛНА БЕЗПЛАТНА РЕГИСТРАЦИЯ:
Събитието е безплатно, но със задължителна предварителна регистрация:

Местата за събитието са изчерпани.

ПОТРЕБИТЕЛСКА ГРУПА: Machine Learning

Събитието е част от потребителската група за Machine Learning. Всеки месец организираме събития на тема свързана с Machine Learning. За да не изпускате интересна информация по темата – абонирайте се:

ОРГАНИЗАТОР: DEV.BG

КЪДЕ: betahaus Sofia, ул. „Крум Попов“ 58

КОГА: 11.09.2017. 19:30

Очакваме ви!