— Расскажи, кем ты мечтал стать в детстве?
— На самом деле у меня не было идеи вырасти и кем-то стать. Но я всегда понимал, что хочу заниматься тем, что увлекает. Например, мне нравилось решать математические задачки. Я приходил из школы и часами разбирал примеры из сборника Сканави (задачник для поступающих во втузы. — Прим. редактора).
Еще мне нравилось программировать. Раньше были приставки и клавиатуры Dendy: вставляешь картридж и играешь. На клавиатуре можно было писать слова и код. Я изучал дедушкины журналы «Наука и жизнь» с примерами программ на бейсике и пытался на ней воспроизвести. Одной из таких программок была игра пасьянс. Так вот, я сидел и упорно старался, чтобы он начал раскладываться.
— Видимо, пасьянс сошелся
— Да! Детское увлечение вылилось в образование по специальности «Прикладная математика и информатика» в МЭИ, а потом в профессиональное программирование. Кстати, обучение в вузе мне очень нравилось. На кафедре были специалисты по машинному обучению, и я ни разу не пожалел, что выбрал анализ данных.
— Ты математик, программист и аналитик в одном лице?
— Я в большей степени программист, в меньшей степени аналитик, ну и математик, само собой. Математический анализ и статистика — в основе машинного обучения. Профессиональные математики двигают вперед фундаментальные законы, а дата-сайентисты берут их наработки и внедряют в жизнь. И тут без программирования и аналитики никак: нужно строить рабочие математические модели и анализировать метрики, чтобы оценить эффект.
— Дата-сайентист по-русски — это буквально ученый по данным?
— Все-таки мы занимаемся разработкой и внедрением алгоритмов и редко проводим научные исследования. Поэтому говорить, что я ученый, было бы слишком оскорбительно для тех, кто действительно занимается наукой.
Как раз недавно читал пост одного дата-сайентиста о том, как он пытался объяснить, чем занимается на работе, своему маленькому сыну. Кончался этот пост словами: «Мой ребенок был не впечатлен».
За модными терминами «машинное обучение» и «дата-сайенс» стоит очень простая идея. Есть какие-то данные, и их много. В этих данных скрываются интересные закономерности, но обнаружить их вручную очень сложно. С этим и помогает машинное обучение: автоматизирует процесс исследования данных.
— Зачем машинное обучение нужно на hh.ru и в HR-сфере в целом?
— Здесь много данных, которые можно превратить в пользу. На hh.ru это резюме и вакансии, а еще — действия рекрутеров и соискателей на сайте. Мы можем изучить, кого работодатель чаще всего приглашает на собеседование, и помочь соискателю улучшить резюме. Или проанализировать отклики и подсказать рекрутеру, с кем стоит пообщаться в первую очередь. При этом работодателю и соискателю не нужно ничего делать — достаточно нажать кнопку «Найти». Это экономит самый важный ресурс современного мира: время.
— Не могу удержаться от избитого вопроса: как думаешь, искусственный интеллект когда-нибудь заменит рекрутера?
— Скажу так: если какой-то процесс можно автоматизировать, то его стоит автоматизировать. И это уже происходит, в том числе в сфере HR.
Если рекрутер бездумно приглашает кандидатов на вакансию, задает им одни и те же вопросы, а потом также бездумно направляет их на собеседование, то такого рекрутера искусственный интеллект уже заменил.
Другое дело, если HR подходит к работе вовлеченно и осознанно. Например, может просчитать, насколько соискатель близок компании с точки зрения ценностей и пройдет ли он испытательный срок. Искусственный интеллект такого сделать уже не может.
— Как все устроено в команде умного поиска? Кто топит за работодателей?
У нас большая команда, часть ребят больше сосредоточены на соискателях, другие — на работодателях. Но это формально. В реальности, делая что-то для соискателя, мы автоматически улучшаем процессы и для работодателя. И наоборот. В конечном итоге мы совершенствуем систему в целом для всех участников подбора.
— Боюсь представить, насколько сложные у тебя задачи
— Я улучшаю поисковые алгоритмы. В их основе — математическая модель. И главная трудность в том, чтобы найти баланс между качеством модели и ее сложностью, потому что от этого зависит ее применимость.
Если бы у нас на сайте было всего 100 вакансий, мы могли бы рассчитать идеальную модель и предоставить суперперсонализированные рекомендации для каждой публикации. Но у нас миллион открытых вакансий, и нужно, чтобы все работало для всех и за доли секунды.
— Я правильно понимаю, что в итоге алгоритм рассчитан на усредненную вакансию? Тогда теоретически кандидат может угадать набор ключевых слов, чтобы всегда быть в топе
— Все намного сложнее. Мы не хотим стричь всех под одну гребенку, наоборот, стараемся предоставлять индивидуальные рекомендации. В моделях учитывается много разных характеристик и их взаимосвязи. Текст в резюме — это всего лишь один из таких признаков, причем не самый важный. Поэтому наличие ключевых слов в описании не гарантирует, что система будет предлагать его чаще.