ПО «Магуча»
машинное чтение вакансий и резюме

Магуча — первая публикация о работе программы (2021/2022)

Специалистами «Центра научных исследований в сфере профориентации и психологии труда» была разработана языковая надстройка Магуча, позволяющая автоматически читать и понимать текст и содержание русскоязычных вакансий и резюме, размещенных на российских job-сайтах.

Для чего нужна Магуча?

Магуча помогает намного детальнее, чем обычные способы, «посчитать» рынок труда, составить цифровой портрет профессии и соискателя, ответить на множество исследовательских вопросов, которые до этого считались весьма грубо.

Например, сколько конкретно в стране (в регионе или конкретном городе) требуется менеджеров? Казалось бы, простой вопрос, но подвох в том, что менеджер — это мета-название для очень разных по своей сути профессий. Менеджер по продажам, менеджер проекта, менеджер по кадрам, PR-менеджер. Всего существует более 600 уникальных наименований для разных профессий, специальностей и должностей, встречающихся в вакансиях со словом «менеджер».

Кроме разных профессий с одинаковым названием встречаются еще одинаковые по функционалу профессии, но с очень разными наименованиями. За примером далеко не пойдем, возьмем тех же менеджеров: самые востребованные из них — это менеджеры по продажам. Как только их ни называют, чтобы выделить вакансию из других подобных! Но при этом должные инструкции практически совпадают у всех.

В статье «1000 онлайн-профессий» приводится пример, как тысяча уникальных названий сводится к 38 типам деятельности.

Но еще чаще в вакансиях встречаются 4 типа названия одной и той же профессии:

  • как она называлась в колледжах (а еще раньше – в училищах и техникумах), чаще всего совпадает с ОКПДРТ или ЕТКС;
  • как принято называть профессию на конкретном предприятии;
  • как фактически называется должность на конкретном предприятии;
  • жаргонизм, которым обычно называют себя представители профессии.

Пример:

  • Бурильщик эксплуатационных и разведочных скважин
  • Машинист буровой установки
  • Буровой мастер
  • Буровик

Но что самое интересное, вышеупомянутые бурильщик и буровик могут быть совершенно разными профессиями. Истина в том, что находится не в названии вакансии, а в ее содержании.
И Магуча ориентируется именно на это.

Как работает Магуча?

Магуча заглядывает в непосредственный текст вакансии (или резюме) и читает его. Анализируя требования, предъявляемые к соискателю и должные инструкции, она с большой степенью достоверности относит вакансию к той или иной конкретной профессии (для классификации профессий используется собственная таксономия профессий).

Как именно Магуча читает вакансии и резюме?

Программа выделяет смысловые конструкции внутри текста и соотносит их с готовыми мультишаблонами, привязанными к разным группам профессий. Внутри мультишаблона есть шаблоны определения конкретных профессий, специальностей и должностей с учетом подшаблонов: квалификационных разрядов и категорий.

Для увеличения точности идентификации Магуча также опирается на информацию из других полей вакансии или резюме, которая повышает или понижает индекс соответствия той или иной профессии по нашей таксономии.

В процессе обучения с помощью «ручной проверки» экспертами корректируется вес коэффициентов и точность шаблонов. В настоящее время процесс обучения продолжается.

Эксперты «подкладывают» сложные кейсы для проверки эффективности Магучи и учат ее справляться с этими примерами.

Так, к примеру, среди вакансий встречаются совсем куцые. Например:

Загадочный инспектор — кто он и чем занимается?

Пример вакансии «Инспектор» на изображении выше: совершенно непонятно из текста вакансии, о какой именно профессии (должности) идет речь. Инспектор ГИБДД? Инспектор ФСИН? Инспектор органов опеки по делам несовершеннолетних? Инспектор техники безопасности предприятия? Инспектор с функционалом охранника-контролера?

Магуча сначала заглядывает в наименование работодателя: не содержится ли его названии явной отсылки к тем или иным видам деятельности (например: МВД, Центр занятости и т.п.).

Затем она смотрит на предлагаемый оклад, сравнивает его со средним по данному населенному пункту и средними окладами всех типов «инспекторов». Обращает внимание на требуемое образование и график работы. И, взвесив все факторы, выносит свой вердикт.  

В процессе разработки и обучения Магучи, эксперт изучает подобные вакансии одну за другой, а при необходимости связывается непосредственно с работодателем, после чего определяет степень достоверности вердикта Магучи. Так построен процесс «ручного» обучения по наиболее сложным кейсам. Для остальных случаев заготовлены готовые таблицы «кейсы – ответы», по которым сверяется достоверность результатов Магучи.

Что еще может Магуча?

Кроме высокоточных исследований текущих потребностей рынка труда и определения фактического количества активных вакансий и соискателей, Магуча может помочь программам, подбирающим наиболее подходящие вакансии для соискателей.

Происходит это следующим образом:

  • Для всех активных вакансий формируется свой «цифровой портрет вакансии»: многофакторный образ, включающий в себя все ключевые особенности как самой вакансии, так и предприятия-работодателя, его классификацию. В частности, учитывается стратегия работодателя по размещению вакансий: оценивается тип поиска (точечный, массовый), ориентация на квалификацию специалиста, финансовая и социальная мотивация, и множество других факторов.
  • Для соискателя формируется его цифровой портрет — многофакторный образ, содержащий опыт, компетенции, образование, материальные ожидания и другие параметры, в том числе такие как модель поведения на рынке труда (через анализ дат создания резюме и их количества), наличие резюме на конкретных job-сайтах, и другие. Учитывается анализ предыдущего опыта работы, включающий в себя предпочитаемый тип работодателя (крупность предприятия; тип собственности: государственный или коммерческий; …) и другие факторы.
  • С помощью шаблонов определяется оптимальная формула определения веса соответствия вакансии именно для этого соискателя (основной акцент – определение мотивации соискателя и его поведенческого паттерна на рынке труда). Эта формула динамическая и выбирается наиболее подходящая из множества для каждого конкретного соискателя.
  • С помощью фильтрации отсекаются заведомо неподходящие вакансии.
  • Оставшиеся вакансии кластеризуются и ранжируются по степени соответствия их соискателю, которому выдается готовый список вакансий.
  • С помощью дополнительных регулировок соискатель может подкорректировать форму ранжирования вакансий, чтобы получить наиболее релевантный для себя результат.

В идеале, если подключить небольшой тест, алгоритм которого используется в программном комплексе «Профпробы-360», можно было бы «не догадываться» и не тратить ресурсы на объемные вычисления, а более просто и точно подобрать каждому соискателю «идеальные» для него вакансии.

В настоящее время Магуча используется в проектах «Цифровая модель рынка труда» и «Атлас современных профессий, специальностей и должностей». В дальнейшем рассматриваются варианты интеграции в стороннее программное обеспечение.