ПО «Магуча»
машинное чтение вакансий и резюме

Динамическое определение коэффициента актуальности резюме

В рамках «Цифровой модели рынка труда» стоит задача определения индекса Фраучи — соотношения количества актуальных резюме к количеству актуальных вакансий.

Но если почти все вакансии относятся к категории «актуальные», так как «брошенные» вакансии автоматически снимаются с публикации job-порталом, то с резюме ситуация не однозначная: job-порталы предпочитают их оставлять и учитывают в своей статистике.

Как это у них

Так, по состоянию на начало сентября 2024 года, на государственном job-портале «Работа России» числится 9 721 509 резюме, а на коммерческом job-портале «Head Hunter» заявлены аж 73 миллиона резюме у 47 миллионов соискателей.

Если в «Head Hunter» поставить галочку «в России», то число резюме сократится до 9 175 333 штук (а уникальных соискателей будет и того меньше), а из них «активно ищет работу» всего 113 609 резюме.

В «Работе России» можно выбрать временной интервал, когда добавлялось резюме. Например, если выбрать за последний месяц, то из 9 миллионов заявленных останется всего 171 364 резюме (а уникальных соискателей, следовательно, еще меньше).

ПлатформаВсего в РоссииАктивных* / за месяц
Head Hunter9 175 333113 609 /
Работа России9 721 509/ 171 364 
Superjob17 907 731/ 188178
Avito2 986 486/273 882

*На «Head Hunter» соискатель сам указывает свой статус, например «активно ищу». Однако, практика показывает, что соискателям свойственно забывать своевременно изменить свой статус, если они нашли работу. На других сайтах опция – выбрать за последний день, три, семь, 2 недели и месяц (или 30 дней).

Как это у нас

Так как основное достоинство (оно же и недостаток для большинства эйчаров) и особенность нашей модели в том, что мы ориентированы на очень высокую исследовательскую точность и валидность, то просто решить, что резюме «актуально» последние столько-то дней — для нас не совсем корректно.

Мы сейчас даже не говорим, что, рассчитывая индексы Фраучи, мы учитываем четкое совпадение и по квалификации, и по типу отношений, и по графику работы, и по коридору предлагаемой/ожидаемой зарплаты. Поэтому вопрос, какое резюме считать актуальным, для нас очень важен.

Скорость закрытия вакансии

В свое время мы разработали модель подсчета скорости закрытия вакансии. Чтобы построить эту модель пришлось «оцифровать» работодателей и уже смотреть в разрезе их job-активности: как часто они открывают и закрывают вакансии, причем с учетом того, что это они делают на разных сайтах.

Мы сравнивали каждую открываемую вакансию с такими сущностями как «индекс конкурентности» (сколько всего подобных вакансий и сколько всего соискателей в данном населенном пункте), а также насколько она адекватна финансовым запросам соискателей. Всё это с учетом квалификации и еще набора данных.

В итоге получилась предсказательная модель, которая может рассчитать ориентировочную скорость закрытия вакансии с учетом анализа рынка труда в конкретном городе по конкретной позиции. Формировались «кривые» в которых предлагаемые условия труда (зарплата, график, квалификационные требования) коррелировали со сроками закрытия вакансии (от «мгновенно» до «бесконечно», но обычно в реальном диапазоне дней).

Позже коллеги «прикрутили» еще реальный календарный график с учетом праздников, выходных и сезонных (цикличных) колебаний. Точность еще повысилась.

Скорость закрытия резюме

Аналогичным путем мы пошли в исследовании скорости закрытия резюме. Исследовалось более десяти миллионов резюме за последние 4 года. Учитывалось, когда соискатель открывал (публиковал) резюме, когда обновлял, когда закрывал его. Также перепроверялись данные, если соискатель снова «появлялся» на рынке труда и его опыт обновлялся в резюме.

Основными факторами, влияющими на скорость закрытия резюме, стали:

  • Категория искомой позиции. На ряд рабочих профессий средний срок закрытия составляет менее недели (с учетом других факторов, разумеется). И есть офисные профессии, которые закрываются достаточно долго (и индекс конкурентности для них совсем иной).
  • Адекватность зарплатных ожиданий. Ожидаемо оказалось, что если ожидаемая зарплата чуть ниже предлагаемой медианной зарплаты работодателей, то скорость закрытия резюме (то есть быстрота поиска работы) увеличивалась. Обратим внимание, что считается все именно по конкретному населенному пункту и с учетом требуемого уровня квалификации.
  • Квалификационные соответствия. Если они указаны в резюме, то точность прогноза повышалась. Заодно подтвердился «американский эксперимент»: если работодатель ищет низкоквалифицированного работника, то у соискателя с высшим образованием и большим перечнем компетенций меньше шансов трудоустроиться, если вдруг он решил пойти по пути дауншифтинга.
  • Индекс конкурентности. Учитывалось, как много других соискателей с такими же квалификациями в данном населенном пункте претендует на такую же позицию и с такими же зарплатными ожиданиями.
  • Индекс адекватности резюме и индекс адекватности соискателя. Программа проверяла, насколько резюме соискателя «типовое»: нет ли в нем неуместной «лирики», неадекватных зарплатных ожиданий – как слишком завышенных, так и заниженных, количество орфографических ошибок и т.п. Также проверялся профиль самого соискателя: если у него еще с десяток резюме, в которых указаны несмежные профессии (см. «синонимическое облако профессий»), то это все понижало «рейтинг возможностей быстрого трудоустройства» соискателя. Особенно «пессимизировались» возможности соискателей, которые указывали в резюме о себе отличающиеся биографические данные (образование или даже возраст).
  • Половозрастные данные. Для ряда профессий пол и возраст работают как факторы понижающие / повышающие коэффициент трудоустройства, но в основном для ряда пограничных случаев. Например, у юных претендентов на руководящие позиции меньше шансов. Есть сложности у возрастных соискателей по ряду профессий и есть коэффициенты у ряда «гендерных» профессий. Но все эти коэффициенты динамически пересматриваются, так как, во-первых, свою лепту вносит растущая трансформация орудий труда (так, например, появился официальный доступ женщин к ранее запрещенным для них видам деятельности – ссылка на документ),  а во-вторых, сказывается дефицит рабочей силы последних лет.

Дополнительно:

  • К этому всему учитывались предлагаемый и предпочитаемый график работы, и тип занятости.
  • В случае малой выборки для ряда населенных пунктов размер охвата увеличивался по алгоритму, описанному в журнале «Интерактивное образование» № 1 за 2024 год, статья «Роль рынка труда в профессиональном самоопределении» (Смирнов А.Ю.), стр. 48, раздел «География исследования».
  • Кроме того, был использован алгоритм, который использовался в случае множественных резюме одного и того же соискателя на разных сайтах. Алгоритм определял наиболее актуальное и наиболее соответствующее резюме для конкретного соискателя с высокой скоростью закрытия.

В итоге мы получили модель, которая с высокой точностью предсказывает срок закрытия конкретной позиции в конкретном городе у конкретного соискателя. Жаль, что этот алгоритм не используют job-сайты для помощи соискателям!

Таким образом, новый программный модуль позволяет просчитывать срок закрытия резюме для каждого соискателя и тем самым определять, актуально ли размещенное (и не закрытое) резюме на сегодняшний день. Это позволяет дать реальную картину по «живым» соискателям на сегодня.

Полноценный просчет актуальных резюме требует громадных вычислительных ресурсов, ведь требуется, чтобы программа переобучилась на новых данных, которые поступили с рынка труда за время после последнего запуска, и пересчитала установочные коэффициенты. (С другой стороны, после каждого запуска, точность прогноза еще немного увеличивается).

Для обычных расчетов мы используем корреляционные таблицы, которые позволяют провести быстрые текущие расчеты актуальности соискателей, опираясь на наименование искомой позиции (профессии) и конкретного населенного пункта. Эта модель используется в кратких отчетах по рынку труда.