МАГУЧА — программное обеспечение для машинного чтения вакансий и резюме
Основная задача программы «Магуча» — получить наиболее достоверную информацию по рынку труда.
Как работает «Магуча»?
- Она «отличает» одну профессию от другой читая и анализируя весь текст вакансии или резюме, беря во внимание возможные орфографические ошибки, опечатки, иносказания.
Какие проблемы помогает решить «Магуча»?
- Получить достоверную информацию о кадровых перекосах в любом городе РФ: сколько специалистов надо и сколько на самом деле есть?
- Получить срез (а потом контролировать его динамику) по тому, какие именно профессии (специальности, должности) сейчас востребованы в стране и в каком количестве; и какие есть специалисты. А потом смотреть, как это меняется, вычленяя тренды, цикличности, иные закономерности. То есть определяется фактическая структура рынка труда.
- Составить «Атлас современных профессий» в онлайн-режиме. В этом Атласе будет автоматически формироваться «потрет профессии» из усредненных данных: по условиям труда, по типичному графику работы, по требуемому образованию, требуемым навыкам, качествам и компетенциям. Все это формируется в онлайн-формате и может иметь географическую локализацию. Вы удивитесь, но портрет типичного слесаря в одном городе отличается от портрета в другом и от общего портрета по России.
- Аналогично с Атласом профессий можно сформировать «Цифровой портрет специалиста», который покажет типичного представителя профессии. Программа обобщит образование, пол, возраст, стаж, набор качеств и привычек (хобби) и сформирует цифровой портрет или группу портретов. Точно также Цифровой портрет профессионала можно построить для любого города, а также сравнить между собой.
- И, наконец, сравнение разных во времени срезов Атласа профессии и Цифрового портрета пользователя помогает понять, в какую сторону и с какой скоростью движется российский рынок труда сейчас. А программы предсказательной (предиктивной) аналитики помогают предположить, что ждет рынок труда в ближайшем и отдалённом будущем.
Кому это может быть полезно?
- Научным сотрудникам, изучающим рынок труда.
- Экономистам.
- Специалистам Центров занятости.
- Специалистам Министерства образования.
- HR-менеджерам.
- Консультантам по профориентации и карьере.
- Методистам в области профориентации и образования.
Методическая часть:
В России нет четкого и однозначного перечня всех профессий. То, что есть, больше имеет статистически-отчетный смысл для начисления надбавок, пенсий и т.п. К реальному рынку труда существующие «классификаторы рабочих профессий и должностей», а также, увы, «профстандарты» практически перестали иметь отношение.
Для одной и той же профессии существует десяток синонимов, и это одна из причин, по которой работодатель и работник «не могут встретиться». Один ищет мастера буровой, а другой предлагает себя как водитель буровой установки (или просто установки с указанием марки), при этом говорят об одном и том же. А есть синонимы профессий без однокоренных слов и тогда поисковые системы job-сайта просто не имеют шанса показать их все сразу.
Современные молодые работодатели придумывают названия профессий в угоду моде, маркетинговым и hr целям. Так, на работу начинают приглашать «озонщиц» или «коктейльщиц» вместо «специалиста пункта выдачи заказов» или «бармена».
Еще хуже, когда для одной и той же профессии по названию разные работодатели предлагают принципиально разный функционал. Соискатель думает, что устраивается для выполнения одного набора функций, а по факту оказывается совершенно другой. И кроме менеджерских (так называемых «офисных») профессий такая ситуация стала все чаще появляться в привычных рабочих и технических профессиях.
Чтобы разработать программу «Магуча» нам пришлось пересмотреть представления о том, что такое профессия. Мы разработали собственную «таксономию профессий, специальностей, должностей», а за одно и таксономию «отраслей и видов деятельности», и таксономию «компетенций и ПВК» (ПВК – профессионально важные качества).
В «Магуче» собственный каталог «сущностей» на основе перечня трудовых действий и квалификаций. Магуча, читая вакансию или резюме, формирует свою оценку того, чем является искомая вакансия или резюме, а после идентификации может вернуть название в привычном для современного мира варианте.
Работа построена по принципу «весов», каждый пункт вакансии или группа пунктов увеличивает или уменьшает вес соответствия для конкретной профессии. Так достигается высокая точность результата. (Вы можете описать, что вы умеете делать, как и в каких условиях хотите работать — а программа скажет, какие профессии наиболее соответствуют тому, что вы описали).
Основные сложности:
- У каждого job-сайта своя «разметка» баз данных и свои требования к форме и полям вакансий и резюме. И время от времени эти требования еще и меняются. Нам надо держать руку на пульсе, расшифровывать и правильно отправлять исходные данные в «Магучу». Фактически, мы сейчас пошли по пути создания «Магучи» оптимизированной для каждого конкретного сайта: это повышает точность результата, но для нас это сложность, что это стала не одна программа, а несколько. И все они требуют обслуживания, дальнейшего обучения. При этом задача обратной интеграции (сведения) всех данных никуда не делась.
- Глубокое чтение вакансий и резюме и взвешивание всего прочитанного требует высокой производительности компьютеров. Вычисления становятся очень затратными, и всякий раз нам приходится думать: а стоит ли такая точность вычислений таких затрат? (Финансируем мы свой проект самостоятельно, без грантов и сторонней поддержки).
- Невозможно создать один раз язык чтения вакансий и резюме и успокоиться на этом: язык вакансий и резюме точно такой же живой язык, как тот на котором мы разговариваем. Постоянно появляются новые слова: новые профессии, компетенции, требования. Все это требует нашего внимания и ручной работы по расширению словарей, описанию слов и связей, таблиц с коэффициентами и формулами для взвешивания, семантических полей и так далее. Мы надеемся, что эти задачи нам удастся переложить на нейросеть, которую мы планируем использовать более активно в версиях «Магуча» 3 и 4.