Магуча #magucha
лингвистическая онтология
для чтения вакансий и резюме
Программное обеспечение «Магуча» для машинного чтения вакансий
и резюме современного рынка труда.
Что это?
МАГУЧА — это программное обеспечение, позволяющее читать и «понимать» полный текст вакансий и резюме, размещаемых на российском рынке труда.
ПО «Магуча» представляет собой надстройку (модуль) для языка программирования Питон на основе разработанной лингвистической модели.
Для чего это нужно?
Магуча позволяет решать исследовательские задачи по изучению рынка труда с высочайшей степенью точности, а высокая точность необходима для решения глобальной задачи – построения «цифровой модели рынка труда», запущенной в начале 2020 года.
Как это работает?
Магуча читает весь текст вакансии или резюме как единую цельносмысловую конструкцию, а не дискретным обращениями к отдельным полям текста.
Таким образом, программа оценивает всё содержимое в совокупности, чтобы понять и категорировать вакансию или резюме, даже если в их названии профессия указана неопределенно или ошибочно.
Примеры
Магуча опирается на описание содержания труда и остальных данных для определения реальной профессии (специальности или должности), что актуально, когда наименование вакансии неполное или само название может содержать разные типы трудовой деятельности. Таких вакансий – десятки тысяч.
Вот наиболее частые примеры:
- «Оператор».
Оператор чего? Есть операторы заправочной станции, операторы оборудования, линий. Причем оборудование и линии могут быть из самых разных отраслей: от нефтянки до ЖКХ. Так о каком же из 300+ операторов идет речь? - «Специалист».
Специалист по чему? Специалистами называют очень разные профессии – от сотрудников ФСИН или МВД, до сотрудников банков или государственных учреждений (чиновников). - «Менеджер»
Для чего? Менеджер продаж? По персоналу? По маркетингу?
Бывает и обратная ситуация, когда для какой-либо вполне понятной профессии придумываются весьма необычные синонимы, и очень сложно понять, о чем же идет речь. Чаще всего это встречается с работой в сфере продаж – для нее существует свыше ста часто используемых аналогов. (Примеры можно посмотреть здесь).
Иногда очень важно выделить нюансы и отличия в, казалось бы, однозначно указанной профессии. Например, «менеджер по продажам». Требуется понять, какой именно менеджер по продажам — в какой сфере (отрасли), на каком рынке (b2b, b2c, b2g, …), тип продаж (прямые, по входящим запросам, …) и т.п.
Зачем конкретно это надо?
Находя разные профессии в одинаковых названиях или сводя к одной профессии в названиях разных, Магуча может посчитать точное количество:
- уникальных профессий, которые есть на современном рынке труда;
- свободных рабочих мест по этим профессиям в каждом конкретном городе;
- количество соискателей, соответствующих этим рабочим местам в этих городах.
Такая статистика соответствующих друг другу вакансий и резюме позволяет определить реальные кадровые перекосы на рынке труда любого российского города. И не на «глазок», а в точных цифрах.
Если брать эти цифры в динамике, то можно получить достоверные прогнозы о формирующейся нехватке тех или иных специалистов, что будет полезно как для учреждений системы профессионального образования, так и для заинтересованных работодателей.
Или предсказать складывающийся переизбыток специалистов, которым в скором времени потребуется переобучение. Зная их профиль, можно заранее порекомендовать им близкую по роду деятельности профессию, на которую есть достаточный спрос в их городе.
Точное определение реальных профессий и должностей как среди вакансий, так и среди соискателей позволяет формировать целостные представления об этих профессиях в виде формирования:
- «цифрового портрета профессий» – с описанием требуемых профессиональных навыков и компетенций, образования, предлагаемых условий труда, зарплатных предложений, распространенного графика работы и т.п.
- «цифрового портрета специалиста» – с зарплатными ожиданиями соискателей, их реальной квалификацией, с половозрастными характеристиками и т.д.
Формирование цифровых портретов происходит в автоматическом режиме, в онлайн-формате, как по стране в целом, так и для каждого конкретного города. Подробнее о портретах профессий и соискателей в разделе «Научно-методическая основа».
Отслеживание динамики изменений этих портретов выявляет скрытые и малозаметные тренды рынка труда, что открывает просторы для возможностей предиктивной аналитики.
Где это работает и что мне с этого?
Сейчас Магуча используется специалистами АНО «Центр научных исследований в сфере профориентации и психологии труда» (crcg.ru) в рамках проектов «Цифровая модель рынка труда» и сайта «Рынок труда в РФ» (rutrud.com).
Вы можете заказать исследовательскую работу (есть бесплатные и платные варианты сотрудничества) на странице https://rutrud.com/our-services или присоединиться к нашим исследованиям https://crcg.ru/join, или стать частью нашей команды https://paramult.ru/welcome.
Что дальше?
Как и любой другой язык, Магуча развивается и трансформируется. Появляются новые слова (в виде названий новых специальностей, новых трудовых функций, новых компетенций — а точнее их синонимов), меняется структура баз данных у источников — job-сайтов.
Одна из наибольших сложностей использования Магучи — это требуемые вычислительные ресурсы. Задействовать все возможности программы — весьма дорогостоящее удовольствие.
В новой версии программы (Магуча 2.0) мы планируем существенным образом оптимизировать код, повысить его работоспособность.
Кроме этого, обсуждается принципиально новый подход к онтологическому описанию профессий и компетенций (см. «Таксономия» в разделе «Научно-методическая основа»), чтобы упростить включение новых сущностей, появляющихся в текстах вакансий и резюме.
Обсуждается и последующая версия программы (Магуча 3.0), в которой для обработки данных используется обученная нейросеть, а также расширяются возможности онтологии и лингвистики программы для чтения смежных баз данных, например, налоговой статистики, статистики Росстата и других.