HR ML Автоматизация

Нейросети найдут нам работу?

 

Все мы уже знаем, как тяжело составлять сотни откликов на вакантные места и не получать ответов…

 

А ведь рынок труда – это все еще рынок, который подлежит анализу, а значит автоматизации. 

 

Тысячи сотрудников могут получить свое законное рабочее место, а компании сэкономить на целых отделах HR.

О таком стартапе, который готов предоставить огромную площадку рынка труда с ИИ-автоматизацией и пойдет речь в новом обзоре.

 

Входные данные, поступающие в систему RSight® от соискателей и работодателей, представляют собой разнообразные и высокоразмерные информационные массивы, включающие текстовые данные (например, резюме и описания вакансий), числовые данные (зарплатные ожидания и опыт работы), а также категориальные данные (отрасль, регион или уровень квалификации).

 

 

Для того чтобы эффективно обрабатывать и извлекать полезную информацию из этих данных, система использует алгоритмы кластеризации и классификации, которые играют центральную роль в процессе аналитической обработки.



Алгоритмы кластеризации, такие как k-средних (k-means), иерархическая кластеризация или методы, основанные на плотности данных, например, DBSCAN (Density-Based Spatial Clustering of Applications with Noise), применяются для сегментации данных на группы или кластеры, которые имеют схожие характеристики. 

 

В контексте RSight® кластеризация может быть использована для группировки соискателей по общим признакам, таким как профессиональный опыт, навыки, образование или предпочтения в трудоустройстве. 

 

Например, кандидаты с опытом работы в IT-сфере могут быть сгруппированы в один кластер, в то время как кандидаты с опытом работы в маркетинге — в другой. Это позволяет системе предложить наиболее релевантные вакансии для каждого сегмента кандидатов.

 

Технически, при кластеризации алгоритмы работают в многомерных пространствах признаков, где каждый кандидат или вакансия представляет собой точку с координатами, соответствующими значению различных атрибутов. 

 

Алгоритм k-средних, например, работает путем итеративного назначения точек к k центроидам (центральным точкам кластеров) и обновления этих центроидов до тех пор, пока кластеризация не станет стабильной. Иерархическая кластеризация, с другой стороны, создает дерево кластеров, начиная с индивидуальных точек данных и объединяя их в более крупные кластеры на каждом уровне.

 

Алгоритмы классификации, такие как логистическая регрессия, деревья решений (decision trees), случайные леса (random forests) или градиентный бустинг, применяются для категоризации данных на основе обучающей выборки, где классы известны заранее. 

 

В системе RSight® классификация используется для определения соответствия кандидатов определенным вакансиям, выявления наиболее подходящих кандидатов для конкретных ролей или предсказания успеха кандидата на собеседовании. 

 

Например, на основе данных о прошлых наймах и характеристик успешных кандидатов, система может предсказать вероятность того, что новый кандидат будет принят на работу, или классифицировать кандидатов по уровню соответствия конкретной вакансии (высокий, средний, низкий).

 

Технически, классификация начинается с этапа обучения модели на размеченных данных, где каждый экземпляр данных (например, резюме кандидата) сопоставляется с известным результатом (например, успешное трудоустройство). 

 

Модель обучается на этих данных, вырабатывая правила или веса для различных признаков, которые затем используются для классификации новых, ранее невиданных данных. Важным этапом классификации является выбор и обработка признаков (feature selection and engineering), где из исходных данных извлекаются и преобразуются наиболее значимые для задачи характеристики, что существенно влияет на точность и эффективность модели.



Рекуррентные нейронные сети играют ключевую роль в анализе временных последовательностей данных, что особенно важно в контексте подбора персонала, где исторические данные и поведенческие паттерны соискателей и работодателей являются важными факторами для предсказания будущих событий.

 

Рекуррентные нейронные сети, в отличие от традиционных нейронных сетей, имеют внутренние петли, которые позволяют сохранять и учитывать информацию из предыдущих шагов при обработке текущих данных. Это особенно полезно для задач, связанных с анализом временных рядов и последовательностей, где важно учитывать не только текущее состояние, но и предшествующие события.


В контексте работы агрегатора RSight®, RNN обрабатывают последовательности действий соискателей и работодателей — например, предыдущие поисковые запросы, реакции на предложенные вакансии или изменения в предпочтениях пользователей. Это позволяет системе строить прогнозы на основе того, как те или иные параметры влияли на результат в прошлом.

 

Такие нейронные сети могут, например, учитывать изменения на рынке труда, что отражается в колебаниях спроса на определенные навыки или профессии. Агрегатор анализирует эти изменения и на основе собранных данных корректирует свои рекомендации, чтобы они оставались актуальными в условиях постоянно меняющейся среды. 

 

Более того, RNN способствуют пониманию сложных зависимостей между различными параметрами, такими как опыт работы, уровень образования, профессиональные навыки и региональные особенности рынка труда. Эти зависимости используются для того, чтобы рекомендовать кандидатам вакансии, которые с наибольшей вероятностью будут им интересны, а работодателям — кандидатов, которые с высокой вероятностью удовлетворят их требования.



Модели прогнозирования, используемые в системе, включают в себя не только RNN, но и другие методы машинного обучения: градиентный бустинг или регрессионные модели, которые помогают предсказывать различные метрики, включая время до заполнения вакансии (TTF) или вероятность успешного трудоустройства кандидата. 

 

Эти прогнозы основаны на большом количестве факторов, включая исторические данные, демографические характеристики кандидатов, поведение пользователей на платформе, а также макроэкономические условия через уровень безработицы или экономические тенденции в конкретном регионе.

 

Например, если предложенная кандидату вакансия привела к успешному трудоустройству, система получает положительное подкрепление и стремится повторить этот результат в будущем. Если же рекомендация оказалась неуспешной, алгоритм адаптирует свои стратегии, чтобы избежать подобных ошибок.

 

Они могут учитывать, как выбор одной вакансии или кандидата влияет на последующие решения и результаты. Это особенно важно в процессе подбора персонала, где каждый шаг может влиять на конечный результат, будь то выбор подходящего кандидата или принятие предложения о работе.

 

При проведении масштабного подбора персонала в определенном регионе инструмент RSight® предоставляет обширный набор данных, который существенно облегчает процесс управления подбором и принятие стратегических решений. 

 




В частности, платформа позволяет получить точные и актуальные данные по ключевым метрикам, таким как предполагаемое время заполнения вакансий (Time to Fill — TTF), количество кандидатов на одного нанимаемого сотрудника (Candidates per Hire — CPH), а также человеческие усилия, выраженные в человеко-днях (Man-Days — MD). 

 

Эти метрики играют важную роль в построении эффективных процессов рекрутинга, позволяя предвидеть и минимизировать возможные риски и затраты, а также оптимизировать ресурсы, необходимые для достижения поставленных целей.

 

Предполагаемое время заполнения вакансий (TTF) помогает оценить, насколько быстро организация может закрыть определенные позиции. 

 

В контексте массового подбора в конкретном регионе знание этой метрики позволяет прогнозировать сроки завершения набора и, соответственно, более эффективно планировать рабочий процесс, избегая длительных простоев или нехватки кадров. 

 

Через точную оценку TTF, компании могут своевременно адаптировать свои стратегии подбора, учитывая как внутренние, так и внешние факторы, влияющие на процесс: от зарплат до выбора каналов подбора агентов. 



Метрика количества кандидатов на одного нанимаемого сотрудника (CPH) дает представление о конкурентоспособности и эффективности процесса подбора. 

 

 

Высокий CPH говорит жесткой конкуренции за вакансии или о необходимости пересмотра критериев отбора, в то время как низкий CPH может указывать на дефицит квалифицированных кандидатов или недостаточно эффективные каналы привлечения. 

 

Понимание этого показателя позволяет корректировать стратегии найма, включая улучшение процессов отбора, совершенствование методов оценки кандидатов, а также возможное расширение поиска на новые рынки труда (если конкуренция кажется завышенной).

 

Человеческие усилия, измеряемые в человеко-днях (MD), отражают объем трудозатрат, необходимых для проведения процесса подбора персонала. Высокие значения MD могут свидетельствовать о необходимости автоматизации определенных этапов подбора или о повышенной сложности вакансий, что требует дополнительных ресурсов.

К слову, MD — один из самых высоких показателей именно в IT. К слову, именно поэтому подобные проекты будут только набирать свои обороты, ведь практически вся IT сфера держится на HR – в айтишке главное не ресурсы, а кадры.