HR

Как спрогнозировать вероятность увольнения сотрудника и получить еще миллион инсайтов из одного графика

Что если существует метод HR-анализа, который способен спрогнозировать вероятность увольнения сотрудника на испытательном сроке?

Мало того, этот метод позволит вам оценить качество разных источников кандидатов, а еще выявит проблемные места в процессе адаптации, оценит эффективность подбора и даст много других выводов о жизненном цикле сотрудника в компании. И для его использования вам необязательно иметь степень по математике или разбираться в анализе данных. Он доступен всем и каждому. Заинтригованы и хотите узнать больше? 

В таком случае представляем вам его величество График выживаемости.

График выживаемости, или график Каплана-Мейера (Kaplan-Meier plot), пришел к нам из медицинских исследований и был разработан для оценки выживаемости пациентов в процессе лечения. Да-да, все серьезно, врачи хотели понять, как то или иное лечение (или его отсутствие) влияет на выживаемость пациентов с течением времени.

Позже этот метод стали применять в исследованиях как довольно универсальный инструмент по анализу конечных состояний процессов и вероятности их наступления. 

Ниже мы научимся строить график выживаемости на базе Excel и интерпретировать результаты наблюдений. Мы сознательно не будем использовать R, Python и более сложные стат. расчеты, для того чтобы сделать инструмент доступным для практиков без знаний в анализе данных.

Так для чего он мне нужен?

Этот метод применяется для очень разных задач, вот несколько из них:

  1. Оценка вероятности увольнения сотрудника с течением времени.

  2. Оценка эффективности процесса адаптации в компании.

  3. Оценка эффективности работы функции подбора.

  4. Оценка качества источников подбора.

  5. Расчет средних показателей жизненного цикла сотрудника в компании и многое другое.

Ну предположим, а что нужно, чтобы его сделать?

Немного данных, Excel и щепотка магии (с последним поможем мы).

Ладно, давайте, рассказывайте

Начнем с простого. Предположим, вы хотите оценить качество работы функции подбора и адаптации. Для этого вы собрали информацию о наймах в компании за период в 3 месяца из одного источника кандидатов. При этом неважно, сколько сотрудник проработал фактически — все три месяца или один день. Получившийся массив данных представим в виде таблицы:

Пока ничего сложного: есть дата, когда сотрудник начал работать в компании, дата, когда покинул ее, и количество недель, которые он отработал. Если сотрудник продолжает работать, у него не будет даты увольнения и количества отработанных недель. 

Теперь начнем расчеты. Для этого рядом построим еще одну таблицу, которая будет иметь следующие поля:

  • сотрудник — это имя сотрудника, который уволился в период времени t;

  • время (t) — это порядковый номер недели, в которую произошло увольнение;

  • кол-во сотрудников (n) — это количество сотрудников, которые участвуют в нашем эксперименте в момент времени t;

  • кол-во уволившихся (d) — это количество уволившихся сотрудников в момент времени t;

  • доля сотрудников, переживших момент t (ft) — это расчетная величина. Ее формула: (n-d)/n;

  • выживаемость, S(t) — это тоже расчетная величина. Ее формула: f*S(t-1).

Начнем заполнять таблицу:

В первой строке время (t) будет равно 0 — эксперимент начался, а выживаемость равна 1 (или 100%).

В первую неделю (строка 3) у нас увольняется один сотрудник. Время (t) — это порядковый номер недели, он первый. Кол-во сотрудников в этот момент (то есть на первой неделе), за которыми мы наблюдаем, — 10 человек. Уволился из них на первой неделе — 1 человек.

Доля сотрудников, переживших первую неделю работы: (10 – 1)/10 = 0,9 (или 90%). Выживаемость по формуле: 0,9*1,0 = 0,9 (или 90%).

Переходим к следующему уволившемуся (Сотрудник 10) на второй неделе и заполняем по аналогии всю таблицу, то есть по всем сотрудникам, которые уволились.

Те, кто не уволился и доработал до конца эксперимента — трех месяцев наблюдений, остаются как есть, с ними мы ничего не делаем. 

Фух. Вы все еще с нами? Отлично, самая сложная часть позади.

Теперь построим график. Выберем точечную диаграмму с прямыми отрезками. В качестве значения по оси X укажем время (t), в качестве значения по оси Y — выживаемость, S(t). А на выходе получим график выживаемости: 

Как читать этот график

Ось Y — это доля сотрудников, которые продолжают работать в компании к моменту времени t.

Ось X — это время (недели).

С течением времени доля сотрудников, работающих в компании, уменьшается. К седьмой неделе график обрывается — это последнее увольнение, до конца эксперимента других увольнений не было. Все оставшиеся сотрудники продолжают работу.

Как его интерпретировать

Даже в своем исходном виде этот график дает нам несколько интересных выводов:

  1. Половина новых сотрудников компании увольняется в течение первых 4 недель работы. Проблемы с адаптацией? Стоит разобраться и сформулировать гипотезу.

  2. Вероятность прохождения испытательного срока составляет всего 30%. Еще один важный вывод. А это уже повод задуматься о качестве подбора. 

  3. Доля увольнений на пятой неделе работы резко возрастает и соответствует почти половине всех доживших к этому моменту сотрудников. Видимо, на пятой неделе происходит какое-то событие, которое резко снижает вероятность прохождения срока испытания. Какое и почему? Стоит проанализировать.

Все эти инсайты позволяют корректировать работу функции подбора и адаптации и дают возможность прогнозировать вероятность увольнения сотрудника из компании на любом этапе его работы (sic!).

Это все?

Нет, это только начало. Ведь у наших сотрудников есть огромное количество характеристик, которые их определяют (пол, возраст, источник найма, должность и пр.)

Так, например, если мы распределим всех исследуемых сотрудников по источникам найма, то сможем оценить качество каждого из источников

Теперь мы видим, что текучесть по источнику 2 в рассматриваемом периоде меньше, чем по источнику 1, а значит, источник 2 на этом отрезке времени более эффективен, чем источник 1.

Представьте, какое пространство для анализа нам это открывает.

Мы можем анализировать разные категории сотрудников, сотрудников по полу и возрасту, по структурному подразделению, по результативности и прочее. А если пойти еще дальше, то можем определять влияние тех или иных характеристик на «дожитие» сотрудников (впрочем, это уже потребует известной сноровки и владения более сложными методами анализа типа регрессии Кокса).

Наконец, если взять в качестве исследуемого периода не три месяца, а, например, три года, и посмотреть на выживаемость персонала за этот период, то вы откроете для себя массу интересных инсайтов о жизненном цикле сотрудника в компании.

Безусловно, у этого метода, как и любого другого, есть свои ограничения и особенности, которые необходимо учитывать в работе с ним. Это и особенности анализа больших массивов данных, и интерпретация данных в конце наблюдений, и специфика регрессионных моделей при анализе дожития.

Но, даже не погружаясь в эти детали, график Каплана-Мейера — это крайне полезный и легкодоступный инструмент, способный существенно расширить ваши возможности по анализу персонала компании. Еще больше инструментов и методов доступно на курсе Яндекс Практикума по HR-аналитике.

Курс «HR‑аналитика»

За 3 месяца разовьете аналитические навыки, которые помогут вам продвигаться в карьере

Реклама: АНО ДПО «ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ ЯНДЕКСА», ИНН 7704282033, erid: LjN8K5kmC

Начать дискуссию