«Грантники»
08/09/2022
Анализ списка образовательных грантов 2022 года
Недобор
Почему присуждаются не все выделенные государством гранты?
В этом году школу окончили 171 тыс. казахстанских выпускников, из которых 154 тысячи сдавали единое национальное тестирование. Пороговый балл не смогла преодолеть одна треть участников тестирования, остальные 103 тысяч выпускников набрали необходимый минимум в 50 баллов. Но только 80% или порядка 80 тысяч из них подали документы для получения государственных образовательных грантов.

На основе опубликованного списка обладателей грантов я планировал выяснить ответы на такие вопросы как: на какую специальность сложнее всего поступить, в какой ВУЗ выделено больше всего бюджетных мест, какой средний балл у обладателей гранта, какой ВУЗ собрал больше всех умников и другую полезную для будущих выпускников информацию.

Однако в итоге выяснил другие интересные детали.
Во-первых, предполагалось, что будут распределены 75 тысяч грантов. Но в опубликованном списке оказалось всего 56 тысяч грантников. Одной из возможных причин недобора являются низкие баллы. К примеру, по таким программам как «рыбное хозяйство», «магистральные сети и инфраструктура», «агроинженерия», «растениеводство» и множеству других можно было получить грант, набрав всего 50 баллов.

Во-вторых, государство выделило около 10 тысяч целевых грантов для выпускников двух западных областей, но присуждено всего 2294 или не более 23%. Причина в низких баллах выпускников Атырауской и Мангистауской областей?

В-третьих, сельская квота и квоты для отдельных категорий граждан (в том числе из социально-уязвимых слоев населения) составляют почти четверть всех выданных грантов.

Анализ был проведен с использованием инструментов MS Excel, MS Power BI и DAX.

1
Про список грантников
Пару слов об объекте исследования
Единое национальное тестирование (ЕНТ) – одна из форм отборочных экзаменов для поступления высшие учебные заведения страны. Участникам ЕНТ дается 120 тестовых заданий, из них по истории Казахстана – 15, по математической грамотности – 15, по грамотности чтения – 20 и по двум профильным предметам по 35 заданий.

Максимально возможная оценка – 140 баллов, так как в некоторых тестовых заданиях по профильным предметам начисляются по 2 балла за верный ответ.

Здесь нужно сделать небольшое уточнение, так как те, кто подавали на сокращенное обучение сдавали тесты в усеченном виде, поэтому максимальный балл у них в два раза меньше (70).
Сокращенное обучение дает возможность получить степень бакалавра после среднего профессионального образования в сокращенном виде за 2-3 года по родственным специальностям.

Поэтому для исключения влияния низких баллов сокращенного обучения расчеты среднего, медианы, моды, стандартного отклонения и других «счетных» показателей осуществлены без баллов грантников сокращенного обучения. В остальных случаях, когда речь идет о повторяемости имен, фамилий и др. этот список учтен.



В опубликованном списке оказалось не 73 тыс. грантов, а 56 тыс. или на 23% меньше.
Исходная таблица
Исходный документ – 1450 страничный PDF-файл с неоднородными таблицами в 4 или 5 столбцов и предполагаемым количеством строк более 70 тысяч. Именно столько, как было заявлено, государство выделило грантов в 2022 году.

Основное затруднение в очистке и подготовке данных к анализу было вызвано тем, что список грантников шел не сплошной таблицей, а небольшими разрозненными кусками, поэтому сразу загрузить весь документ в Power Query не удалось из-за технических ограничений.
Была предпринята попытка разделить файл на 10-20 частей, но проблема сохранялась. Поэтому для начала решено было сконвертировать PDF-документ в Docx, далее я разделил документ на несколько частей, которые загрузил в Excel обычным копированием. Следующим шагом стали небольшие манипуляции в полученном Excel файле и конечная очистка была произведена в Power BI.
Поле ИКТ (индивидуальный код тестируемого) в исходном документе идеально подошло в качестве первичного ключа основной таблицы с ФИО грантников и набранными баллами.
Далее были созданы две дополнительные таблицы «ID_University» и «ID_Programm» с соответствующей информацией. Таблица со списком университетов также содержит город, в котором они расположены.
Дальнейшие расчеты, результаты которых будут ниже, были сделаны в Power BI и Excel.

Квоты
При анализе всей таблицы с грантами было выявлено более 10 различных квот для отдельных категорий молодежи, что говорит о широкой поддержке выпускников, в частности из социально-уязвимых слоев населения. Кроме того, одной из мер поддержки жителей из западных областей в центр является наличие отдельных квот для Мангистауской и Атырауской областей.

  • Обладатели грантов по общему конкурсу
  • Сельская квота
  • Квота для выпускников из Атырауской области
  • Квота для выпускников из Мангистауской области
  • Список обладателей грантов, прошедших на сокращенную форму обучения (после ПТУ или с высшим образованием)
  • Квота для детей-сирот и детей, оставшихся без попечения родителей, а также для молодежи, потерявших или оставшихся без попечения родителей до совершеннолетия
  • Квота для граждан из числа с инвалидностью первой или второй группы, лиц с инвалидностью с детства, детей с инвалидностью
  • Квота для лиц, ветеранов боевых действий на территории других государств, приравненных по льготам к ветеранам ВОВ

  • Квота для детей из семей, в которых воспитывается четыре и более несовершеннолетних детей
  • Квота для детей из числа неполных семей, имеющих данный статус не менее трех лет
  • Квота для детей из семей, воспитывающих детей с инвалидностью с детства, лиц с инвалидностью первой или второй группы
  • Квота для лиц казахской национальности, не являющихся гражданами РК

Поэтому в анализируемой таблице квоты сгруппированы следующим образом:
  • Общий конкурс
  • Сельская квота
  • Квота для выпускников из Атырауской области
  • Квота для выпускников из Мангистауской области
  • Сокращенная форма обучения
  • Квота для отдельных категорий


2
Тысяча Аружан и пять Қасымжомартов
Или сколько грантников с одинаковыми именами?
  • 56 059

    Всего грантников
  • 27 314

    Уникальных фамилий
  • 6 775

    Уникальных имен
  • 13 475

    Уникальных отчеств
  • Турсунмухаммадова

    Самая длинная фамилия
  • Нұрмұһаммад-Сұлтан

    Самое длинное имя
  • Оразалы-Қалиханұлы

    Самое длинное отчество
Полные тезки
В списке грантников присутствуют 11 человек с полностью совпадающими фамилией, именем и отчеством.
При этом уникальное комбо собрал Торайгыров Университет. Гранты в этом учебном заведении получили две полные тезки Ибраевы Дильназ Маратовны (Информационные технологии и Наука о земле) и оба Паршукова Данилы Денисовича (Архитектура и Горное дело).
Тезки по фамилии и имени
В списке найдено 836 совпадений фамилии и имени. Можно было посмотреть куда они поступили. Например, все шестеро Сатыбалды Аружан будут учиться в разных университетах. В списке грантников даже есть такие, у которых помимо одинаковых имени и фамилии совпадает набранное число баллов. Таких набралось аж 12 пар. Например обе Турарбек Анель набрали по 123 балла.
Самые популярные и самые «умные» имена
Аружан – самое популярное имя среди «грантников». Таких в списке оказалось 1305 человек. В таблице ниже приведены первые 100 самых популярных имен. Столбец «Процент от общего среднего» – это отношение среднего балла группы выпускников с одинаковым именем к общему среднему баллу всех «грантников» – показывает какая группа имен лучше подготовилась к ЕНТ. Обладательницы грантов с именем Алуа (150 человек) в среднем показали результат на 9% лучше, в сравнении со всеми обладателями грантов.
При анализе и поиске совпадающих текстовых значений учитывалось их полное соответствие. Например, имена Адель (24 совпадений), Аделя (24), Аделия (14) и Аделья (2) считались отдельно, хотя очевидно, что речь идет об одном имени.
Баглан Айдашов
автор
Самые популярные женские имена
Аружан – самое популярное женское имя среди «грантников». Далее идут Аяулым, Дильназ, Диана и Айдана.
Самые популярные мужские имена
Диас, Ерасыл и Бекзат – топ-3 по популярности мужских имени обладателей образовательных грантов. Рахаты набирали в среднем на 3% больше всей совокупности грантников. Это лучший результат среди популярных мужских имен.
Популярные юнисекс имена
В таблице повторяются имена, которые относятся и к женскому, и мужскому полу. Самые популярные среди них Мерей (382 повтора), Нұрай (321), Шұғыла (211), Асылжан (126) и Айдын (117).


  • Читатель
    Есть ли в списке тезки президента?
    Аналитик
    Обладателей грантов с именем Қасымжомарт пять человек, двое с именем Касымжомарт и один Қасымжомартәлі. И всего один Токаев
  • Читатель
    А сколько Назарбаевых?
    Аналитик
    Четыре парня с фамилией Назарбаев и десять девушек с фамилией Назарбаева. Причем есть Назарбаев Нұрсұлтан, Назарбаева Дариға и Назарбаева Алия.
30 самых популярных фамилий
Ниже список из 30 часто повторяемых фамилий. Если проранжировать данную таблицу по среднему баллу, то обладатели грантов с фамилией Ким имеют наивысший средний балл. Из 59 Кимов пятеро поступили в КазНУ, еще по столько же в КБТУ и Astana IT University.

3
Куда поступить было легче всего?
И какой ВУЗ выбирали ребята с самыми высокими баллами?
Как было отмечено выше в этом году ввели формат сокращенного обучения. Поступающие тоже сдавали ЕНТ, но максимум они могли набрать 70 баллов. Поэтому далее для исключения влияния низких баллов сокращенного обучения расчеты количества распределенных грантов, среднего балла сделаны без баллов грантников сокращенного обучения. Это приемлемое на мой взгляд допущение, так как доля грантов для сокращенного обучения составляет всего 2.1%
Таблица показателей по квотам
Сельская квота и квоты для отдельных категорий граждан составляют почти четверть всех выданных грантов
  • 88.5

    Средний балл
  • 63%

    Доля среднего балла от максимально возможного
  • 87

  • 75

    Мода – балл, который встречается чаще остальных
На первые 12 ВУЗов приходится 48% всех выделенных грантов
На топ-25 ВУЗов приходится 75% из 56 тыс грантов
Топ-25 ВУЗов по количеству грантов
Ранжированных по среднему баллу гранта. Сложнее всего поступить на бюджет в КБТУ
На первые 10 специальностей приходится 38% всех присужденных грантов
Порядка 7,5 тысяч или 14% от всего количества присужденных грантов на две специальности информационные технологии и информационная безопасность
Самый высокий средний проходной балл у стоматологии
На специальность «Стоматология» в текущем году выделено всего 20 грантов, половина из которых пришлись на Медицинский университет Астана. В топе по среднему проходному баллу также международные отношения, фармация и финансы.
20 специальностей с самым минимальным средним баллом
Легче всего было получить грант обучение по специальности сельское хозяйство. При этом, скорее всего, грантов было выделено больше, но получили лишь те, кто набрал выше минимально-проходного балла.

4
Дополнительные гранты для выпускников западных областей
В начале года профильное министерство заявляло, что для выпускников западных областей будут выделены целевые гранты. Как они распределились?
В этом году впервые определен новый вид образовательного гранта – «Целевой образовательный грант для обучения в ведущих высших учебных заведениях молодёжи из густонаселённых и западных регионов». 10 тысяч абитуриентов из Атырауской и Мангистауской областей смогут получить целевые гранты для обучения в вузах. В конкурсе могут участвовать выпускники школ этого года. «В связи с увеличением количества образовательных грантов, в том числе целевого гранта «Атырау-Мангистау», список был опубликован сегодня. Надеюсь, абитуриенты на основе предоставленной информации сделают правильный выбор»

Руслан Емелбаев
Директор Национального центра тестирования
Попытки государства дать бесплатное высшее образование молодым людям Мангистауской и Атырауской областей – пока выглядят тщетными. Целевые гранты «Атырау-Мангистау» не освоились.
В публикациях средств массовой информации упоминалась цифра в 10 тысяч целевых грантов. При этом на Атыраускую область планировалось выделить 4 тысячи, а на Мангистаускую область – 6 тысяч грантов. Однако в анализируемой таблице всего 775 человек, прошедших по квоте Атырау и 1519 – по квоте Мангистау. При этом если сравнивать средние баллы, прошедших по этим квотам, то отмечается более низкие средние оценки в сравнении со всей генеральной совокупностью.
Распределение по специальностям
Открыт доступ к сырым данным