Online Coding Test в BCG GAMMA
Недавно мы рассказывали про Online Coding Test. Сегодня дата-сайентист BCG GAMMA Андрей Седов рассказывает более подробно о составляющих теста, о том, как правильно на нем распределить время и какие ошибки чаще всего совершают кандидаты.
Что представляет собой Online Coding Test?
Online Coding Test состоит из 8-10 заданий, сгруппированных вокруг бизнес-проблемы, и включает в себя несколько типов заданий:
• Задания на программирование: необходимо сделать аналитические расчеты по табличным данным, рассчитать признаки, обучить модель, оценить метрики. В таких задачах оценивается не столько правильный ответ, сколько качество самого кода, поэтому я рекомендую оставлять больше комментариев для проверяющего.
• Вопросы с вариантами ответов: задачи на знание статистики и принципов работы алгоритмов.
• Вопросы с открытым ответом: задания на понимание теории алгоритмов, а также вопросы, связанные с бизнес-логикой конкретного кейса.
Сколько длится Online Coding Test? Как правильно распределить на нем время?
Тест проводится на платформе HackerRank и длится два часа.
Задания имеют разное количество баллов — задания на программирование приносят больше баллов, поэтому лучше начинать с них. Задания с вариантами ответов и открытыми вопросами оцениваются примерно одинаково.
Перед прохождением Online Coding Test лучше попробовать решить несколько тестовых задач на сайте HackerRank, чтобы привыкнуть к платформе.
Что необходимо повторить перед прохождением теста?
Я рекомендую разделить подготовку по следующим блокам.
Статистика:
— общие определения и базовые расчеты для математического ожидания, дисперсии, корреляции между выборками.
Библиотеки для анализа данных (Pandas, Sklearn, Numpy):
— расчеты на табличных данных,
— группировка данных в разных разрезах,
— разделение выборок для обучения модели.
Обучение моделей:
— избежание утечки данных из будущего,
— оценка важности признаков для разных алгоритмов,
— оценка связи между разными признаками,
— алгоритмы кластеризации и принципы их работы,
— алгоритмы снижения размерности, принципы их работы и ограничения.
Оценка качества моделей и метрики:
— оценка модели, построенной на несбалансированной выборке.
Какие ошибки кандидаты совершают чаще всего при прохождении Online Coding Test?
- Неправильно распределяют время и тратят усилия на задачи, которые приносят меньше баллов. Чтобы этого избежать, лучше всего в начале сосредоточиться на задачах по программированию, поскольку за них дается больше половины баллов.
- Не обращают внимания на метрики оценки качества модели и риск утечки данных из тестовой выборки в заданиях с обучением модели.
- Совершают мелкие технические ошибки, за которые могут сниматься баллы. Во время проверки оценивается качество кода, и, например, неправильная формула расчета какого-либо признака для модели может лишить нескольких баллов.
Моя общая рекомендация для прохождения теста — писать больше комментариев к коду. Но вместо описания того, что делает код, лучше описывать, почему выбрана именно такая реализация.
Узнать подробнее про процесс отбора на стажировку в BCG GAMMA можно здесь.
Подать заявку можно по ссылке: http://on.bcg.com/BCGGAMMAInternship.
Срок подачи заявок — 27 октября 2021 года. Мы ждем вас!