Online Coding Test в BCG GAMMA

Андрей Седов, дата-сайентист BCG GAMMA
Андрей Седов, дата-сайентист BCG GAMMA

Недавно мы рассказывали про Online Coding Test. Сегодня дата-сайентист BCG GAMMA Андрей Седов рассказывает более подробно о составляющих теста, о том, как правильно на нем распределить время и какие ошибки чаще всего совершают кандидаты.

Что представляет собой Online Coding Test?

Online Coding Test состоит из 8-10 заданий, сгруппированных вокруг бизнес-проблемы, и включает в себя несколько типов заданий:

• Задания на программирование: необходимо сделать аналитические расчеты по табличным данным, рассчитать признаки, обучить модель, оценить метрики. В таких задачах оценивается не столько правильный ответ, сколько качество самого кода, поэтому я рекомендую оставлять больше комментариев для проверяющего.

• Вопросы с вариантами ответов: задачи на знание статистики и принципов работы алгоритмов.

• Вопросы с открытым ответом: задания на понимание теории алгоритмов, а также вопросы, связанные с бизнес-логикой конкретного кейса.

Сколько длится Online Coding Test? Как правильно распределить на нем время?

Тест проводится на платформе HackerRank и длится два часа.

Задания имеют разное количество баллов — задания на программирование приносят больше баллов, поэтому лучше начинать с них. Задания с вариантами ответов и открытыми вопросами оцениваются примерно одинаково.

Перед прохождением Online Coding Test лучше попробовать решить несколько тестовых задач на сайте HackerRank, чтобы привыкнуть к платформе.

Что необходимо повторить перед прохождением теста?

Я рекомендую разделить подготовку по следующим блокам.

Статистика:

— общие определения и базовые расчеты для математического ожидания, дисперсии, корреляции между выборками.

Библиотеки для анализа данных (Pandas, Sklearn, Numpy):

— расчеты на табличных данных,

— группировка данных в разных разрезах,

— разделение выборок для обучения модели.

Обучение моделей:

— избежание утечки данных из будущего,

— оценка важности признаков для разных алгоритмов,

— оценка связи между разными признаками,

— алгоритмы кластеризации и принципы их работы,

— алгоритмы снижения размерности, принципы их работы и ограничения.

Оценка качества моделей и метрики:

— оценка модели, построенной на несбалансированной выборке.

Какие ошибки кандидаты совершают чаще всего при прохождении Online Coding Test?

  1. Неправильно распределяют время и тратят усилия на задачи, которые приносят меньше баллов. Чтобы этого избежать, лучше всего в начале сосредоточиться на задачах по программированию, поскольку за них дается больше половины баллов.
  2. Не обращают внимания на метрики оценки качества модели и риск утечки данных из тестовой выборки в заданиях с обучением модели.
  3. Совершают мелкие технические ошибки, за которые могут сниматься баллы. Во время проверки оценивается качество кода, и, например, неправильная формула расчета какого-либо признака для модели может лишить нескольких баллов.

Моя общая рекомендация для прохождения теста — писать больше комментариев к коду. Но вместо описания того, что делает код, лучше описывать, почему выбрана именно такая реализация.

Узнать подробнее про процесс отбора на стажировку в BCG GAMMA можно здесь.

Подать заявку можно по ссылке: http://on.bcg.com/BCGGAMMAInternship.

Срок подачи заявок — 27 октября 2021 года. Мы ждем вас!

382 views·5 shares