Конкурс по анализу данных (с использованием SAS University Edition)

Всем привет!

Спасибо Роману Волынец за предоставленную ссылку в группе Профессионалы SAS.

Описание задачи взято с ссылки ниже:

Предлагается решить задачу коллекторского скоринга.
Коллекторский скоринг – это вид скоринга, применяемый для взаимодействия с клиентами, отказывающимися от исполнения условий кредитного договора, т.е. отказываются погашать задолженность. Скоринг в этом случае необходим для определения приоритетности действий служащих коллекторского бюро при работе по возвращению “плохого” кредита.


Банк – организация, выдающая кредиты.

Коллекторское бюро (агентство) – организация, предоставляющая услуги по возврату просроченной задолженности.

Просроченная задолженность (просрочка) – не оплаченная в срок задолженность по основному долгу кредитного договора.

Набор предоставленных данных, аналогичен набору, предоставляемому банком коллекторскому бюро и разбит на два: тренировочный (с известным для решателей откликом) и тестовый с неизвестным откликом.

Данные
Тренировочная выборка содержит информацию о банковских займах, проданных коллекторскому агентству.  Для каждого ID займа приведены его характеристики, характеристики просрочки по займу, а также информация о заемщике. Последний столбец содержит целевую переменную (1 – заемщик производит выплаты по долгу, 0 – заемщик не производит выплаты по долгу)
По заданному тренировочному набору данных (обучающей выборке) необходимо разработать алгоритм, который для каждого ID займа из тестовой выборки позволит спрогнозировать вероятность того, что заемщик будет производить выплаты по долгу.

Обязательные требования к алгоритму:
Aлгоритм должен работать таким образом, чтобы получая на вход тренировочный и тестовый наборы данных в формате SAS, строилась модель прогнозирования вероятности возврата «плохого» долга, построенная модель должна применяться к тестовой выборке и результат записываться в файл Results в формате SAS, содержащем 2 колонки: ID и Prob,

  • где ID идентификатор заемщика,
  • Prob – вероятность возврата долга.

Допустимой средой разработки является исключительно продукт SAS University Edition, который можно установить бесплатно, скачав по ссылке.
Обязательные требования к выполнению работы:

  • ​​Единственным доступным языком программирования является SAS Base (дополнительно участник может предоставить вариант на SAS IML)
  • Единственной доступной для реализации модели библиотекой является SAS STAT (библиотека методов статистического анализа SAS)
  • Использование других библиотек и инструментов, в том числе, подключаемых в SAS (таких как R) или поставляемых с другими продуктами SAS — недопустимо
  • Использование внешних источников данных (например, находящейся в свободном доступе информации об экономическом состоянии регионов) допустимо, но должно явно указываться в описании алгоритма и не нарушать авторских и других прав обладателей информации.

http://algomost.com/ru/tasks/sas-collection-scoring

Удачи тем, кто решит поучаствовать в этом конкурсе!

Добавить комментарий

Войти с помощью: 

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.