SAS Information Maps. Базовая работа с информационной картой. Часть 2.

Продолжение первой части статьи по работе с информационными картами.

Основной выбор Level для числовых значений будет INTERVAL

Рассмотрим данные и их типы для таблицы CUSTOMER:
Cid – сущность таблицы. Идентификатор потребителя. Значения в таблице уникальны, и по этой причине использование Classification будет Category. Для обозначения сущности необходимо указать в значениях:
  • ·         level= ID,
  • ·         UseInSubjectId= Subject_Id_C (значение, которое будет использовано выше по иерархии  для обозначения сущности таблицы).
Ageвозраст. Level может быть Interval или Ordinal.
  • ·         Level = Interval
  • ·         Classification = Category
Gender – гендерная принадлежность (М Ж).
  • ·         Level = Nominal
  • ·         Classification = Category
State – штат проживания.
  • ·         Level = Nominal
  • ·         Classification = Category
Оставшиеся 3 элемента относятся ко второй таблице, речь о которой пойдёт чуть ниже. Тем не менее, этим элементам так же необходимо выставить значения уровня и классификации:
Hhid – идентификатор для таблицы HH.
  • ·         Level = Id
  • ·         Classification = Category
Hohageвозраст главы домохозяйства.
  • ·         Level = Interval
  • ·         Classification = Category
Hohgender – пол главы домохозяйства.
  • ·         Level = Nominal
  • ·         Classification = Category
Таким образом, получается следующая картинка:
 
С этого момента этой информационной картой можно работать в таких приложениях как SAS Customer Intelligence Studio, SAS Web Report Studio и т.д.

Далее, добавим вторую таблицу HH в Selected Resources:
Перейдём в закладку Relationships. Соединим hhid между двумя таблицами. Логика связи между таблицами определяется самими данными, в данном примере одному значению из таблицы Customer соответствует несколько значений из таблицы HH:
 
Добавим дополнительную таблицу в Information Map Contents:
 
На этом этапе видно, что в таблице HH отсутствует ключ Cid, по которому строится таблица CUSTOMER. По этой причине, для таблицы HH требуется определить отдельную сущность, по которой будет производиться выборки или отчёты. Определим сущность как Subject_ID_H.
На самом верхнем уровне заходим в настройки Sample Custom и добавляем параметры:
Subject_ID_H – значение сущности, которое будет отображаться в выпадающем списке при работе в Customer Intelligence Studio.  Используем: Household
Subject_Code_Subject_ID_H– уникальное двухзначное числовое значение, которое требуется для некоторых внутренних параметров в системе. Используем: 02
MetadataTable_Prefix_Subject_ID_C – значение, которое будет автоматически присвоено в начало названия у таблиц, содержащих метаданные. Используем: HH
К предыдущим параметрам также добавляются  параметры взаимодействия между таблицами:
From_Subject_ID_С_To_Subject_ID_H – связь между сущностями таблицы: Используем: ManyToOne
From_Subject_ID_H_To_Subject_ID_Cсвязь между сущностями таблицы: Используем: OneToMany
Таким образом стал выглядеть список параметров в Custom Properties:
На уровне Каталогов выставляем значение:
Subject_ID_H – Subject_ID_H
На уровне элементов выставляем по аналогии с таблицей CUSTOMER. Используем в качестве сущности Hhid.
Hhid :

  • ·         level= ID,
  • ·         UseInSubjectId= Subject_Id_H.
Customers in household кто живёт в домохозяйств.

  • ·         Level = Nominal
  • ·         Classification = Category
Hhincome– доход домохозяйства.

  • ·         Level = Interval
  • ·         Classification = Category
Opt out mail – отказ от получения почты (ДаНет).

  • ·         Level = Binary
  • ·         Classification = Category
Opt out phone – отказ от получения звонков по телефону (ДаНет)..

  • ·         Level = Binary
  • ·         Classification = Category
State – штат проживания.

  • ·         Level = Nominal
  • ·         Classification = Category
В случае использования метаданных в Customer Intelligence Studio, необходимо предварительно сгенерировать метаданные в плагине Customer Intelligence s SAS Management Console:
Информационная карта полностью готова к использованию в приложениях SAS
До скорых встреч!

SAS Information Maps. Базовая работа с информационной картой. Часть 1.

Всем привет!
Данная статья целиком и полностью посвящена работе в Information Map Studio 4.31 и всему, что с этим связано.

Работа с Information Maps начинается с работы в Management Console, а именно с управления библиотек:
Библиотеки, которые были созданы в Management Console, далее будут отображаться в Information Map Studio. С ними мы и будем работать:
 
Далее, для работы потребуется включить Custom Properties значений, а также их шаблоны. Это обязательный элемент при проектировании информационной карты. 
Заходим в Tools-> Options -> Advanced:
 
Ставим галочки дляCustom properties at start-up и находим шаблон matemplate.txt в SASHomeSASCustomerIntelligenceStudio 
 
MATemplate.txt необходим для удобства и для ускорения работы с Information Maps. Он позволяет в несколько кликов выбрать соответствующие параметры для любых полей. Более того, его можно редактировать индивидуально для каждого конкретного случая.
Для того чтобы изменения вступили в силу, необходимо перезапустить Information Map Studio.
В качестве примера будем использовать стандартную схему Marketing Automation Sample
Данная таблица представляет собой описание о потребителях и домохозяйствах, а также связи между ними. Сохраним информационную карту и добавим таблицы из существующей библиотеки в Selected Resources:
 
Перенесём таблицу CUSTOMER в Information Map Contents:
 
Рассмотрим обязательные значения:
MAMeta – указание библиотеки (синтаксис SAS), где будут храниться значения метаданных после их генерации. В нашем случае будет так: libname mametac:temp’; Очень важно не ставить слэш в концеc:temp’, иначе генерация метаданных не будет работать.
Subject_Default – значение сущности (обычно ключа) по умолчанию. Используем: Subject_ID_C
Subject_ID_C – значение сущности, которое будет отображаться в выпадающем списке при работе в Customer Intelligence Studio.  Используем: Customer
Subject_Code_Subject_ID – уникальное двухзначное числовое значение, которое требуется для некоторых внутренних параметров в системе. Используем: 01
MetadataTable_Prefix_Subject_ID_C – значение, которое будет автоматически присвоено в начало названия у таблиц, содержащих метаданные. Используем: Cust
Также есть необязательные значения. Хочу выделить одно:
Metadata – указание на создание метаданных на самом верхнем уровне. Это означает, если было выбрано, что генерируются метаданные, то они будут сгенерированы абсолютно для всех элементов, если не указано обратное. На этом уровне рекомендую установить значение NONE. Если же параметр Metadata не указан, то по умолчанию у него проставлено значение COUNTS, что может очень сильно сказаться на скорости обновления метаданных.
 
Под метаданными понимается заранее подсчитанные и сгенерированные значения для выборки в Customer Intelligence Studio. Бывает 3 варианта: без метаданных (NONE), со значениями (VALUES) и со счётчиками (COUNTS). Выбор генерации метаданных определяет удобство с одной стороны, с другой стороны же – количество времени, требуемое на обновление этих метаданных. 
Приведу примеры отображения метаданных в Customer IntelligenceStudio по характеристике Gender (пол):
 Без метаданных (NONE)