Читая эту статью наткнулся на интересное замечание. В 1973 году английский математик Francis Anscombe привел пример того как немедленный статистический анализ данных(без предварительной визуализации) может привести к неправильным выводам о свойствах этих данных. На следующей картинке проиллюстрированы четыре набора данных с очень близкими значениями статистик:

Среднее значение переменной x = 9.0
Дисперсия переменной x = 11,0
Среднее значение переменной y = 7,50 (с точностью до двух значащих цифр после запятой)
Дисперсия переменной y = 4,122 или 4,127 (с точностью до трех значащих цифр после запятой)
Корреляция между переменными x и y = 0,816 (с точностью до трех значащих цифр после запятой)
Уравнение регрессии: y = 3,00 + 0.500 * x (с точностью до двух и трех значащих цифр после запятой соответственно)
Дисперсия переменной x = 11,0
Среднее значение переменной y = 7,50 (с точностью до двух значащих цифр после запятой)
Дисперсия переменной y = 4,122 или 4,127 (с точностью до трех значащих цифр после запятой)
Корреляция между переменными x и y = 0,816 (с точностью до трех значащих цифр после запятой)
Уравнение регрессии: y = 3,00 + 0.500 * x (с точностью до двух и трех значащих цифр после запятой соответственно)
Сами данные можно найти по ссылке : Wiki
PS: Как часто бывает, данные/определения в английской и русской версиях отличаются)
Извиняюсь, что здесь пишу. Какую книгу Вы бы порекомендовали по data mining в SAS Enterprise Miner и SAS Base и общим принципам работы в программе для перевода на русский?
Здравствуйте! Сам я ни одной книги по SAS не читал, изучал все по документации. А книги по которым изучал Data Mining никак не связаны с SAS 🙂 Может быть кто-нибудь из читатетелей или других аторов блога что-то конкретное порекомендует. От себя напишу что судя по рейтингам и обзорам одна из самых хороших книг для новичков — The Little Sas Book. Книг по приложениям SAS в прикладной статистике, прогнозированию, Data Mining довольно много и всех их можно найти по категорям на официальном сайте SAS. Также я попытался собрать линки на полезные ресурсы в одном месте тут (там же и линк на упомянутую книгу): http://www.reddit.com/r/sas_ru/comments/2awryo/faq_useful_links/
Ясно. Спасибо. Little SAS уже заканчиваю переводить, а по Data Mining приглядываюсь к Randall Matignon Data Mining Using SAS Enterprise. Вообще хорошее дело делаете, на фоне закрытости Института SAS
Если Вы не против, то я бы добавил пару линков с вашего блога (например про RF) в сабреддит http://www.reddit.com/r/sas_ru (Да и ссылку на весь блог в полезные ресурсы тоже)
да, разумеется
А Вы планируете публиковать перевод? Если да, то когда примерно? Это будет электронная книга или бумажный вариант?
Перевод SAS Little Book почти готов. Applied Analitics Using SAS EM готов полностью. Но тут возникла такая вещь как авторские права. По сути, все авторские права у SAS как издателя книг, а мы — нарушители. Кроме того, с переводом нам помогали сотрудники SAS Институт без полученного разрешения и выложить это в сети — подставить их. Поэтому пока в подвешенном состоянии.
подскажите, а как-то можно у вас узнать о переводе SAS Little Book?
Этот перевод есть возможность увидеть?