Корреляционный анализ — презентация
logo
Корреляционный анализ
  • Корреляционный анализ
  • Корреляционный анализ.
  • Элементы матрицы коэффициентов
  • Парная корреляция
  • Определение коэффициента парной корреляции
  • Упрощение расчетов
  • Заполняем таблицу
  • Статистическая значимость коэффициента
  • Построение уравнения регрессии
  • Анализ полученных результатов
  • Коэффициент парной корреляции
  • Множественная корреляция
  • Множественная корреляция
  • Коэффициент множественной корреляции
  • Для случая двух независимых переменных
  • Коэффициент парциальной корреляции
  • Оценка статистической значимости гипотезы
  • Пример:
  • Каноническая корреляция
  • Сущность и теоретические основы метода
  • Матрица значений исходных переменных
  • Подготовка информации и вычисления канонических корреляций
  • Вычисление канонических коэффициентов корреляции
  • Решение задачи
  • Находим максимальный коэффициент корреляции
  • Решение последнего уравнения
  • Расчет канонических корреляций 3 фактора 2 параметра оптимизации
  • Матрица исходных данных
  • Матрица ковариаций
  • Матрица парных коэффициентов корреляции
  • Вспомогательные матрицы
  • Вспомогательные матрицы
  • Корреляционный анализ
  • Канонические переменные
  • Проверка статистической значимости
  • Получение реальных коэффициентов
  • Выводы
1/37

Первый слайд презентации: Корреляционный анализ

Парная корреляция

Изображение слайда

Слайд 2: Корреляционный анализ

Он используется для установления статистических связей между параметрами оптимизации. Для множества объектов матрицу парных корреляций R получают в ходе следующих преобразований матриц: где Z – матрица стандартных значений, а ее элементы получают:

Изображение слайда

Слайд 3: Элементы матрицы коэффициентов

получают по данным матрицы частных корреляций. Коэффициент множественной корреляции R o представляет собой численную характеристику силы связей отклика со всеми факторами.

Изображение слайда

Слайд 4: Парная корреляция

Корреляционный анализ – метод установления статистических связей между выходными параметрами сложной системы. Коэффициент парной корреляции является мерой тесноты линейной связи между двумя случайными величинами. В общем случае его величина меняется от 0 до 1. Если коэффициент = 0, то связь отсутствует, а если 1, то связь линейная.

Изображение слайда

Изображение слайда

Слайд 7: Заполняем таблицу

Изображение слайда

Для этого по выбранному уровню доверительной вероятности  (для обычных технических расчетов  принимается равной 0,95 или 0,99) и числу степеней свободы f = N -2 определяется критическое значение коэффициента парной корреляции ( r кр ). Выбор значений r кр производится по таблице, имеющейся в приложении. В случае, если абсолютная величина коэффициента парной корреляции не меньше критического, то линейная связь между параметрами считается статистически значимой. В противном случае линейная связь статистически не значима и, следовательно, необходимо переходить более сложным математическим зависимостям.

Изображение слайда

Слайд 9: Построение уравнения регрессии

Линейное уравнение регрессии имеет вид: Коэффициенты уравнения регрессии можно рассчитать по следующим формулам (за х и у можно принять ту или другую величину):

Изображение слайда

Слайд 10: Анализ полученных результатов

После установления статистически значимой линейной связи необходимо определить параметр, который будет определяться экспериментально, и по которому будет осуществляться оптимизация технологического процесса. Оценку линейных связей параметров необходимо осуществлять с учетом абсолютного значения коэффициента парной корреляции. При прочих равных условиях предпочтение отдается тем параметрам, для которых метод определения более прост или позволяет проводить измерения с высокой точностью. Для упрощения анализ полученных результатов регрессионное уравнение может быть представлено в графическом виде.

Изображение слайда

Слайд 11: Коэффициент парной корреляции

Изображение слайда

Слайд 12: Множественная корреляция

Изображение слайда

Слайд 13: Множественная корреляция

На практике, весьма часто, приходиться анализировать связь между зависимой переменной у и группой факторов х 1 ; х 2 ;....... х l. Для оценки используют: а) коэффициент множественной корреляции. б) коэффициент парциальной корреляции

Изображение слайда

Слайд 14: Коэффициент множественной корреляции

выражает степень связи между у и всей группой независимых переменных R – матрица парных корреляций R 11 – алгебраическое дополнение определителя R к элементу r yy. Для l – независимых переменных и n измеренных значений у:

Изображение слайда

Слайд 15: Для случая двух независимых переменных

Изображение слайда

Слайд 16: Коэффициент парциальной корреляции

позволяет оценить влияние на у каждой из независимых переменных последовательно алгебраические дополнения к элементам Для частных случаев можно воспользоваться формулами Другие коэффициенты получают циклической перестановкой индексов

Изображение слайда

Слайд 17: Оценка статистической значимости гипотезы

Если ( х 1.....х l ) – факторы, а ( у 1........у n ) – опыты на точках, то: где это число степеней свободы. При наличии линейной связи проводят проверку по критерию Фишера: Можно пользоваться корреляционным отношением: где m – количество измерений на одну точку

Изображение слайда

Слайд 18: Пример:

При анализе связи σ в (у) размеры частиц η – фазы (х 1 ) и межчастичным расстоянием (х 2 ) после 5 режимов обработки при испытании трех образцов получено: n =15  1 = числу свободных переменных = l.  2 = 15-2-1=12 Парциальные корреляции: Вывод: по коэффициенту множественной корреляции оба параметра оказывают влияние на прочностные свойства. По парциальной корреляции влияет только межчастичное расстояние.

Изображение слайда

Слайд 19: Каноническая корреляция

Изображение слайда

Слайд 20: Сущность и теоретические основы метода

Метод канонических корреляций относится к статистическим методам анализа связей между массовыми явлениями и процессами. Если рассматривается зависимость между одним результативным показателем Y и одним фактором X, то речь идет о парной корреляции. Когда имеется несколько переменных X и одна переменная У, проводится множественный корреляционный анализ для установления и измерения степени связи между переменными. Каноническая корреляция — это распространение парной корреляции на случай, когда имеется несколько результативных показателей Y и несколько факторов X. Основная цель применения этого метода состоит прежде всего в поиске максимальных корреляционных связей между группами исходных переменных: показателями-факторами и результативными качественными показателями. Кроме того, метод канонических корреляций дает возможность сократить объем исходных данных за счет отсева малозначимых факторов.

Изображение слайда

Слайд 21: Матрица значений исходных переменных

Х 1, Х 2, X g — переменные факторы; У 1, Y 2, Y p — результативные показатели. Так как на практике количество факторов значительно пре­восходит количество результативных показателей, то будем предполагать, что р < g. Каноническая корреляция — это корреляция между новыми компонентами (каноническими переменными) U и V:

Изображение слайда

Слайд 22: Подготовка информации и вычисления канонических корреляций

По аналогии с парной корреляцией теснота связи между каноническими переменными будет определятся каноническими коэффициентами: cov - некоторое число Е – математическое ожидание величины. P ij – совместная вероятность х и у. var – дисперсия случайной величины (вспомним 2 случая среднеквадратических отклонения). var (х) = 0.

Изображение слайда

Слайд 23: Вычисление канонических коэффициентов корреляции

S 12, S 21 – матрица взаимодействия х и у (размерность). ( S 12 – g x p и S 21 – p x g ) S 21 – результат транспонирования S12. S 11 – ковариационная матрица исходных переменных, ее размер g x g. S 22 – ковариантная матрица у, p x p.

Изображение слайда

Слайд 24: Решение задачи

необходимо решить уравнения: U, V – векторы канонических переменных. X, Y – матрицы исходных значений. А, В – векторы коэффициентов. Если предположить, что средние значения канонических переменных U и V равны нулю, а их дисперсии равны единице,  r Для упрощения расчетов, считаем, что каждая из переменных имеет единичную дисперсию и нулевое математическое ожидание, следовательно знаменатель этого выражения = 1.

Изображение слайда

Слайд 25: Находим максимальный коэффициент корреляции

воспользуемся способом множителей Лагранжа для нахождения условного экстремума ( λ – множитель Лагранжа), продифференцируем функцию Лагранжа по компонентам векторов А и В и приравняем их к нулю, получим систему: Домножим полученные выражения на λ и обратную матрицу соответсвенно, получим: Умножив обе части на, получим Рассуждая аналогично

Изображение слайда

Слайд 26: Решение последнего уравнения

Чтобы решить уравнение, необходимо найти характеристи-ческие корни и характеристические векторы. Из предположения, что р < g, вытекает, что размерность вектора В меньше размерности вектора А. Можно определить вектор А из 1 уравнения системы: Для того чтобы найти компоненты вектора А, необходимо определить векторы В и . Значения  2 находятся как собственные значения матрицы С: Можно показать, что = r 1 1 = r

Изображение слайда

Слайд 27: Расчет канонических корреляций 3 фактора 2 параметра оптимизации

Пример

Изображение слайда

Слайд 28: Матрица исходных данных

Изображение слайда

Слайд 29: Матрица ковариаций

Изображение слайда

Слайд 30: Матрица парных коэффициентов корреляции

Изображение слайда

Слайд 31: Вспомогательные матрицы

Для определения собственных значений найдем матицу С Т.к. эта матрица имеет размер 2 х 2, то она будет иметь два собственных значения, и два собственных вектора.

Изображение слайда

Слайд 32: Вспомогательные матрицы

Для определения собственных значений найдем матицу С Т.к. эта матрица имеет размер 2 х 2, то она будет иметь два собственных значения, и два собственных вектора.

Изображение слайда

Слайд 33

Собственный вектор: Коэффициент корреляции: аналогично

Изображение слайда

Слайд 34: Канонические переменные

И так максимальный коэффициент канонической корреляции 0,71.

Изображение слайда

Слайд 35: Проверка статистической значимости

Проверку статистической значимости коэффициентов проводят по критерию Бартлета: И для данного числа степеней свободы сравнивают с табличными: для числа степеней свободы ( p -1)( g -1)=2, и уровня значимости 0,95.

Изображение слайда

Слайд 36: Получение реальных коэффициентов

Для того чтобы получить коэффициенты, относящиеся к исходным данным, необходимо помнить, что мы все дисперсии приравняли к 1 => Т.о., все остальные коэффициенты будут равны: a2=0.03004 a3=0.0021 b1=-0.7147 b 2=0.1764 Уравнение канонических корреляций будет выглядеть следующим образом: U1=0, 9553 x1+ 0,0 304 x2+0, 0021 x3 V 1=-0,7147 y 1+0,176 y 2 В том случае, если нельзя ограничиться одним выходным параметром, то необходимо перейти к обобщенному параметру оптимизации.

Изображение слайда

Последний слайд презентации: Корреляционный анализ: Выводы

Максимальный коэффициент корреляции 0,701, что означает наличии тесной связи между факторами. Сами факторы Y тесно связаны между собой (их корреляция 0,53), также высокую сязь имеют факторы Х1 и Х3 (0,52) Второй коэффициент корреляции не велик и говорит о том, что другие линейные комбинации маловероятны. В обеих линейных комбинациях наиболее значима величина Х3, коэффициенты при других величинах существенно меняются по величине и меняют знак, т.е. достоверно только влияние фактора Х3. Для уточнения результатов следует повторить расчеты для других сочетаний факторных и результативных переменных, можно отбрасывать одну из переменных, и рассчитывать новые коэффициенты. В случае определения канонических корреляций нет необходимости добиваться независимости исходных переменных.

Изображение слайда

Похожие презентации