انواع ضرایب همبستگی


پنجره به دست آوردن فواصل اطمینان ضرایب همبستگی

ضریب همبستگی پیرسن Pearson Correlation Coefficient در نرم افزار SPSS

همبستگی به مفهوم ارتباط میان دو یا چند کمیت با یکدیگر است و ضریب همبستگی مقدار عددی این ارتباط را بیان می‌کند. وقتی از ضریب همبستگی در جامعه صحبت می‌کنیم با مفهوم پارامتری آن روبه‌رو هستیم که آن را با نماد ρ نشان می‌دهیم و وقتی از جامعه نمونه‌گیری می‌شود، براورد نمونه‌ای آن را با r نمایش می‌دهیم.

هر چقدر قدر مطلق ضریب همبستگی به عدد یک نزدیک‌تر باشد (در جهت مثبت یا در جهت منفی) ارتباط بین کمیت‌ها بیشتر و کامل‌تر است. وقتی اندازه عددی ضریب همبستگی به مقادیر مثبت یک نزدیک است به معنای وجود ارتباط قوی و مستقیم است، به نحوی که افزایش یک کمیت افزایش کمیت دیگر را در پی دارد و یا کاهش آن سبب کاهش کمیت دیگر می‌شود. به همین‌ترتیب اندازه عددی ضریب همبستگی نزدیک به مقادیر منفی یک به معنای وجود یک ارتباط قوی و وارون است که اندازه‌های عددی دو کمیت در جهت عکس یکدیگر رفتار می‌کنند. اندازه‌های عددی نزدیک به صفر نیز بدان معنا است که تغییرات یک کمیت، اطلاع کمی درباره تغییرات کمیت دیگر در اختیار ما قرار می‌دهد. نکته‌ای که باید در این میان به آن توجه کرد این است که ضریب همبستگی صفر و یا نزدیک صفر را نباید به مفهوم استقلال کمیت‌ها از یکدیگر دانست. هر چند که ضریب همبستگی دو کمیت مستقل از یکدیگر، همواره صفر است.

همان گونه که می‌دانیم مشاهدات در چهار دسته‌ی اسمی Nominal، رتبه‌ای Ordinal، فاصله‌ای Interval و نسبتی Ratio طبقه‌بندی می‌شوند. خوب است این نکته را بدانید که نرم‌افزار SPSS به داده‌های از نوع فاصله‌ای و نسبتی اصطلاحاً Scale می‌گوید. براساس این دسته‌بندی‌ها انواع مختلف همبستگی بین کمیت‌ها و داده‌ها معرفی می‌شوند. در واقع مبنای ایجاد و معرفی ضرایب همبستگی مختلف تا حد زیادی متأثر از ماهیت و مقیاس اندازه‌گیری میان کمیت‌ها است. من در این متن قصد دارم به یکی از مهم‌ترین انواع ضرایب همبستگی یعنی پیرسن Pearson بپردازم.

Pearson Correlation Coefficient

این ضریب همبستگی که به آن ضریب همبستگی ساده نیز می‌گویند، می‌توان متداول‌ترین نوع از مجموعه ضرایب همبستگی نامید. کاربرد آن زمانی است که توزیع توام مشاهدات نرمال بوده و از نوع نسبتی و کمی (گسسته یا پیوسته) باشند. این ضریب همبستگی ارتباط خطی بین کمیت‌ها را نشان می‌دهد. آزمون فرضیه این ضریب همبستگی از نوع پارامتری است، به معنای آن‌که توزیع آماره‌ی آن مشخص است.

همان‌گونه که در بحث فرضیه‌های آماری بیان کردیم، فرض صفر تفکر و ایده اولیه محقق از پژوهش خود می‌باشد، این فرض در پی پذیرش وضع موجود بوده و عدم ارتباط میان کمیت‌ها را بیان می‌کند. فرضیه مربوط به ضرایب همبستگی به صورت زیر است.

فرض صفر این آزمون عدم ارتباط میان کمیت‌ها و فرض مقابل وجود ارتباط و انواع ضرایب همبستگی ایجاد ساختار جدید را نشان می‌دهد. فراموش نکنیم که این آزمون می‌تواند علاوه بر تعریف دو دامنه (به صورت زیر) به صورت آزمون فرضیه‌های یک‌طرفه نیز تعریف شود.

بیایید این بحث را با استفاده از نرم‌افزار SPSS توضیح دهیم. فایل دیتای این مثال را می‌توانید از اینجا دریافت کنید.

در تصویر زیر می‌توانید بخشی از داده‌ها را مشاهده کنید.

داده‌های مثال ضریب همبستگی پیرسن

ما در این مثال می‌خواهیم ضریب همبستگی بین شاخص‌های قلبی و عروقی شامل crp ,chol و sbp به دست بیاوریم. برای این منظور لازم است ابتدا آزمون نرمال بودن مشاهدات انجام شود.

جهت انجام آزمون نرمالیتی از مسیر زیر در نرم‌افزار SPSS استفاده می‌کنیم.

Analyze → Nonparametric Tests Legacy Dialogs 1-Sample K-S

مسیر آزمون نرمالیتی در نرم افزار SPSS

با رفتن به این مسیر، پنجره زیر با نام One-Sample Kolmogorov-Smirnov Test برای ما باز می‌شود.

پنجره One-Sample Kolmogorov-Smirnov Test در نرم‌افزار SPSS

در کادر Test Variable List کمیت‌هایی که می‌خواهیم آزمون نرمالیتی بر روی آن‌ها انجام شود را قرار می‌دهیم. همچنین در کادر Test Distribution گزینه Normal را انتخاب می‌کنیم. این کار سبب می‌شود، نرم‌افزار SPSS به انجام آزمون نرمالیتی بر روی شاخص‌های قلبی و عروقی مطالعه ما بپردازد. OK کنید و نتایج را در پنجره Output نرم‌افزار ببینید.

نتیجه آزمون نرمالیتی کلوموگروف-اسمیرنف

نتیجه به دست آمده در جدول بالا نشان می‌دهد همه شاخص‌های قلبی و عروقی مورد بررسی در این مثال، دارای توزیع نرمال هستند و مقدار احتمال آزمون نرمالیتی آنها از سطح معنی‌داری 0.05 درصد بالاتر است. به همین دلیل جهت سنجش ضریب همبستگی بین crp ,chol و sbp از روش پیرسن استفاده می‌کنیم.

مسیر انجام تحلیل همبستگی در نرم‌افزار SPSS به صورت زیر است.

Analyze → Correlate Bivariate

مسیر انجام تحلیل همبستگی Bivariate در نرم‌افزار SPSS

پنجره زیر با نام Bivariate Correlation برای ما باز می‌شود.

پنجره Bivariate Correlation

در کادر Variables همان کمیت‌هایی را که می‌خواهیم ضریب همبستگی بین آن‌ها به دست بیاید، قرار می‌دهیم. از آن‌جا که Variableها نرمال به دست آمدند بنابراین در بخش Correlation Coefficients ضریب همبستگی پیرسن Pearson را انتخاب می‌کنیم.

چنانچه علاقمند باشیم، علاوه بر ضرایب همبستگی فواصل اطمینان آن‌ها را نیز به دست بیاوریم، بر روی تب Confidence interval می‌زنیم. با این کار وارد پنجره زیر می‌شویم.

پنجره به دست آوردن فواصل اطمینان ضرایب همبستگی

در این پنجره گزینه Estimate confidence interval of bivariate correlation parameter را انتخاب می‌کنیم. فاصله اطمینان را نیز می‌توانیم به دلخواه روی 95% قرار دهیم. بهتر است گزینه Apply the bias adjustment انتخاب شود. این کار سبب می‌شود تنظیمات سوگیری یا همان bias که در نمونه‌های کوچک رخ می‌دهد اعمال شود.

Output

Continue کرده و سپس OK می‌کنیم. به این ترتیب نتایج و خروجی‌های زیر در Output نرم‌افزار SPSS به دست می‌آید.

جدول ضرایب همبستگی

در جدول بالا می توانید عدد ضریب همبستگی پیرسن به همراه مقدار احتمال معناداری Sig را مشاهده کنید. نتایج این جدول نشان می‌دهد

  • رابطه بین chol و crp مثبت و معنادار است. عدد ضریب همبستگی پیرسن در اینجا برابر با 0.305 و مقدار احتمال نیز کمتر از 0.001 به دست آمده است
  • رابطه بین chol و sbp مثبت و معنادار است. عدد ضریب همبستگی پیرسن در اینجا برابر با 0.206 و مقدار احتمال نیز 0.012 به دست آمده است
  • رابطه بین crp و sbp مثبت و معنادار است. عدد ضریب همبستگی پیرسن در اینجا برابر با 0.244 و مقدار احتمال نیز 0.003 به دست آمده است

همچنین برای ما فواصل اطمینان ضرایب همبستگی پیرسن نیز در جدول زیر به دست آمده است.

جدول Confidence Intervals فواصل اطمینان ضریب همبستگی پیرسن

به عنوان مثال فاصله اطمینان 95% برای ضریب همبستگی پیرسن بین chol و crp برابر با (0.442 ,0.151) به دست آمده است. نکته مهمی که در مبحث فواصل اطمینان ضرایب همبستگی مطرح است، این است که اگر این فاصله عدد صفر را در بر داشته باشد به معنای این است که رابطه همبستگی بین دو کمیت مورد بررسی، معنادار نیست. اما اگر فاصله اطمینان عدد صفر را در بر نداشته باشد به معنای وجود رابطه معنادار همبستگی بین آن‌ها می‌باشد.

Scatter Plots

در مطالعات و موضوعات مرتبط با ضرایب همبستگی، رسم نمودارهای پراکنش و یا همان Scatter Plot خود را نشان می‌دهد. نمودارهای پراکنش می‌توانند به ما فهم بهتر و دقیق‌تری از نحوه ارتباط بین Variableها ارایه کنند. آن‌ها را می‌توانیم با استفاده از مسیر زیر در نرم افزار SPSS رسم کنیم.

Graphs → Chart Builder

مسیر رسم انواع نمودارها در نرم‌افزار SPSS

با رفتن به این مسیر، پنجره زیر با نام Chart Builder که جهت رسم و طراحی انواع گراف‌هایی آماری از آن استفاده می‌شود، برای ما باز می‌شود. در این پنجره و محیط نرم افزار SPSS قابلیت و امکنات فراوانی جهت ترسیم انواع نمودارهای آماری قرار داده شده است. نمودار پراکنش در تصویر زیر مشخص شده است.

مسیر رسم نمودار پراکنش در نرم‌افزار SPSS

به عنوان مثال من می‌خواهیم نمودار پراکنش بین chol و crp را به دست بیاورم. مطابق تصویر زیر آن‌ها را قرار می‌دهم.

رسم نمودار پراکنش بین chol و crp به تفکیک جنسیت و فعالیت بدنی

من در این نمودار chol را در محور x، شاخص crp را در محور y، جنسیت یعنی Gender را به عنوان Set color و فعالیت بدنی physical activity را به عنوان Set size قرار داده‌ام. گراف به دست آمده را می‌توانید در شکل زیر ببینید.

نمودار پراکنش بین chol و crp به تفکیک جنسیت و فعالیت بدنی

در این متن درباره ضرایب همبستگی و به ویژه ضریب همبستگی پیرسن Pearson Correlation Coefficient صحبت کردیم. نحوه انجام و به دست آوردن این نوع از ضرایب همبستگی در نرم‌افزار SPSS را بیان کرده و درباره معناداری و یافتن فواصل اطمینان ضرایب همبستگی نیز توضیح دادیم. همچنین درباره رسم نمودارهای پراکنش که معمولاً در مطالعات همبستگی طراحی می‌شود نیز صحبت کردیم.

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2022). Pearson Correlation Coefficient in SPSS software. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/pearson-correlation-coefficient-spss/.php

For example, if you viewed this guide on 12 th January 2022, you would use the following reference

GraphPad Statistics (2022). Pearson Correlation Coefficient in SPSS software. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/pearson-correlation-coefficient-spss/.php

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.

مفهوم ضریب همبستگی چیست و چه کاربردی دارد؟

  • مفهومی کلی از ضریب همبستگی در ذهن داشته باشند.
  • وقتی جایی در گزارشی می‌خوانند که دو متغیر با هم ضریب همبستگی مثبت یا منفی دارند، منظور کلی نویسنده یا محقق را درک کنند.
  • مراقب باشند که ضریب همبستگی را با رابطه‌ی بین علت و معلول اشتباه نگیرند.
  • در موارد ساده، با استفاده از نرم افزار اکسل، بتوانند ضریب همبستگی را محاسبه کنند.

بحث ضریب همبستگی بحث بسیار گسترده‌ای است که دامنه‌ی آن از فلسفه تا آمار و از نیوتون تا هایزنبرگ گسترده است.

طبیعتاً قصد ما در این درس، این نیست که شما را درگیر پیچیدگی‌های این موضوع کنیم.

اما می‌خواهیم چند نکته‌ی ساده درباره‌ی همبستگی را مطرح کنیم تا در درس‌های دیگر بتوانیم به آن ارجاع دهیم.

در ابتدای این درس، یک توضیح غیردقیق و ساده‌شده از ضریب همبستگی ارائه می‌کنیم که برای بسیاری از درس‌های متمم کافی است. در ادامه (بخش پایانی) توضیحات کامل‌تری درباره‌ی ضریب همبستگی ارائه شده است.

اگر قرار نیست کارهای مطالعاتی و تحقیقاتی پیچیده انجام دهید و فقط می‌خواهید در هنگام مطالعه‌ی متن‌های عمومی مدیریتی، درک درستی از ضریب همبستگی داشته باشید، احتمالاً توضیحات زیر برای شما کافی خواهد بود:

  • اگر ضریب همبستگی دو پارامتر با یکدیگر مثبت باشد، به این معناست که در فضایی که مطالعه و بررسی انجام شده، افزایش یک پارامتر با افزایش پارامتر دیگر و نیز کاهش آن پارامتر با کاهش پارامتر دیگر همراه است.
  • اگر ضریب همبستگی دو پارامتر با یکدیگر منفی باشد، به این معناست که در فضایی که مطالعه و بررسی انجام شده، افزایش یک پارامتربا کاهش پارامتر دیگر و کاهش آن پارامتربا افزایش پارامتر دیگر همراه است.
  • صفر بودن ضریب همبستگی به این معناست که دو پارامتر – در فضایی که مورد بررسی قرار گرفته – مستقل از یکدیگر بوده‌اند و بر اساس اطلاعات موجود ازکاهش یا افزایش یکی، نمی‌توان در مورد کاهش یا افزایش دیگری اظهار نظر کرد.
  • ضریب همبستگی بین منفی یک و مثبت یک است. هر چه این ضریب از صفر دورتر شود (و به مثبت یا منفی یک نزدیک‌تر شود) می‌توان نتیجه گرفت که روند هم جهت بودن یا مخالف بودن دو پارامتر مورد بررسی، جدی‌تر است.
  • ضریب همبستگی هیچ ارتباطی با رابطه‌ی علت و معلول ندارد. احتمال دارد در یک جامعه‌ی آماری، بین حجم موتور ماشین و درآمد مالک ماشین، ضریب همبستگی مثبت وجود داشته باشد. اما این بدان معنی نیست که اگر ماشینی بخرید که حجم موتور بالاتری دارد، ثروت‌مندتر می‌شوید یا اگر سپرده‌ی بانکی شما افزایش یابد، حجم موتور ماشین شما رشد خواهد کرد. این بحث را می‌توانید به شکل دقیق‌تر در درس نظریه علمی یا واقعیت آماری مطالعه کنید.

بعضی از بحث‌های متمم که به نوعی با ضریب همبستگی رابطه دارند:

بسته به هدفی که دارید و جامعه‌ی آماری که مد نظر شماست، شیوه‌های متعددی برای محاسبه‌ی ضریب همبستگی یا Correlation Coefficient وجود دارد.

برای اینکه با یکی از شیوه‌های محاسبه‌ی ضریب همبستگی آشنا شویم، ما در اینجا ضریب همبستگی پیرسون را به عنوان نمونه انتخاب کرده‌ایم. این ضریب در مقالات تحقیقاتی معمولاً با نماد r نمایش داده می‌شود.

همانطور که در درس نظریه علمی یا واقعیت آماری اشاره شد، مهم‌ترین نکته‌ای که باید در مورد ضریب همبستگی به خاطر داشته باشیم این است که ضریب همبستگی، به رابطه‌ی علت با معلول اشاره نمی‌کند و صرفاً مشخص می‌کند که بین دو متغیر رابطه خطی وجود دارد.

به عنوان مثال، تحقیقات نشان می‌دهند که ضریب همبستگی بین تعداد سیگارهایی که یک نفر در طول زندگی کشیده و عمر او، منفی است.

اما از این تحقیق نمی‌توان نتیجه گرفت که سیگار کشیدن، عمر را کوتاه می‌کند.

ممکن است این دو متغیر، تابع متغیر سومی به نام سختی‌های زندگی باشند.

به این معنی که با افزایش سختی‌های زندگی، تنش افزایش یافته و با افزایش تنش، ضمن اینکه تعداد سیگارهای مصرفی افزایش می‌یابد، عمر نیز کاهش یابد.

اگر چه در این مثال خاص، تحقیقات متعدد دیگر نشان داده‌اند که مصرف سیگار می‌تواند علت مستقیم کاهش عمر باشد، اما این نتیجه را نمی‌توان صرفاً‌ از منفی بودن ضریب همبستگی استخراج کرد.

علمی و پژوهشی با نرم افزار های آماری

ضریب همبستگی شاخصی است ریاضی که جهت و مقدار رابطه ی بین دو متغیر را توصیف میکند.

ضریب همبستگی درمورد توزیع های دویا چند متغیره به کار مي رود .

اگر مقادیر دو متغیر شبیه هم تغییر کند یعنی با کم یا زیاد شدن یکی دیگری هم کم یا زیا د شود به گونه ای که بتوان رابطه آنها را به صورت یک معادله بیان کرد گوییم بین این دو متغیرهمبستگی وجود دارد.

نمودار پراکنش یا دیاگرام پراکندگی بهترین تصویر برای نشان دادن همبستگی بین دو متغیر است .

برای سنجش همبستگی ضرایب گوناگون به کار می رود که مهمترین آنها ضریب همبستگی ساده پیرسون ، ضریب همبستگی اسپیرمن و ضریب همبستگی کندال است:

1 -اگر هر دو متغیر با مقیاس رتبه ای باشند از شاخص تاو- کندال استفاده می کنیم.

2-اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از ضریب همبستگی پیرسون استفاده می شود .

3- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از ضریب همبستگی اسپیرمن استفاده می کنیم.

برای ترکیبی از انواع متغیرها از هر دو نوع شاخص همبستگی استفاده می کنیم در صورت عدم تفاوت فاحش بین آن دو شاخص می توان مقدار گزارش شده را پذیرفت ، اگر تفاوت چشمگیر بود مقداری که قدر مطلقش کوچکتر است را می پذیریم.

ضریب همبستگی به عنوان معیاری برای سنجش تغییرات y,x نسبت به هم دارای خواص مطلوبی است:

( 1 به مبدا و واحد اندازه گیری متکی نیست.

اگر ρ به 1یا 1- نزدیکباشدیافته های y و x اطراف یک خط راست می باشند و اگر 0= ρ باشد متغیرها ناهمبسته اند.

ضریب همبستگی

ضریب همبستگی - کالج نوین

ضریب همبستگی : عددی بین ۱- و ۱ است که قدرت و جهت رابطه بین متغیرها را به شما می گوید. به عبارت دیگر، نشان می دهد که اندازه گیری دو یا چند متغیر در یک مجموعه داده چقدر شبیه است.

ضریب همبستگی1 : همبستگی مثبت کامل
هنگامی که یک متغیر تغییر می کند، متغیرهای دیگر در همان جهت تغییر می کنند.

ضریب همبستگی0 : همبستگی صفر هیچ رابطه ای بین متغیرها وجود ندارد.
ضریب همبستگی -1 : همبستگی منفی کامل

هنگامی که یک متغیر تغییر می کند، متغیرهای دیگر در جهت مخالف تغییر می کنند.

یک ضریب همبستگی به شما چه می گوید؟

ضرایب همبستگی داده ها را خلاصه می کند و به شما کمک می کند نتایج را بین مطالعات مقایسه کنید.

جمع بندی داده ها

ضریب همبستگی یک آمار توصیفی است. این بدان معنی است که داده های نمونه را بدون اینکه به شما اجازه دهد چیزی در مورد جامعه استنباط کنید، خلاصه می شود.

ضریب همبستگی زمانی که رابطه بین دو متغیر را خلاصه می کند یک آمار دو متغیره است و زمانی که بیش از دو متغیر دارید یک آماره چند متغیره است.

اگر ضریب همبستگی شما بر اساس داده های نمونه باشد، اگر می خواهید نتایج خود را به جامعه تعمیم دهید، به یک آمار استنباطی نیاز خواهید داشت. برای محاسبه آمار آزمونی که اهمیت آماری یافته شما را به شما می گوید، می توانید از آزمون F یا آزمون t استفاده کنید.

مقایسه مطالعات

ضریب همبستگی نیز یک اندازه گیری اندازه اثر است که اهمیت عملی یک نتیجه را به شما می گوید. ضرایب بدون واحد هستند که امکان مقایسه مستقیم ضرایب بین مطالعات را فراهم می کند.

با استفاده از ضریب همبستگی

در تحقیقات همبستگی، شما بررسی می کنید که آیا تغییرات در یک متغیر با تغییرات در متغیرهای دیگر مرتبط است یا خیر.

مثال : شما بررسی می کنید که آیا نمرات استاندارد شده از دبیرستان با نمرات تحصیلی در کالج مرتبط است یا خیر. شما پیش‌بینی می‌کنید که یک همبستگی مثبت وجود دارد: نمرات SAT بالاتر با معدل بالاتر دانشگاه مرتبط است در حالی که نمرات SAT پایین با معدل پایین‌تر دانشگاه انواع ضرایب همبستگی مرتبط است.
پس از جمع‌آوری داده‌ها، می‌توانید با ترسیم یک متغیر در محور x و دیگری در محور y، داده‌های خود را با یک نمودار پراکنده تجسم کنید. فرقی نمی کند که کدام متغیر را روی هر دو محور قرار دهید.

نمودار خود را به صورت بصری برای یک الگو بررسی کنید و تصمیم بگیرید که آیا یک الگوی خطی یا غیر خطی بین متغیرها وجود دارد. یک الگوی خطی به این معنی است که شما می توانید یک خط مستقیم با بهترین تناسب بین نقاط داده قرار دهید، در حالی که یک الگوی غیر خطی یا منحنی می تواند انواع اشکال مختلف مانند U-شکل یا یک خط با منحنی را داشته باشد.

ضرایب زیادی وجود دارد که می توانید آنها را محاسبه کنید. پس از حذف هر گونه نقاط پرت، ضریب همبستگی مناسب را بر اساس شکل کلی الگوی نمودار پراکندگی انتخاب کنید.

سپس می توانید یک تحلیل همبستگی برای یافتن ضریب برای داده های خود انجام دهید. شما یک ضریب را برای خلاصه کردن رابطه بین متغیرها بدون نتیجه گیری در مورد علیت محاسبه می کنید.

تفسیر ضریب همبستگی

مقدار ضریب همبستگی همیشه بین 1 و -1 است و شما آن را به عنوان یک شاخص کلی از قدرت رابطه بین متغیرها در نظر می گیرید. علامت ضریب نشان می دهد که آیا متغیرها در جهت یکسان یا مخالف تغییر می کنند: مقدار مثبت به معنای تغییر متغیرها با هم در یک جهت است، در حالی که مقدار منفی به این معنی است که آنها با هم در جهت مخالف تغییر می کنند.

قدر مطلق یک عدد برابر است با عدد بدون علامت آن قدر مطلق یک ضریب همبستگی، بزرگی همبستگی را به شما می گوید: هر چه قدر مطلق بیشتر باشد، همبستگی قوی تر است.

دستورالعمل های مختلفی برای تفسیر ضریب همبستگی وجود دارد، زیرا یافته ها می توانند بین رشته های مورد مطالعه بسیار متفاوت باشند. می توانید از جدول زیر به عنوان یک دستورالعمل کلی برای تفسیر قدرت همبستگی از مقدار ضریب همبستگی استفاده کنید.

در حالی که این دستورالعمل به طور کلی مفید است، بسیار مهمتر است که زمینه و هدف تحقیق خود را هنگام نتیجه گیری در نظر بگیرید. برای مثال، اگر اکثر مطالعات در رشته شما دارای ضرایب همبستگی نزدیک به 0.9 هستند، ممکن است ضریب همبستگی 0.58 در آن زمینه پایین باشد.

تجسم همبستگی های خطی

ضریب همبستگی به شما می گوید که داده های شما چقدر نزدیک به یک خط قرار می گیرند. اگر یک رابطه خطی دارید، یک خط مستقیم از بهترین تناسب ترسیم خواهید کرد که تمام نقاط داده شما را در نمودار پراکنده در نظر می گیرد.

هرچه نقاط شما به این خط نزدیکتر باشد، ضریب همبستگی قدر مطلق بالاتر و همبستگی خطی شما قوی تر می شود. اگر همه نقاط کاملاً روی این خط باشند، شما یک همبستگی کامل دارید.

توجه داشته باشید که شیب یا شیب خط با مقدار ضریب ارتباطی ندارد. ضریب همبستگی به شما کمک نمی‌کند پیش‌بینی کنید که یک متغیر بر اساس یک تغییر معین در دیگری چقدر تغییر می‌کند، زیرا دو مجموعه داده با مقدار ضریب همبستگی یکسان می‌توانند خطوطی با شیب‌های بسیار متفاوت داشته باشند.

انواع ضرایب همبستگی

شما می توانید از میان ضرایب همبستگی مختلف بر اساس خطی بودن رابطه، سطح اندازه گیری متغیرهای خود و توزیع داده های خود انتخاب کنید.

برای قدرت و دقت آماری بالا، بهتر است از ضریب همبستگی که برای داده‌های شما مناسب‌تر است استفاده کنید. متداول ترین ضریب همبستگی ضریب پیرسون r است زیرا امکان استنتاج قوی را فراهم می کند. پارامتری است و روابط خطی را اندازه گیری می کند. اما اگر داده‌های شما تمام فرضیات این تست را برآورده نمی‌کند، باید به جای آن از یک تست ناپارامتریک استفاده کنید.

آزمون های ناپارامتریک ضرایب همبستگی رتبه ای، روابط غیرخطی بین متغیرها را خلاصه می کند. تاو اسپیرمن و تاو کندال شرایط یکسانی برای استفاده دارند، اما تاو کندال به طور کلی برای نمونه‌های کوچک‌تر ترجیح داده می‌شود، در حالی که rho اسپیرمن بیشتر مورد استفاده قرار می‌گیرد.

آر پیرسون

ضریب همبستگی لحظه-محصول پیرسون، همچنین به عنوان r پیرسون شناخته می شود، رابطه خطی بین دو متغیر کمی را توصیف می کند. اگر می‌خواهید از r پیرسون استفاده کنید، اینها مفروضاتی هستند که داده‌های شما باید رعایت کنند:

هر دو متغیر در یک سطح فاصله یا نسبت اندازه گیری هستند
داده های هر دو متغیر از توزیع های نرمال پیروی می کنند
داده های شما هیچ نقطه پرت ندارد
داده های شما از یک نمونه تصادفی یا نماینده است
شما انتظار یک رابطه خطی بین دو متغیر را دارید
پیرسون r یک تست پارامتریک است، بنابراین قدرت بالایی دارد. اما اگر متغیرهای شما یک رابطه غیرخطی داشته باشند، یا اگر داده‌های شما دارای نقاط پرت، توزیع‌های اریب یا از متغیرهای طبقه‌بندی شده باشند، معیار خوبی برای همبستگی نیست.

اگر هر یک از این مفروضات نقض شد، باید یک معیار همبستگی رتبه ای را در نظر بگیرید. فرمول پیرسون r پیچیده است، اما اکثر برنامه های کامپیوتری می توانند به سرعت ضریب همبستگی را از داده های شما بدست آورند. در شکل ساده تر، فرمول کوواریانس بین متغیرها را بر حاصل ضرب انحراف معیار آنها تقسیم می کند.

نمونه پیرسون در مقابل فرمول ضریب همبستگی جمعیت

هنگام استفاده از فرمول ضریب همبستگی پیرسون، باید در نظر بگیرید که آیا با داده های یک نمونه سروکار دارید یا کل جامعه. فرمول های نمونه و جمعیت در نمادها و ورودی هایشان متفاوت است. یک ضریب همبستگی نمونه r، در حالی که ضریب همبستگی جمعیتی rho، حرف یونانی ρ نامیده می شود. ضریب همبستگی نمونه از کوواریانس نمونه بین متغیرها و انحراف معیار نمونه آنها استفاده می کند.

ضریب همبستگی جمعیت از کوواریانس جامعه بین متغیرها و انحراف معیار جمعیت آنها استفاده می کند.

اسپیرمن رو

rho اسپیرمن یا ضریب همبستگی رتبه اسپیرمن رایج‌ترین جایگزین برای r پیرسون است. این یک ضریب همبستگی رتبه ای است زیرا از رتبه بندی داده ها از هر متغیر (به عنوان مثال از پایین ترین به بالاترین) به جای خود داده خام استفاده می کند.

زمانی که داده های شما با مفروضات پیرسون r مطابقت ندارند، باید از rho اسپیرمن استفاده کنید. این زمانی اتفاق می افتد که حداقل یکی از متغیرهای شما در سطح ترتیبی اندازه گیری باشد یا زمانی که داده های یک یا هر دو متغیر از توزیع های نرمال پیروی نمی کنند.

در حالی که پیرسون خطی بودن روابط را اندازه گیری می کند، ضریب اسپیرمن یکنواختی روابط را اندازه گیری می کند. در یک رابطه خطی، هر متغیر در یک جهت با سرعت یکسان در سراسر محدوده داده تغییر می کند. در یک رابطه یکنواخت، هر متغیر نیز همیشه فقط در یک جهت تغییر می‌کند، اما نه لزوماً با همان سرعت.

یکنواخت مثبت: وقتی یک متغیر افزایش می یابد، متغیر دیگر نیز افزایش می یابد.
یکنواخت منفی: وقتی یک متغیر افزایش می یابد، متغیر دیگر کاهش می یابد.
روابط یکنواخت نسبت به روابط خطی محدودیت کمتری دارند.

فرمول ضریب همبستگی رتبه اسپیرمن

نمادهای اسپیرمن rho برای ضریب جمعیت ρ و برای ضریب نمونه rs هستند. فرمول ضریب همبستگی پیرسون را بین رتبه بندی داده های متغیر محاسبه می کند.

برای استفاده از این فرمول، ابتدا داده های هر متغیر را به طور جداگانه از کم به زیاد رتبه بندی می کنید: هر نقطه داده رتبه ای از اول، دوم یا سوم و غیره می گیرد.

سپس، تفاوت های (di) بین رتبه های متغیرهای خود را برای هر جفت داده پیدا خواهید کرد و آن را به عنوان ورودی اصلی فرمول در نظر می گیرید.

اگر ضریب 1 داشته باشید، همه رتبه‌بندی‌ها برای هر متغیر برای هر جفت داده مطابقت دارند. اگر ضریب 1- داشته باشید، رتبه بندی یک متغیر دقیقا برعکس رتبه بندی متغیر دیگر است. ضریب همبستگی نزدیک به صفر به این معنی است که هیچ رابطه یکنواختی بین رتبه بندی متغیرها وجود ندارد.

سایر ضرایب

ضریب همبستگی مربوط به دو ضریب دیگر است و اینها اطلاعات بیشتری در مورد رابطه بین متغیرها به شما می دهند.

ضریب تعیین

وقتی انواع ضرایب همبستگی ضریب همبستگی را مجذور می کنید، در نهایت به همبستگی تعیین (r2) می رسید. این نسبت واریانس مشترک بین متغیرها است. ضریب تعیین همیشه بین 0 و 1 است و اغلب به صورت درصد بیان می شود.

از ضریب تعیین در مدل های رگرسیونی برای اندازه گیری اینکه چقدر از واریانس یک متغیر با واریانس متغیر دیگر توضیح داده می شود استفاده می شود. تجزیه و تحلیل رگرسیون به شما کمک می کند تا معادله خط بهترین تناسب را پیدا کنید و می توانید از آن برای پیش بینی مقدار یک متغیر با توجه به مقدار متغیر دیگر استفاده کنید.

r2 بالا به این معنی است که مقدار زیادی از تغییرپذیری در یک متغیر توسط رابطه آن با متغیر دیگر تعیین می شود. r2 پایین به این معنی است که تنها بخش کوچکی از تغییرپذیری یک متغیر با رابطه آن با متغیر دیگر توضیح داده می شود.

روابط با سایر متغیرها به احتمال زیاد واریانس متغیر را محاسبه می کند. ضریب اغلب می تواند رابطه بین متغیرها را به ویژه در نمونه های کوچک بیش از حد تخمین بزند، بنابراین ضریب تعیین اغلب نشانگر بهتری از رابطه است.

ضریب بیگانگی

وقتی ضریب تعیین را از وحدت (یک) بردارید، ضریب بیگانگی را خواهید گرفت. این نسبت واریانس مشترک بین متغیرها مشترک نیست، واریانس غیرقابل توضیح بین متغیرها. ضریب بیگانگی بالا نشان می دهد که این دو متغیر واریانس بسیار کمی دارند. ضریب بیگانگی پایین به این معنی است که مقدار زیادی از واریانس توسط رابطه بین متغیرها محاسبه می شود.

ضریب همبستگی C، فی Phi و کرامر Cramer’s V

همبستگی به مفهوم ارتباط میان دو یا چند کمیت با یکدیگر است و ضریب همبستگی مقدار عددی این ارتباط را بیان می‌کند. وقتی از ضریب همبستگی در جامعه صحبت می‌کنیم با مفهوم پارامتری آن روبه‌رو هستیم که آن را با نماد ρ نشان می‌دهیم و وقتی از جامعه نمونه‌گیری می‌شود، براورد نمونه‌ای آن را با r نمایش می‌دهیم.

هر چقدر قدر مطلق ضریب همبستگی به عدد یک نزدیک‌تر باشد (در جهت مثبت یا در جهت منفی) ارتباط بین کمیت‌ها بیشتر و کامل‌تر است. وقتی اندازه عددی ضریب همبستگی به مقادیر مثبت یک نزدیک است به معنای وجود ارتباط قوی و مستقیم است، به نحوی که افزایش یک کمیت افزایش کمیت دیگر را در پی دارد و یا کاهش آن سبب کاهش کمیت دیگر می‌شود. به همین‌ترتیب اندازه عددی ضریب همبستگی نزدیک به مقادیر منفی یک به معنای وجود یک ارتباط قوی و وارون است که اندازه‌های عددی دو کمیت در جهت عکس یکدیگر رفتار می‌کنند. اندازه‌های عددی نزدیک به صفر نیز بدان معنا است که تغییرات یک کمیت، اطلاع کمی درباره تغییرات کمیت دیگر در اختیار ما قرار می‌دهد. نکته‌ای که باید در این میان به آن توجه کرد این است که ضریب همبستگی صفر و یا نزدیک صفر را نباید به مفهوم استقلال کمیت‌ها از یکدیگر دانست. هر چند که ضریب همبستگی دو کمیت مستقل از یکدیگر، همواره صفر است.

همان گونه که می‌دانیم مشاهدات در چهار دسته‌ی اسمی Nominal، رتبه‌ای Ordinal، فاصله‌ای Interval و نسبتی Ratio طبقه‌بندی می‌شوند. خوب است این نکته را بدانید که نرم‌افزار SPSS به داده‌های از نوع فاصله‌ای و نسبتی اصطلاحاً Scale می‌گوید. براساس این دسته‌بندی‌ها انواع مختلف همبستگی بین کمیت‌ها و داده‌ها معرفی می‌شوند. در واقع مبنای ایجاد و معرفی ضرایب همبستگی مختلف تا حد زیادی متأثر از ماهیت و مقیاس اندازه‌گیری میان کمیت‌ها است. من در این متن قصد دارم به یکی از مهم‌ترین انواع ضرایب همبستگی یعنی پیرسن Pearson بپردازم.

Contingency Coefficient, Phi and Cramer’s V

انواع مختلف ضرایب همبستگی برای مشاهدات اسمی، رتبه‌ای و فاصله‌ای را می‌توان براساس نوع مشاهدات از طریق مسیر زیر در نرم‌افزار SPSS مشاهده کرد.

Analyze → Descriptive statistics Crosstabs

مسیر انجام ضرایب همبستگی در جداول توافقی

این ضرایب در گزینه‌ی Statistics قابل مشاهده می‌باشند. ما به صورت مختصر به معرفی برخی از ضرایب می‌پردازیم. دقت کنید که این ضرایب بیشتر در جداول توافقی و بررسی دو کمیت، مورد استفاده قرار می‌گیرند. ما از محاسبات عددی چگونگی یافتن مقادیر این ضرایب خودداری می‌کنیم و برای این منظور از نرم‌افزار استفاده می‌کنیم. تصویر زیر را ببینید.

انواع ضرایب همبستگی در جداول توافقی نرم‌افزار SPSS

همان‌گونه که در بحث فرضیه‌های آماری بیان کردیم، فرض صفر تفکر و ایده اولیه محقق از پژوهش خود می‌باشد، این فرض در پی پذیرش وضع موجود بوده و عدم ارتباط میان کمیت‌ها را بیان می‌کند. فرضیه مربوط به ضرایب همبستگی به صورت زیر است.

فرض صفر این آزمون عدم ارتباط میان کمیت‌ها و فرض مقابل وجود ارتباط و ایجاد ساختار جدید را نشان می‌دهد. فراموش نکنیم که این آزمون می‌تواند علاوه بر تعریف دو دامنه (به صورت زیر) به صورت آزمون فرضیه‌های یک‌طرفه نیز تعریف شود.

بیایید این بحث را با استفاده از نرم‌افزار SPSS توضیح دهیم. فایل دیتای این مثال را می‌توانید از اینجا دریافت کنید. در ادامه درباره‌ی این مثال توضیح می‌دهیم.

فرض کنید جدول زیر مربوط به تعداد تصادفات رانندگی در جاده‌های استان اصفهان در طی یک‌سال، برحسب نوع جاده‌ها و تجهیزات راهنمایی و رانندگی مناسب و یا نامناسب و غیر کافی است.

" data-lang="default" data-override="" data-merged="[,,]" data-responsive-mode="2" data-from-history="0" >
جدول توافقی نوع و وضعیت جاده وضعیت جاده‌ها از نظر تجهیزات راهنمایی و رانندگی
مناسب و کافی نامناسب و غیرکافی مجموع
نوع جاده‌های مورد مطالعه بزرگراه 44 108 152
جاده اصلی 36 50 86
جاده فرعی 33 42 75
مجموع 113 200 313

از آنجا که داده‌های ما اسمی Nominal هستند، جهت به دست آوردن ضریب همبستگی بین نوع جاده‌ها و وضعیت تجهیزات راهنمایی و رانندگی جاده‌ها، می‌توانیم از روش‌های ضریب همبستگی احتمالی با نام Contingency Coefficient که به اختصار به آن ضریب همبستگی C گفته می‌شود و همچنین ضریب همبستگی فی و کرامر Phi and Cramer’s V، استفاده کنیم.

با این حال در گام ابتدایی لازم است، داده‌های جدول بالا وارد نرم‌افزار شوند. ما آن‌ها را به صورت تصویر زیر در SPSS نوشته‌ایم.

نحوه وارد کردن داده‌ها به نرم‌افزار

در مرحله‌ی بعد باید داده‌های ستون Accidents_F را وزن‌دهی کنیم. درباره‌ی روش و چگونگی وزن‌دهی کردن داده‌ها در نرم‌افزار SPSS، این لینک را ببینید.

پس از وزن‌دهی داده‌ها با استفاده از مسیر زیر که در بالا نیز اشاره کردیم، به یافتن ضرایب همبستگی C، فی و کرامر می‌پردازیم.

Analyze → Descriptive statistics Crosstabs

پس از رفتن به مسیر بالا، پنجره زیر با نام Crosstabs برای ما باز می‌شود.

پنجره Crosstabs و ورود Variableها

در کادر Row کمیت Road را قرار می‌دهیم. در کادر Column نیز Equipment را قرار می‌دهیم. البته این انتخاب دلخواه است و در تحلیل فرقی ندارد سطر و ستون انواع ضرایب همبستگی را کدام Variable قرار دهیم.

چنانچه علاقمند باشیم، نموداری از داده‌ها نیز به دست بیاید می‌توانیم گزینه Display clustered bar charts را انتخاب کنیم.

ما در این مثال به دنبال به دست آوردن ضرایب همبستگی مربوط به داده‌های اسمی بودیم. لازم است آن‌ها را انتخاب کنیم. این کار با استفاده از تب Statistics انجام می‌شود. بر روی آن می‌زنیم و وارد پنجره Crosstabs Statistics می‌شویم.

انتخاب ضرایب همبستگی C، فی و کرامر

در این پنجره و در کادر Nominal، گزینه‌های Contingency Coefficient و Phi and Cramer’s V، را انتخاب می‌کنیم. خوب است بدانید که یکی از مسیرهای انجام تحلیل پرکاربرد کای دو Chi-square در همین پنجره است.

Output

Continue کرده و سپس OK می‌کنیم. به این ترتیب نتایج و خروجی‌های زیر در Output نرم‌افزار SPSS به دست می‌آید.

جدول توافقی بین نوع و تجهیزات جاده

در جدول بالا می توانید فراوانی تعداد تصادفات براساس نوع جاده و وضعیت تجهیزات راهنمایی و رانندگی جاده را مشاهده کنید. این جدول در حال حاضر یافته مهمی برای ما ندارد و همان جدول توصیفی بالا است.

در ادامه و در جدول با نام Symmetric Measures اندازه‌های عددی ضریب همبستگی C به همراه فی Phi و کرامر Cramer’s V آمده است.

جدول Symmetric Measures

در این جدول عدد ضریب همبستگی فی، کرامر و Contingency به همراه مقدار احتمال معناداری تقریبی Approximate Significance آمده است. نتایج این جدول نشان می‌دهد رابطه بین نوع جاده و تجهیزات مثبت و معنادار است.

اندازه‌ی عددی ارتباط بین کمیت‌های نوع جاده‌ها و تجهیزات جاده برابر با حدود 0.145 واحد است. مقدار احتمال تقریبی نیز معنادار و برابر با 0.036 شده است. این مطلب نشان می‌دهد که کمیت‌های نوع جاده و تجهیزات جاده در یک جهت حرکت می‌کنند. یعنی اگر از بزرگراه به سمت جاده‌های فرعی حرکت کنیم و از تجهیزات مناسب به سمت تجهیزات نامناسب برویم، با افزایش احتمال تعداد تصادفات مواجه خواهیم بود.

علاوه بر جداول آماری، نرم‌افزار SPSS نمودار خوشه میله‌ای زیر را نیز برای ما به دست آورده است.

نمودار خوشه میله‌ای نوع و تجهیزات جاده

در این نمودار فراوانی و درصد فراوانی به ازای هر کدام از انواع جاده‌ها و تجهیزات راهنمایی و رانندگی آن‌ها، آمده است.

در این متن درباره ضرایب همبستگی و به ویژه ضریب همبستگی Contingency Coefficient، فی Phi و کرامر Cramer’s V صحبت کردیم. نحوه به دست آوردن آن‌ها در نرم‌افزار SPSS را بیان کردیم و خروجی‌ها و نتایج آن‌ها را در Output نرم‌افزار نشان دادیم. همچنین یک نمودار خوشه میله‌ای در این زمبنه رسم کردیم.

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2022). Contingency Coefficient, Phi and Cramer’s V analyzes using SPSS software. Statistical tutorials and software guides. Retrieved Month, Day, Year, https://graphpad.ir/contingency-coefficient-phi-cramers-v.php

For example, if you viewed this guide on 12 th January 2022, you would use the following reference

GraphPad Statistics (2022). Contingency Coefficient, Phi and Cramer’s V analyzes using SPSS software. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/contingency-coefficient-phi-cramers-v.php

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.



اشتراک گذاری

دیدگاه شما

اولین دیدگاه را شما ارسال نمایید.