ضریب همبستگی پیرسن Pearson Correlation Coefficient در نرم افزار SPSS
همبستگی به مفهوم ارتباط میان دو یا چند کمیت با یکدیگر است و ضریب همبستگی مقدار عددی این ارتباط را بیان میکند. وقتی از ضریب همبستگی در جامعه صحبت میکنیم با مفهوم پارامتری آن روبهرو هستیم که آن را با نماد ρ نشان میدهیم و وقتی از جامعه نمونهگیری میشود، براورد نمونهای آن را با r نمایش میدهیم.
هر چقدر قدر مطلق ضریب همبستگی به عدد یک نزدیکتر باشد (در جهت مثبت یا در جهت منفی) ارتباط بین کمیتها بیشتر و کاملتر است. وقتی اندازه عددی ضریب همبستگی به مقادیر مثبت یک نزدیک است به معنای وجود ارتباط قوی و مستقیم است، به نحوی که افزایش یک کمیت افزایش کمیت دیگر را در پی دارد و یا کاهش آن سبب کاهش کمیت دیگر میشود. به همینترتیب اندازه عددی ضریب همبستگی نزدیک به مقادیر منفی یک به معنای وجود یک ارتباط قوی و وارون است که اندازههای عددی دو کمیت در جهت عکس یکدیگر رفتار میکنند. اندازههای عددی نزدیک به صفر نیز بدان معنا است که تغییرات یک کمیت، اطلاع کمی درباره تغییرات کمیت دیگر در اختیار ما قرار میدهد. نکتهای که باید در این میان به آن توجه کرد این است که ضریب همبستگی صفر و یا نزدیک صفر را نباید به مفهوم استقلال کمیتها از یکدیگر دانست. هر چند که ضریب همبستگی دو کمیت مستقل از یکدیگر، همواره صفر است.
همان گونه که میدانیم مشاهدات در چهار دستهی اسمی Nominal، رتبهای Ordinal، فاصلهای Interval و نسبتی Ratio طبقهبندی میشوند. خوب است این نکته را بدانید که نرمافزار SPSS به دادههای از نوع فاصلهای و نسبتی اصطلاحاً Scale میگوید. براساس این دستهبندیها انواع مختلف همبستگی بین کمیتها و دادهها معرفی میشوند. در واقع مبنای ایجاد و معرفی ضرایب همبستگی مختلف تا حد زیادی متأثر از ماهیت و مقیاس اندازهگیری میان کمیتها است. من در این متن قصد دارم به یکی از مهمترین انواع ضرایب همبستگی یعنی پیرسن Pearson بپردازم.
Pearson Correlation Coefficient
این ضریب همبستگی که به آن ضریب همبستگی ساده نیز میگویند، میتوان متداولترین نوع از مجموعه ضرایب همبستگی نامید. کاربرد آن زمانی است که توزیع توام مشاهدات نرمال بوده و از نوع نسبتی و کمی (گسسته یا پیوسته) باشند. این ضریب همبستگی ارتباط خطی بین کمیتها را نشان میدهد. آزمون فرضیه این ضریب همبستگی از نوع پارامتری است، به معنای آنکه توزیع آمارهی آن مشخص است.
همانگونه که در بحث فرضیههای آماری بیان کردیم، فرض صفر تفکر و ایده اولیه محقق از پژوهش خود میباشد، این فرض در پی پذیرش وضع موجود بوده و عدم ارتباط میان کمیتها را بیان میکند. فرضیه مربوط به ضرایب همبستگی به صورت زیر است.
فرض صفر این آزمون عدم ارتباط میان کمیتها و فرض مقابل وجود ارتباط و انواع ضرایب همبستگی ایجاد ساختار جدید را نشان میدهد. فراموش نکنیم که این آزمون میتواند علاوه بر تعریف دو دامنه (به صورت زیر) به صورت آزمون فرضیههای یکطرفه نیز تعریف شود.
بیایید این بحث را با استفاده از نرمافزار SPSS توضیح دهیم. فایل دیتای این مثال را میتوانید از اینجا دریافت کنید.
در تصویر زیر میتوانید بخشی از دادهها را مشاهده کنید.
دادههای مثال ضریب همبستگی پیرسن
ما در این مثال میخواهیم ضریب همبستگی بین شاخصهای قلبی و عروقی شامل crp ,chol و sbp به دست بیاوریم. برای این منظور لازم است ابتدا آزمون نرمال بودن مشاهدات انجام شود.
جهت انجام آزمون نرمالیتی از مسیر زیر در نرمافزار SPSS استفاده میکنیم.
Analyze → Nonparametric Tests → Legacy Dialogs → 1-Sample K-S
مسیر آزمون نرمالیتی در نرم افزار SPSS
با رفتن به این مسیر، پنجره زیر با نام One-Sample Kolmogorov-Smirnov Test برای ما باز میشود.
پنجره One-Sample Kolmogorov-Smirnov Test در نرمافزار SPSS
در کادر Test Variable List کمیتهایی که میخواهیم آزمون نرمالیتی بر روی آنها انجام شود را قرار میدهیم. همچنین در کادر Test Distribution گزینه Normal را انتخاب میکنیم. این کار سبب میشود، نرمافزار SPSS به انجام آزمون نرمالیتی بر روی شاخصهای قلبی و عروقی مطالعه ما بپردازد. OK کنید و نتایج را در پنجره Output نرمافزار ببینید.
نتیجه آزمون نرمالیتی کلوموگروف-اسمیرنف
نتیجه به دست آمده در جدول بالا نشان میدهد همه شاخصهای قلبی و عروقی مورد بررسی در این مثال، دارای توزیع نرمال هستند و مقدار احتمال آزمون نرمالیتی آنها از سطح معنیداری 0.05 درصد بالاتر است. به همین دلیل جهت سنجش ضریب همبستگی بین crp ,chol و sbp از روش پیرسن استفاده میکنیم.
مسیر انجام تحلیل همبستگی در نرمافزار SPSS به صورت زیر است.
Analyze → Correlate → Bivariate
مسیر انجام تحلیل همبستگی Bivariate در نرمافزار SPSS
پنجره زیر با نام Bivariate Correlation برای ما باز میشود.
پنجره Bivariate Correlation
در کادر Variables همان کمیتهایی را که میخواهیم ضریب همبستگی بین آنها به دست بیاید، قرار میدهیم. از آنجا که Variableها نرمال به دست آمدند بنابراین در بخش Correlation Coefficients ضریب همبستگی پیرسن Pearson را انتخاب میکنیم.
چنانچه علاقمند باشیم، علاوه بر ضرایب همبستگی فواصل اطمینان آنها را نیز به دست بیاوریم، بر روی تب Confidence interval میزنیم. با این کار وارد پنجره زیر میشویم.
پنجره به دست آوردن فواصل اطمینان ضرایب همبستگی
در این پنجره گزینه Estimate confidence interval of bivariate correlation parameter را انتخاب میکنیم. فاصله اطمینان را نیز میتوانیم به دلخواه روی 95% قرار دهیم. بهتر است گزینه Apply the bias adjustment انتخاب شود. این کار سبب میشود تنظیمات سوگیری یا همان bias که در نمونههای کوچک رخ میدهد اعمال شود.
Output
Continue کرده و سپس OK میکنیم. به این ترتیب نتایج و خروجیهای زیر در Output نرمافزار SPSS به دست میآید.
جدول ضرایب همبستگی
در جدول بالا می توانید عدد ضریب همبستگی پیرسن به همراه مقدار احتمال معناداری Sig را مشاهده کنید. نتایج این جدول نشان میدهد
- رابطه بین chol و crp مثبت و معنادار است. عدد ضریب همبستگی پیرسن در اینجا برابر با 0.305 و مقدار احتمال نیز کمتر از 0.001 به دست آمده است
- رابطه بین chol و sbp مثبت و معنادار است. عدد ضریب همبستگی پیرسن در اینجا برابر با 0.206 و مقدار احتمال نیز 0.012 به دست آمده است
- رابطه بین crp و sbp مثبت و معنادار است. عدد ضریب همبستگی پیرسن در اینجا برابر با 0.244 و مقدار احتمال نیز 0.003 به دست آمده است
همچنین برای ما فواصل اطمینان ضرایب همبستگی پیرسن نیز در جدول زیر به دست آمده است.
جدول Confidence Intervals فواصل اطمینان ضریب همبستگی پیرسن
به عنوان مثال فاصله اطمینان 95% برای ضریب همبستگی پیرسن بین chol و crp برابر با (0.442 ,0.151) به دست آمده است. نکته مهمی که در مبحث فواصل اطمینان ضرایب همبستگی مطرح است، این است که اگر این فاصله عدد صفر را در بر داشته باشد به معنای این است که رابطه همبستگی بین دو کمیت مورد بررسی، معنادار نیست. اما اگر فاصله اطمینان عدد صفر را در بر نداشته باشد به معنای وجود رابطه معنادار همبستگی بین آنها میباشد.
Scatter Plots
در مطالعات و موضوعات مرتبط با ضرایب همبستگی، رسم نمودارهای پراکنش و یا همان Scatter Plot خود را نشان میدهد. نمودارهای پراکنش میتوانند به ما فهم بهتر و دقیقتری از نحوه ارتباط بین Variableها ارایه کنند. آنها را میتوانیم با استفاده از مسیر زیر در نرم افزار SPSS رسم کنیم.
Graphs → Chart Builder
مسیر رسم انواع نمودارها در نرمافزار SPSS
با رفتن به این مسیر، پنجره زیر با نام Chart Builder که جهت رسم و طراحی انواع گرافهایی آماری از آن استفاده میشود، برای ما باز میشود. در این پنجره و محیط نرم افزار SPSS قابلیت و امکنات فراوانی جهت ترسیم انواع نمودارهای آماری قرار داده شده است. نمودار پراکنش در تصویر زیر مشخص شده است.
مسیر رسم نمودار پراکنش در نرمافزار SPSS
به عنوان مثال من میخواهیم نمودار پراکنش بین chol و crp را به دست بیاورم. مطابق تصویر زیر آنها را قرار میدهم.
رسم نمودار پراکنش بین chol و crp به تفکیک جنسیت و فعالیت بدنی
من در این نمودار chol را در محور x، شاخص crp را در محور y، جنسیت یعنی Gender را به عنوان Set color و فعالیت بدنی physical activity را به عنوان Set size قرار دادهام. گراف به دست آمده را میتوانید در شکل زیر ببینید.
نمودار پراکنش بین chol و crp به تفکیک جنسیت و فعالیت بدنی
در این متن درباره ضرایب همبستگی و به ویژه ضریب همبستگی پیرسن Pearson Correlation Coefficient صحبت کردیم. نحوه انجام و به دست آوردن این نوع از ضرایب همبستگی در نرمافزار SPSS را بیان کرده و درباره معناداری و یافتن فواصل اطمینان ضرایب همبستگی نیز توضیح دادیم. همچنین درباره رسم نمودارهای پراکنش که معمولاً در مطالعات همبستگی طراحی میشود نیز صحبت کردیم.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2022). Pearson Correlation Coefficient in SPSS software. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/pearson-correlation-coefficient-spss/.php
For example, if you viewed this guide on 12 th January 2022, you would use the following reference
GraphPad Statistics (2022). Pearson Correlation Coefficient in SPSS software. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/pearson-correlation-coefficient-spss/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.
مفهوم ضریب همبستگی چیست و چه کاربردی دارد؟
- مفهومی کلی از ضریب همبستگی در ذهن داشته باشند.
- وقتی جایی در گزارشی میخوانند که دو متغیر با هم ضریب همبستگی مثبت یا منفی دارند، منظور کلی نویسنده یا محقق را درک کنند.
- مراقب باشند که ضریب همبستگی را با رابطهی بین علت و معلول اشتباه نگیرند.
- در موارد ساده، با استفاده از نرم افزار اکسل، بتوانند ضریب همبستگی را محاسبه کنند.
بحث ضریب همبستگی بحث بسیار گستردهای است که دامنهی آن از فلسفه تا آمار و از نیوتون تا هایزنبرگ گسترده است.
طبیعتاً قصد ما در این درس، این نیست که شما را درگیر پیچیدگیهای این موضوع کنیم.
اما میخواهیم چند نکتهی ساده دربارهی همبستگی را مطرح کنیم تا در درسهای دیگر بتوانیم به آن ارجاع دهیم.
در ابتدای این درس، یک توضیح غیردقیق و سادهشده از ضریب همبستگی ارائه میکنیم که برای بسیاری از درسهای متمم کافی است. در ادامه (بخش پایانی) توضیحات کاملتری دربارهی ضریب همبستگی ارائه شده است.
اگر قرار نیست کارهای مطالعاتی و تحقیقاتی پیچیده انجام دهید و فقط میخواهید در هنگام مطالعهی متنهای عمومی مدیریتی، درک درستی از ضریب همبستگی داشته باشید، احتمالاً توضیحات زیر برای شما کافی خواهد بود:
- اگر ضریب همبستگی دو پارامتر با یکدیگر مثبت باشد، به این معناست که در فضایی که مطالعه و بررسی انجام شده، افزایش یک پارامتر با افزایش پارامتر دیگر و نیز کاهش آن پارامتر با کاهش پارامتر دیگر همراه است.
- اگر ضریب همبستگی دو پارامتر با یکدیگر منفی باشد، به این معناست که در فضایی که مطالعه و بررسی انجام شده، افزایش یک پارامتربا کاهش پارامتر دیگر و کاهش آن پارامتربا افزایش پارامتر دیگر همراه است.
- صفر بودن ضریب همبستگی به این معناست که دو پارامتر – در فضایی که مورد بررسی قرار گرفته – مستقل از یکدیگر بودهاند و بر اساس اطلاعات موجود ازکاهش یا افزایش یکی، نمیتوان در مورد کاهش یا افزایش دیگری اظهار نظر کرد.
- ضریب همبستگی بین منفی یک و مثبت یک است. هر چه این ضریب از صفر دورتر شود (و به مثبت یا منفی یک نزدیکتر شود) میتوان نتیجه گرفت که روند هم جهت بودن یا مخالف بودن دو پارامتر مورد بررسی، جدیتر است.
- ضریب همبستگی هیچ ارتباطی با رابطهی علت و معلول ندارد. احتمال دارد در یک جامعهی آماری، بین حجم موتور ماشین و درآمد مالک ماشین، ضریب همبستگی مثبت وجود داشته باشد. اما این بدان معنی نیست که اگر ماشینی بخرید که حجم موتور بالاتری دارد، ثروتمندتر میشوید یا اگر سپردهی بانکی شما افزایش یابد، حجم موتور ماشین شما رشد خواهد کرد. این بحث را میتوانید به شکل دقیقتر در درس نظریه علمی یا واقعیت آماری مطالعه کنید.
بعضی از بحثهای متمم که به نوعی با ضریب همبستگی رابطه دارند:
بسته به هدفی که دارید و جامعهی آماری که مد نظر شماست، شیوههای متعددی برای محاسبهی ضریب همبستگی یا Correlation Coefficient وجود دارد.
برای اینکه با یکی از شیوههای محاسبهی ضریب همبستگی آشنا شویم، ما در اینجا ضریب همبستگی پیرسون را به عنوان نمونه انتخاب کردهایم. این ضریب در مقالات تحقیقاتی معمولاً با نماد r نمایش داده میشود.
همانطور که در درس نظریه علمی یا واقعیت آماری اشاره شد، مهمترین نکتهای که باید در مورد ضریب همبستگی به خاطر داشته باشیم این است که ضریب همبستگی، به رابطهی علت با معلول اشاره نمیکند و صرفاً مشخص میکند که بین دو متغیر رابطه خطی وجود دارد.
به عنوان مثال، تحقیقات نشان میدهند که ضریب همبستگی بین تعداد سیگارهایی که یک نفر در طول زندگی کشیده و عمر او، منفی است.
اما از این تحقیق نمیتوان نتیجه گرفت که سیگار کشیدن، عمر را کوتاه میکند.
ممکن است این دو متغیر، تابع متغیر سومی به نام سختیهای زندگی باشند.
به این معنی که با افزایش سختیهای زندگی، تنش افزایش یافته و با افزایش تنش، ضمن اینکه تعداد سیگارهای مصرفی افزایش مییابد، عمر نیز کاهش یابد.
اگر چه در این مثال خاص، تحقیقات متعدد دیگر نشان دادهاند که مصرف سیگار میتواند علت مستقیم کاهش عمر باشد، اما این نتیجه را نمیتوان صرفاً از منفی بودن ضریب همبستگی استخراج کرد.
علمی و پژوهشی با نرم افزار های آماری
ضریب همبستگی شاخصی است ریاضی که جهت و مقدار رابطه ی بین دو متغیر را توصیف میکند.
ضریب همبستگی درمورد توزیع های دویا چند متغیره به کار مي رود .
اگر مقادیر دو متغیر شبیه هم تغییر کند یعنی با کم یا زیاد شدن یکی دیگری هم کم یا زیا د شود به گونه ای که بتوان رابطه آنها را به صورت یک معادله بیان کرد گوییم بین این دو متغیرهمبستگی وجود دارد.
نمودار پراکنش یا دیاگرام پراکندگی بهترین تصویر برای نشان دادن همبستگی بین دو متغیر است .
برای سنجش همبستگی ضرایب گوناگون به کار می رود که مهمترین آنها ضریب همبستگی ساده پیرسون ، ضریب همبستگی اسپیرمن و ضریب همبستگی کندال است:
1 -اگر هر دو متغیر با مقیاس رتبه ای باشند از شاخص تاو- کندال استفاده می کنیم.
2-اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از ضریب همبستگی پیرسون استفاده می شود .
3- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از ضریب همبستگی اسپیرمن استفاده می کنیم.
برای ترکیبی از انواع متغیرها از هر دو نوع شاخص همبستگی استفاده می کنیم در صورت عدم تفاوت فاحش بین آن دو شاخص می توان مقدار گزارش شده را پذیرفت ، اگر تفاوت چشمگیر بود مقداری که قدر مطلقش کوچکتر است را می پذیریم.
ضریب همبستگی به عنوان معیاری برای سنجش تغییرات y,x نسبت به هم دارای خواص مطلوبی است:
( 1 به مبدا و واحد اندازه گیری متکی نیست.
اگر ρ به 1یا 1- نزدیکباشدیافته های y و x اطراف یک خط راست می باشند و اگر 0= ρ باشد متغیرها ناهمبسته اند.
ضریب همبستگی
ضریب همبستگی : عددی بین ۱- و ۱ است که قدرت و جهت رابطه بین متغیرها را به شما می گوید. به عبارت دیگر، نشان می دهد که اندازه گیری دو یا چند متغیر در یک مجموعه داده چقدر شبیه است.
ضریب همبستگی1 : همبستگی مثبت کامل
هنگامی که یک متغیر تغییر می کند، متغیرهای دیگر در همان جهت تغییر می کنند.
ضریب همبستگی0 : همبستگی صفر هیچ رابطه ای بین متغیرها وجود ندارد.
ضریب همبستگی -1 : همبستگی منفی کامل
هنگامی که یک متغیر تغییر می کند، متغیرهای دیگر در جهت مخالف تغییر می کنند.
یک ضریب همبستگی به شما چه می گوید؟
ضرایب همبستگی داده ها را خلاصه می کند و به شما کمک می کند نتایج را بین مطالعات مقایسه کنید.
جمع بندی داده ها
ضریب همبستگی یک آمار توصیفی است. این بدان معنی است که داده های نمونه را بدون اینکه به شما اجازه دهد چیزی در مورد جامعه استنباط کنید، خلاصه می شود.
ضریب همبستگی زمانی که رابطه بین دو متغیر را خلاصه می کند یک آمار دو متغیره است و زمانی که بیش از دو متغیر دارید یک آماره چند متغیره است.
اگر ضریب همبستگی شما بر اساس داده های نمونه باشد، اگر می خواهید نتایج خود را به جامعه تعمیم دهید، به یک آمار استنباطی نیاز خواهید داشت. برای محاسبه آمار آزمونی که اهمیت آماری یافته شما را به شما می گوید، می توانید از آزمون F یا آزمون t استفاده کنید.
مقایسه مطالعات
ضریب همبستگی نیز یک اندازه گیری اندازه اثر است که اهمیت عملی یک نتیجه را به شما می گوید. ضرایب بدون واحد هستند که امکان مقایسه مستقیم ضرایب بین مطالعات را فراهم می کند.
با استفاده از ضریب همبستگی
در تحقیقات همبستگی، شما بررسی می کنید که آیا تغییرات در یک متغیر با تغییرات در متغیرهای دیگر مرتبط است یا خیر.
مثال : شما بررسی می کنید که آیا نمرات استاندارد شده از دبیرستان با نمرات تحصیلی در کالج مرتبط است یا خیر. شما پیشبینی میکنید که یک همبستگی مثبت وجود دارد: نمرات SAT بالاتر با معدل بالاتر دانشگاه مرتبط است در حالی که نمرات SAT پایین با معدل پایینتر دانشگاه انواع ضرایب همبستگی مرتبط است.
پس از جمعآوری دادهها، میتوانید با ترسیم یک متغیر در محور x و دیگری در محور y، دادههای خود را با یک نمودار پراکنده تجسم کنید. فرقی نمی کند که کدام متغیر را روی هر دو محور قرار دهید.
نمودار خود را به صورت بصری برای یک الگو بررسی کنید و تصمیم بگیرید که آیا یک الگوی خطی یا غیر خطی بین متغیرها وجود دارد. یک الگوی خطی به این معنی است که شما می توانید یک خط مستقیم با بهترین تناسب بین نقاط داده قرار دهید، در حالی که یک الگوی غیر خطی یا منحنی می تواند انواع اشکال مختلف مانند U-شکل یا یک خط با منحنی را داشته باشد.
ضرایب زیادی وجود دارد که می توانید آنها را محاسبه کنید. پس از حذف هر گونه نقاط پرت، ضریب همبستگی مناسب را بر اساس شکل کلی الگوی نمودار پراکندگی انتخاب کنید.
سپس می توانید یک تحلیل همبستگی برای یافتن ضریب برای داده های خود انجام دهید. شما یک ضریب را برای خلاصه کردن رابطه بین متغیرها بدون نتیجه گیری در مورد علیت محاسبه می کنید.
تفسیر ضریب همبستگی
مقدار ضریب همبستگی همیشه بین 1 و -1 است و شما آن را به عنوان یک شاخص کلی از قدرت رابطه بین متغیرها در نظر می گیرید. علامت ضریب نشان می دهد که آیا متغیرها در جهت یکسان یا مخالف تغییر می کنند: مقدار مثبت به معنای تغییر متغیرها با هم در یک جهت است، در حالی که مقدار منفی به این معنی است که آنها با هم در جهت مخالف تغییر می کنند.
قدر مطلق یک عدد برابر است با عدد بدون علامت آن قدر مطلق یک ضریب همبستگی، بزرگی همبستگی را به شما می گوید: هر چه قدر مطلق بیشتر باشد، همبستگی قوی تر است.
دستورالعمل های مختلفی برای تفسیر ضریب همبستگی وجود دارد، زیرا یافته ها می توانند بین رشته های مورد مطالعه بسیار متفاوت باشند. می توانید از جدول زیر به عنوان یک دستورالعمل کلی برای تفسیر قدرت همبستگی از مقدار ضریب همبستگی استفاده کنید.
در حالی که این دستورالعمل به طور کلی مفید است، بسیار مهمتر است که زمینه و هدف تحقیق خود را هنگام نتیجه گیری در نظر بگیرید. برای مثال، اگر اکثر مطالعات در رشته شما دارای ضرایب همبستگی نزدیک به 0.9 هستند، ممکن است ضریب همبستگی 0.58 در آن زمینه پایین باشد.
تجسم همبستگی های خطی
ضریب همبستگی به شما می گوید که داده های شما چقدر نزدیک به یک خط قرار می گیرند. اگر یک رابطه خطی دارید، یک خط مستقیم از بهترین تناسب ترسیم خواهید کرد که تمام نقاط داده شما را در نمودار پراکنده در نظر می گیرد.
هرچه نقاط شما به این خط نزدیکتر باشد، ضریب همبستگی قدر مطلق بالاتر و همبستگی خطی شما قوی تر می شود. اگر همه نقاط کاملاً روی این خط باشند، شما یک همبستگی کامل دارید.
توجه داشته باشید که شیب یا شیب خط با مقدار ضریب ارتباطی ندارد. ضریب همبستگی به شما کمک نمیکند پیشبینی کنید که یک متغیر بر اساس یک تغییر معین در دیگری چقدر تغییر میکند، زیرا دو مجموعه داده با مقدار ضریب همبستگی یکسان میتوانند خطوطی با شیبهای بسیار متفاوت داشته باشند.
انواع ضرایب همبستگی
شما می توانید از میان ضرایب همبستگی مختلف بر اساس خطی بودن رابطه، سطح اندازه گیری متغیرهای خود و توزیع داده های خود انتخاب کنید.
برای قدرت و دقت آماری بالا، بهتر است از ضریب همبستگی که برای دادههای شما مناسبتر است استفاده کنید. متداول ترین ضریب همبستگی ضریب پیرسون r است زیرا امکان استنتاج قوی را فراهم می کند. پارامتری است و روابط خطی را اندازه گیری می کند. اما اگر دادههای شما تمام فرضیات این تست را برآورده نمیکند، باید به جای آن از یک تست ناپارامتریک استفاده کنید.
آزمون های ناپارامتریک ضرایب همبستگی رتبه ای، روابط غیرخطی بین متغیرها را خلاصه می کند. تاو اسپیرمن و تاو کندال شرایط یکسانی برای استفاده دارند، اما تاو کندال به طور کلی برای نمونههای کوچکتر ترجیح داده میشود، در حالی که rho اسپیرمن بیشتر مورد استفاده قرار میگیرد.
آر پیرسون
ضریب همبستگی لحظه-محصول پیرسون، همچنین به عنوان r پیرسون شناخته می شود، رابطه خطی بین دو متغیر کمی را توصیف می کند. اگر میخواهید از r پیرسون استفاده کنید، اینها مفروضاتی هستند که دادههای شما باید رعایت کنند:
هر دو متغیر در یک سطح فاصله یا نسبت اندازه گیری هستند
داده های هر دو متغیر از توزیع های نرمال پیروی می کنند
داده های شما هیچ نقطه پرت ندارد
داده های شما از یک نمونه تصادفی یا نماینده است
شما انتظار یک رابطه خطی بین دو متغیر را دارید
پیرسون r یک تست پارامتریک است، بنابراین قدرت بالایی دارد. اما اگر متغیرهای شما یک رابطه غیرخطی داشته باشند، یا اگر دادههای شما دارای نقاط پرت، توزیعهای اریب یا از متغیرهای طبقهبندی شده باشند، معیار خوبی برای همبستگی نیست.
اگر هر یک از این مفروضات نقض شد، باید یک معیار همبستگی رتبه ای را در نظر بگیرید. فرمول پیرسون r پیچیده است، اما اکثر برنامه های کامپیوتری می توانند به سرعت ضریب همبستگی را از داده های شما بدست آورند. در شکل ساده تر، فرمول کوواریانس بین متغیرها را بر حاصل ضرب انحراف معیار آنها تقسیم می کند.
نمونه پیرسون در مقابل فرمول ضریب همبستگی جمعیت
هنگام استفاده از فرمول ضریب همبستگی پیرسون، باید در نظر بگیرید که آیا با داده های یک نمونه سروکار دارید یا کل جامعه. فرمول های نمونه و جمعیت در نمادها و ورودی هایشان متفاوت است. یک ضریب همبستگی نمونه r، در حالی که ضریب همبستگی جمعیتی rho، حرف یونانی ρ نامیده می شود. ضریب همبستگی نمونه از کوواریانس نمونه بین متغیرها و انحراف معیار نمونه آنها استفاده می کند.
ضریب همبستگی جمعیت از کوواریانس جامعه بین متغیرها و انحراف معیار جمعیت آنها استفاده می کند.
اسپیرمن رو
rho اسپیرمن یا ضریب همبستگی رتبه اسپیرمن رایجترین جایگزین برای r پیرسون است. این یک ضریب همبستگی رتبه ای است زیرا از رتبه بندی داده ها از هر متغیر (به عنوان مثال از پایین ترین به بالاترین) به جای خود داده خام استفاده می کند.
زمانی که داده های شما با مفروضات پیرسون r مطابقت ندارند، باید از rho اسپیرمن استفاده کنید. این زمانی اتفاق می افتد که حداقل یکی از متغیرهای شما در سطح ترتیبی اندازه گیری باشد یا زمانی که داده های یک یا هر دو متغیر از توزیع های نرمال پیروی نمی کنند.
در حالی که پیرسون خطی بودن روابط را اندازه گیری می کند، ضریب اسپیرمن یکنواختی روابط را اندازه گیری می کند. در یک رابطه خطی، هر متغیر در یک جهت با سرعت یکسان در سراسر محدوده داده تغییر می کند. در یک رابطه یکنواخت، هر متغیر نیز همیشه فقط در یک جهت تغییر میکند، اما نه لزوماً با همان سرعت.
یکنواخت مثبت: وقتی یک متغیر افزایش می یابد، متغیر دیگر نیز افزایش می یابد.
یکنواخت منفی: وقتی یک متغیر افزایش می یابد، متغیر دیگر کاهش می یابد.
روابط یکنواخت نسبت به روابط خطی محدودیت کمتری دارند.
فرمول ضریب همبستگی رتبه اسپیرمن
نمادهای اسپیرمن rho برای ضریب جمعیت ρ و برای ضریب نمونه rs هستند. فرمول ضریب همبستگی پیرسون را بین رتبه بندی داده های متغیر محاسبه می کند.
برای استفاده از این فرمول، ابتدا داده های هر متغیر را به طور جداگانه از کم به زیاد رتبه بندی می کنید: هر نقطه داده رتبه ای از اول، دوم یا سوم و غیره می گیرد.
سپس، تفاوت های (di) بین رتبه های متغیرهای خود را برای هر جفت داده پیدا خواهید کرد و آن را به عنوان ورودی اصلی فرمول در نظر می گیرید.
اگر ضریب 1 داشته باشید، همه رتبهبندیها برای هر متغیر برای هر جفت داده مطابقت دارند. اگر ضریب 1- داشته باشید، رتبه بندی یک متغیر دقیقا برعکس رتبه بندی متغیر دیگر است. ضریب همبستگی نزدیک به صفر به این معنی است که هیچ رابطه یکنواختی بین رتبه بندی متغیرها وجود ندارد.
سایر ضرایب
ضریب همبستگی مربوط به دو ضریب دیگر است و اینها اطلاعات بیشتری در مورد رابطه بین متغیرها به شما می دهند.
ضریب تعیین
وقتی انواع ضرایب همبستگی ضریب همبستگی را مجذور می کنید، در نهایت به همبستگی تعیین (r2) می رسید. این نسبت واریانس مشترک بین متغیرها است. ضریب تعیین همیشه بین 0 و 1 است و اغلب به صورت درصد بیان می شود.
از ضریب تعیین در مدل های رگرسیونی برای اندازه گیری اینکه چقدر از واریانس یک متغیر با واریانس متغیر دیگر توضیح داده می شود استفاده می شود. تجزیه و تحلیل رگرسیون به شما کمک می کند تا معادله خط بهترین تناسب را پیدا کنید و می توانید از آن برای پیش بینی مقدار یک متغیر با توجه به مقدار متغیر دیگر استفاده کنید.
r2 بالا به این معنی است که مقدار زیادی از تغییرپذیری در یک متغیر توسط رابطه آن با متغیر دیگر تعیین می شود. r2 پایین به این معنی است که تنها بخش کوچکی از تغییرپذیری یک متغیر با رابطه آن با متغیر دیگر توضیح داده می شود.
روابط با سایر متغیرها به احتمال زیاد واریانس متغیر را محاسبه می کند. ضریب اغلب می تواند رابطه بین متغیرها را به ویژه در نمونه های کوچک بیش از حد تخمین بزند، بنابراین ضریب تعیین اغلب نشانگر بهتری از رابطه است.
ضریب بیگانگی
وقتی ضریب تعیین را از وحدت (یک) بردارید، ضریب بیگانگی را خواهید گرفت. این نسبت واریانس مشترک بین متغیرها مشترک نیست، واریانس غیرقابل توضیح بین متغیرها. ضریب بیگانگی بالا نشان می دهد که این دو متغیر واریانس بسیار کمی دارند. ضریب بیگانگی پایین به این معنی است که مقدار زیادی از واریانس توسط رابطه بین متغیرها محاسبه می شود.
ضریب همبستگی C، فی Phi و کرامر Cramer’s V
همبستگی به مفهوم ارتباط میان دو یا چند کمیت با یکدیگر است و ضریب همبستگی مقدار عددی این ارتباط را بیان میکند. وقتی از ضریب همبستگی در جامعه صحبت میکنیم با مفهوم پارامتری آن روبهرو هستیم که آن را با نماد ρ نشان میدهیم و وقتی از جامعه نمونهگیری میشود، براورد نمونهای آن را با r نمایش میدهیم.
هر چقدر قدر مطلق ضریب همبستگی به عدد یک نزدیکتر باشد (در جهت مثبت یا در جهت منفی) ارتباط بین کمیتها بیشتر و کاملتر است. وقتی اندازه عددی ضریب همبستگی به مقادیر مثبت یک نزدیک است به معنای وجود ارتباط قوی و مستقیم است، به نحوی که افزایش یک کمیت افزایش کمیت دیگر را در پی دارد و یا کاهش آن سبب کاهش کمیت دیگر میشود. به همینترتیب اندازه عددی ضریب همبستگی نزدیک به مقادیر منفی یک به معنای وجود یک ارتباط قوی و وارون است که اندازههای عددی دو کمیت در جهت عکس یکدیگر رفتار میکنند. اندازههای عددی نزدیک به صفر نیز بدان معنا است که تغییرات یک کمیت، اطلاع کمی درباره تغییرات کمیت دیگر در اختیار ما قرار میدهد. نکتهای که باید در این میان به آن توجه کرد این است که ضریب همبستگی صفر و یا نزدیک صفر را نباید به مفهوم استقلال کمیتها از یکدیگر دانست. هر چند که ضریب همبستگی دو کمیت مستقل از یکدیگر، همواره صفر است.
همان گونه که میدانیم مشاهدات در چهار دستهی اسمی Nominal، رتبهای Ordinal، فاصلهای Interval و نسبتی Ratio طبقهبندی میشوند. خوب است این نکته را بدانید که نرمافزار SPSS به دادههای از نوع فاصلهای و نسبتی اصطلاحاً Scale میگوید. براساس این دستهبندیها انواع مختلف همبستگی بین کمیتها و دادهها معرفی میشوند. در واقع مبنای ایجاد و معرفی ضرایب همبستگی مختلف تا حد زیادی متأثر از ماهیت و مقیاس اندازهگیری میان کمیتها است. من در این متن قصد دارم به یکی از مهمترین انواع ضرایب همبستگی یعنی پیرسن Pearson بپردازم.
Contingency Coefficient, Phi and Cramer’s V
انواع مختلف ضرایب همبستگی برای مشاهدات اسمی، رتبهای و فاصلهای را میتوان براساس نوع مشاهدات از طریق مسیر زیر در نرمافزار SPSS مشاهده کرد.
Analyze → Descriptive statistics → Crosstabs
مسیر انجام ضرایب همبستگی در جداول توافقی
این ضرایب در گزینهی Statistics قابل مشاهده میباشند. ما به صورت مختصر به معرفی برخی از ضرایب میپردازیم. دقت کنید که این ضرایب بیشتر در جداول توافقی و بررسی دو کمیت، مورد استفاده قرار میگیرند. ما از محاسبات عددی چگونگی یافتن مقادیر این ضرایب خودداری میکنیم و برای این منظور از نرمافزار استفاده میکنیم. تصویر زیر را ببینید.
انواع ضرایب همبستگی در جداول توافقی نرمافزار SPSS
همانگونه که در بحث فرضیههای آماری بیان کردیم، فرض صفر تفکر و ایده اولیه محقق از پژوهش خود میباشد، این فرض در پی پذیرش وضع موجود بوده و عدم ارتباط میان کمیتها را بیان میکند. فرضیه مربوط به ضرایب همبستگی به صورت زیر است.
فرض صفر این آزمون عدم ارتباط میان کمیتها و فرض مقابل وجود ارتباط و ایجاد ساختار جدید را نشان میدهد. فراموش نکنیم که این آزمون میتواند علاوه بر تعریف دو دامنه (به صورت زیر) به صورت آزمون فرضیههای یکطرفه نیز تعریف شود.
بیایید این بحث را با استفاده از نرمافزار SPSS توضیح دهیم. فایل دیتای این مثال را میتوانید از اینجا دریافت کنید. در ادامه دربارهی این مثال توضیح میدهیم.
فرض کنید جدول زیر مربوط به تعداد تصادفات رانندگی در جادههای استان اصفهان در طی یکسال، برحسب نوع جادهها و تجهیزات راهنمایی و رانندگی مناسب و یا نامناسب و غیر کافی است.
جدول توافقی نوع و وضعیت جاده | وضعیت جادهها از نظر تجهیزات راهنمایی و رانندگی | |||
مناسب و کافی | نامناسب و غیرکافی | مجموع | ||
نوع جادههای مورد مطالعه | بزرگراه | 44 | 108 | 152 |
جاده اصلی | 36 | 50 | 86 | |
جاده فرعی | 33 | 42 | 75 | |
مجموع | 113 | 200 | 313 |
از آنجا که دادههای ما اسمی Nominal هستند، جهت به دست آوردن ضریب همبستگی بین نوع جادهها و وضعیت تجهیزات راهنمایی و رانندگی جادهها، میتوانیم از روشهای ضریب همبستگی احتمالی با نام Contingency Coefficient که به اختصار به آن ضریب همبستگی C گفته میشود و همچنین ضریب همبستگی فی و کرامر Phi and Cramer’s V، استفاده کنیم.
با این حال در گام ابتدایی لازم است، دادههای جدول بالا وارد نرمافزار شوند. ما آنها را به صورت تصویر زیر در SPSS نوشتهایم.
نحوه وارد کردن دادهها به نرمافزار
در مرحلهی بعد باید دادههای ستون Accidents_F را وزندهی کنیم. دربارهی روش و چگونگی وزندهی کردن دادهها در نرمافزار SPSS، این لینک را ببینید.
پس از وزندهی دادهها با استفاده از مسیر زیر که در بالا نیز اشاره کردیم، به یافتن ضرایب همبستگی C، فی و کرامر میپردازیم.
Analyze → Descriptive statistics → Crosstabs
پس از رفتن به مسیر بالا، پنجره زیر با نام Crosstabs برای ما باز میشود.
پنجره Crosstabs و ورود Variableها
در کادر Row کمیت Road را قرار میدهیم. در کادر Column نیز Equipment را قرار میدهیم. البته این انتخاب دلخواه است و در تحلیل فرقی ندارد سطر و ستون انواع ضرایب همبستگی را کدام Variable قرار دهیم.
چنانچه علاقمند باشیم، نموداری از دادهها نیز به دست بیاید میتوانیم گزینه Display clustered bar charts را انتخاب کنیم.
ما در این مثال به دنبال به دست آوردن ضرایب همبستگی مربوط به دادههای اسمی بودیم. لازم است آنها را انتخاب کنیم. این کار با استفاده از تب Statistics انجام میشود. بر روی آن میزنیم و وارد پنجره Crosstabs Statistics میشویم.
انتخاب ضرایب همبستگی C، فی و کرامر
در این پنجره و در کادر Nominal، گزینههای Contingency Coefficient و Phi and Cramer’s V، را انتخاب میکنیم. خوب است بدانید که یکی از مسیرهای انجام تحلیل پرکاربرد کای دو Chi-square در همین پنجره است.
Output
Continue کرده و سپس OK میکنیم. به این ترتیب نتایج و خروجیهای زیر در Output نرمافزار SPSS به دست میآید.
جدول توافقی بین نوع و تجهیزات جاده
در جدول بالا می توانید فراوانی تعداد تصادفات براساس نوع جاده و وضعیت تجهیزات راهنمایی و رانندگی جاده را مشاهده کنید. این جدول در حال حاضر یافته مهمی برای ما ندارد و همان جدول توصیفی بالا است.
در ادامه و در جدول با نام Symmetric Measures اندازههای عددی ضریب همبستگی C به همراه فی Phi و کرامر Cramer’s V آمده است.
جدول Symmetric Measures
در این جدول عدد ضریب همبستگی فی، کرامر و Contingency به همراه مقدار احتمال معناداری تقریبی Approximate Significance آمده است. نتایج این جدول نشان میدهد رابطه بین نوع جاده و تجهیزات مثبت و معنادار است.
اندازهی عددی ارتباط بین کمیتهای نوع جادهها و تجهیزات جاده برابر با حدود 0.145 واحد است. مقدار احتمال تقریبی نیز معنادار و برابر با 0.036 شده است. این مطلب نشان میدهد که کمیتهای نوع جاده و تجهیزات جاده در یک جهت حرکت میکنند. یعنی اگر از بزرگراه به سمت جادههای فرعی حرکت کنیم و از تجهیزات مناسب به سمت تجهیزات نامناسب برویم، با افزایش احتمال تعداد تصادفات مواجه خواهیم بود.
علاوه بر جداول آماری، نرمافزار SPSS نمودار خوشه میلهای زیر را نیز برای ما به دست آورده است.
نمودار خوشه میلهای نوع و تجهیزات جاده
در این نمودار فراوانی و درصد فراوانی به ازای هر کدام از انواع جادهها و تجهیزات راهنمایی و رانندگی آنها، آمده است.
در این متن درباره ضرایب همبستگی و به ویژه ضریب همبستگی Contingency Coefficient، فی Phi و کرامر Cramer’s V صحبت کردیم. نحوه به دست آوردن آنها در نرمافزار SPSS را بیان کردیم و خروجیها و نتایج آنها را در Output نرمافزار نشان دادیم. همچنین یک نمودار خوشه میلهای در این زمبنه رسم کردیم.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2022). Contingency Coefficient, Phi and Cramer’s V analyzes using SPSS software. Statistical tutorials and software guides. Retrieved Month, Day, Year, https://graphpad.ir/contingency-coefficient-phi-cramers-v.php
For example, if you viewed this guide on 12 th January 2022, you would use the following reference
GraphPad Statistics (2022). Contingency Coefficient, Phi and Cramer’s V analyzes using SPSS software. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/contingency-coefficient-phi-cramers-v.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.
دیدگاه شما