مقدمه آموزش spss مبحث رگرسیون 

موسسه پایا پروژه به عنوان متصدی انجام پروژه های آمار و spss  وظیفه ی خود می داند که در راستای آموزش نرم افزار spss گام های موثری را بردارد. با توجه به اینکه یک دوره آموزشی spss مستلزم تمرین و تلاش بسیار است. اما این موسسه تلاش می کند سهم کوچکی در جهت یادگیری شما داشته باشد.

۱‏-‏۱ رگرسیون

رگرسيون در لغت به معنی بازگشت می­باشد، و منظور از آن وجود یک رابطه(معادله) ریاضی بین متغیرهای مسأله، که به ما امکان پیش­بینی و بررسی تغییرات یک متغیر، بوسیله­ی سایر متغیرات را می­دهد. مبحث رگرسیون در ارتباط با مبحث برازش منحنی در آنالیز عددی است. منظور از برازش منحنی یعنی عبور دادن یک معادله­ی خطی یا غیرخطی(توان ۲ یا…) از بین نمودار پراکنش متغیرهای مسأله (xوy) است. واضح است که ما همیشه به دنبال رابطه­ای هستیم که بهترین وضعیت را داشته باشد.

به عنوان مثال میزان برداشت بذر گندم و میزان کود را در نظر بگیرید. همه مي­دانيم که اين رابطه يک رابطه­ی مستقيم نیست به این معنا که هرچه میزان کود بیشتر باشد، میزان برداشت گندم نیز بیشتر است، اما مي توان گفت که با احتمال قابل قبولي میزان کود بیشتر باعث افزایش مزان برداشت گندم نیز می­شود. در اينجا پيش بيني میزان برداشت بوسیله­ی میزان کود، با روش آماري رگرسيون خطي صورت مي­پذيرد که اين رابطه را به صورت کمي به ما نشان مي دهد.  در مثال فوق معادله رگرسيون خطي مي­تواند به صورت زير باشد:

میزان برداشت گندم = * b میزان کود+a

اين خط را پس از محاسبه ضرايب a و b رسم نموده و از آن به عنوان خط رگرسیونی یاد می­کنند.(https://spss-iran.ir/WhatRegression.php)

۱‏-‏۱‏-‏۱ ارتباط بین همبستگي و رگرسيون

همبستگي بين دو متغير بیانگر میزان ارتباط بین آن­هاست. این ارتباط(همبستگي) را با ضريب همبستگي پيرسون اندازه گيري مي­کنند که این مقدار بين منفی و يک است. هر چه مقدار همبستگي به عدد يک نزديک تر باشد، همبستگي بين دو متغير بيشتر خواهد بود به این معنا که با افزایش مقادیر یک متغیر، شاهد افزایش مقادیر متغیر دیگر خواهیم بود (و بالعکس). واضح است که وجود این ارتباط، تشکیل رگرسیون را ممکن می­سازد زیرا اگر همبستگی­ای وجود نداشته باشد خط رگرسیون در پیش­بینی و بیان تغییرات کارا نمی­باشد.

با رسم نمودار پراکنش، ميزان همبستگي دو متغير ديده شده و همچنین ایده­ی اولیه برای تشکیل رگرسیون را می­دهد.

۱‏-‏۱‏-‏۲ توزيع نرمال

توزيع نرمال يکی از کاربردي­ترين توزيع­های پيوسته و حد يا تقريب ساير توزيع­ها است. توزيع نرمال با ميانگين  و واريانس  به عنوان پارامترهايش به صورت ( ) است.

جدول توابع اعداد تصادفی، تابع احتمال، تابع توزيع نرمال و معکوس آن عبارتند از:

۱‏-‏۲ آزمون کلموگروف اسمیرنوف[۱]

يکی از روش­هاي آزمون نيکويي برازش توزيع­هاي احتمال به مجموعه­اي از مشاهدت، آزمون تک نمونه­اي کلموگروف اسمیرنوف است. آزمون کلموگروف اسمیرنوف تک نمونه­ای[۲]، توزیع یک صفت در یک نمونه با توزیعی که برای آن جامعه مفروض است، مقایسه می­شود. این آزمون ناپارامتری[۳] یعنی بدون توزیع بوده و به عبارت ساده­تر فرض برقراری توزیع خاصی مثل نرمالیتی بر روی داده­ها نیاز نیست. در تحلیل­ها از این آزمون برای بررسی میزان تخطی داده­ها از توزیع نرمال استفاده و در صورتی که شواهد محکمی دال بر تخطی از نرمال بودن پیدا نشود، فرض ” نرمال بودن توزیع جامعه ای که داده ها از آن آمده­اند “ را رد نمی­کنند [۷].

در آزمون، فرض­های مورد نظر به­صورت زیر است:

۱‏-‏۳ نرمال سازی با تبدیل باکس­کاکس[۴]

در مواردی که فرض نرمالت بوسیله آزمون فوق رد شود، از تبدلاتی برای این منظور استفاده شده که مهمترین آن­ها، تبدلات باکس-کاکس می­باشد. به طور کلی، روش نرمال­سازی با تبدیل باکس کاکس
 (Box-Cox) شیوه‌ای برای تبدیل متغیرهای وابسته غیرنرمال به داده‌هایی با توزیع نرمال است. نرمال بودن چنین داده‌هایی فرض مهمی برای بسیاری از تکنیک‌های آماری از جمله رگرسیون است. اگر داده‌ها دارای توزیع نرمال نباشند، با استفاده از نرمال­سازی با تبدیل باکس­کاکس (Box-Cox) می‌توان توزیع احتمالی آن‌ها را تقریبا به توزیع نرمال نزدیک کرد.

[۱] K-S Test

[۲] One Sample K-S test

[۳] Nonparametric

[۴] Box-Cox Transformation

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.
برای ادامه، شما باید با قوانین موافقت کنید

12 + 9 =

فهرست
WeCreativez WhatsApp Support
ساعت کاری 8 صبح الی 21 شب می باشد و از طریق شماره 09108760286 می توانید با ما در ارتباط باشید.
👋 سلام، چطور میتونم به شما کمک کنم؟