آموزش spss مبحث رگرسیون 

موسسه پایا پروژه به عنوان متصدی انجام پروژه های آمار و spss  وظیفه ی خود می داند که در راستای آموزش نرم افزار spss گام های موثری را بردارد. با توجه به اینکه یک دوره آموزشی spss مستلزم تمرین و تلاش بسیار است. اما این موسسه تلاش می کند سهم کوچکی در جهت یادگیری شما داشته باشد.

۱‏-‏۴ رگرسيون خطی ساده و چندگانه[۱]

يکی از مباحث مهم پژوهش علمی، پيش­بينی و بررسی ارتباط (خطی) متغير تصادفی وابسته (نرمال) Y به عنوان تابعی از يک يا چند متغير مستقل X است که به آن مدل رگرسيون می­گويند. مثلا بهترين خط رگرسيون گذرنده از ميان نقاط  به روش کمترين مربع خطا (ضرايب لاگرانژ[۲]) بدين فرم است:

توجه شود که مقادیر  و  به عنوان پارامترهای شیب خط و عرض از مبدأ شناخته شده و توسط نرم­ افزار محاسبه می­شوند.

۱‏-‏۴‏-‏۱ مفروضات رگرسیون:

مفروضات زير را برای خط رگرسيون در نظر گرفته يا تعريف می­کنند.

  • میانگین (امید ریاضی) خطاها صفر باشد.
  • واریانس خطاها ثابت[۱] باشد.
  • خطاها دارای توزیع نرمال باشند. (با استفاده از تبدیلات نرمال ساز، و یا رگرسیون موزون)
  • بین خطاها (مانده­ها) همبستگی وجود نداشته باشد.
  • بین متغیرهای مستقل وابستگی خطی وجود نداشته باشد. (عامل تورم واریانس)

۲-مثال

میزان سدیم و کالری برای ۵۴ سوسیس هات­داگ بدست آمده است. قصد داریم به کمک رگرسیون خطی، میزان کالری را به ازای مقادیر مختلف سدیم پیش­بینی کنیم. ابتدا با توجه به بخش ۱-۲، فرض نرمالیتی متغیرها را آزمون کرده و سپس خروجی مربوطه را ذکر می­کنیم.

 

۲ آزمون فرض زیر(برا آزمون نیکویی) برقرار است:

با توجه به P-Value  و مقایسه آن با سطح معنی داری ۰٫۰۵=α فرض H0 پذیرفته می­شود. ضمناً با برازش منحنی نرمال بر روی هیستوگرام­ها نیز فرض صفر بار دیگر تأیید می­شود. (تأیید فرض نرمال بودن ۲ متغیر).

به طور مرسوم سطح معنی داری (α) را ۰٫۰۵ فرض می­کنند در این صورت با اطمینان ( )% در اینجا (۹۵%) فرض صفر را تأیید کرده و رگرسیون را تشکل می­دهیم.

 پس از تعیین متغیرهای وابسته و مستقل در برنامه، خروجی­ها نمایش داده می­شوند. اولین بخش مورد بررسی خروجی مربوط به Model summary است که مهمترین بخش آن مقادیر ضریب تعیین و ضریب تعیین تعدیل یافته است. این ضرب هرچه به ۱ نزدیک­تر باشد مدل کاراتر می­باشد. از جمله راه­های افزایش آن، افزایش تعداد متغیر و یا انتخاب سایر مدل­های رگرسیونی است. خروجی بعدی مربوط به جدول ANOVA می­باشد که خروجی­ها آن به ترتیب مجموع مربعات، درجه آزادی، میانگین مربعات، آماره F و p_value می­باشد. توجه شود که در این بخش مقدار p_value، باید کوچکتر از سطح معنی­داری(α) که در اینجا ۰٫۰۵ است، باشد. در غیر اینصورت مدل غلط بوده و از بررسی خروجی­های بعد خودداری می­شود. خروجی بعدی مربوط به جدول coefficients می­باشد که ضرایب استاندارد نشده، ضرایب استاندارد شده و p_value مهم­ترین بخش آن است. منظور از مقدار constant و sodium به ترتیب مقادیر شیب خط و عرض از مبدأ مدل می­باشند. که با توجه به کوچکتر بودن مقدار p_value از سطح معنی­داری، فرض صفر مبنی بر وجود آنها تأیید شده و مدل به صورت زیر است:

 

 

[۱] Simple and Multiple Linear Regression

[۲] Lagrange Multiplier

[۳] Stationary

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.
برای ادامه، شما باید با قوانین موافقت کنید

3 × دو =

فهرست
WeCreativez WhatsApp Support
ساعت کاری 8 صبح الی 21 شب می باشد و از طریق شماره 09108760286 می توانید با ما در ارتباط باشید.
👋 سلام، چطور میتونم به شما کمک کنم؟