آموزش spss

شما اینجا هستید

صفحه اصلی

آماده سازی داده ها 4- تعیین مقادیر گمشده

- مقادیر گمشده ای که کاربر مشخص می کند.

مقادیر گمشده کاربر مقادیری است که می بایست از تحلیل حذف شوند. ما این کار را بوسیله مشخص کردن مقادیری بعنوان مقادیر از دست رفته در SPSS انجام می دهیم. برای متغیر های ترتیبی ما معمولاً پاسخ هایی نظیر "نمی دانم" یا "غیر عملی" است را به عنوان مقادیر گمشده محسوب می کنیم. برای متغیر های متریک معمولاً مقادیر پرت که بسیار بالا و یا بسیار پایین هستند را بعنوان متغیر گمشده در نظر می گیریم. حال این سوال مطرح است که چگونه بدانیم که آیا یک متغیر شامل مقادیر گمشده هست یا نه؟ جهت انجام این کار، برای متغیر های ترتیبی از جداول فراوانی و نمودار میله ای استفاده می کنیم و برای متغیر های متریک از نمودار هیستوگرام می توان استفاده کرد. به چند مثال توجه کنید.

- اجرای جداول فراوانی و نمودار میله ای با استفاده از دستورات پنجره Syntax

ابتدا نگاهی به متغیر q2 می اندازیم. این یک متغیر ترتیبی است. ما جدول فراوانی و نمودار میله ای این متغیر را رسم می کنیم. دستورات مربوطه در پنجره Syntax  نشان داده شده است.

نتیجه اجرای این دستور در شکل زیر نشان داده شده است.

ابتدا توجه کنید که در خصوص امکانات هتل مقادیر بالاتر به نظر مثبت تر  اشاره دارد. اما گزینه 6 (بدون جواب) به معنای نظر مثبت تر نسبت به گزینه 5 نیست. پس ما آنرا به عنوان یک مقدار گمشده در نظر می گیریم.

.missing values q2 (6)

حال اگر مجدداً نمودار میله ای را اجرا کنیم می بینیم که گزینه "بدون جواب" از گزینه های معتبر حذف گردیده است.

- نمودار هیستو گرام

حال قصد داریم متغیر rprice که یک متغیر متریک است را از نظر مقادیر پرت بررسی کنیم. پس دستور زیر را برای رسم نمودار هیستوگرام اجرا می کنیم.

.frequencies rprice/histogram

نتیجه در شکل زیر نشان داده شده است. این نتیجه تا حدی عجیب است زیرا نشان می دهد که برخی از مردم برای اتاقهای هتل مبلغ 999,999 یورو پرداخت می کنند. همچنین توجه داشته باشید که قیمت متوسط پرداختی برای اتاقهای هتل 3400 یورو است.

مشکلی که وجود دارد ان است که احتمالاً عدد 999999 یک کد است که نشان می دهد 999999 پوند یک داده پرت است. پس ما آن را بوسیله دستور زیر به عنوان یک داده گمشده در نظر می گیریم.

.missing values rprice (999999)

حال اگر نمودار هیستوگرام را دوباره اجرا کنیم نتایج منطقی تری را خواهیم داشت و می بینیم که متوسط قیمت یک اتاق هتل در حدود 80 پوند است.

- مقادیر گمشده در متغیر ها

من در این آموزش از جداول فراوانی و نمودار میله ای برای همه متغیر های دسته بندی شده و از نمودار هیستوگرام  برای متغیر های متریک استفاده کردم تا ببینم که آیا نیازی هست که برخی از مقادیر را به عنوان مقادیر گمشده در نظر بگیرم یا نه. بعد از انجام این کار تعدادی از مقادیر گمشده را بررسی کردیم (مقادیر گمشده سیستمی و مقادیر گمشده کاربر) . نکته مهم این است که متغیر هایی که شامل تعداد زیادی از مقادیر گمشده باشد یک متغیر نامطلوب است و می بایست از تحلیل حذف گردد.

برای مثال بیایید متغیر q3 را بررسی کنیم. این یک متغیر ترتیبی است بنابراین ما جدول فراوانی و نمودار میله آنرا رسم می کنیم.

.frequencies q3/barchart

نتیجه در جدول زیر نشان داده شده است.

دقت کنید که 96.5% از مقادیر، مقادیر گمشده سیستمی هستند و ما تعداد کمی جواب های واقعی داریم که می توانیم در مجموع این متغیر را حذف نماییم.

از توجه شما سپاسگزارم.

مهندس مجتبی فیاض:مدرس دوره های آموزشی spss

(مبتدی،متوسط،پیشرفته،تخصصی)

آدرس ایمیل من: mojtaba_fayaz@yahoo.com

شماره همراه: 09131171497

ارتباط با ما

مهندس مجتبی فیاض

همراه : ۰۹۱۳۱۱۷۱۴۹۷

ایمیل:mojtaba_fayaz@yahoo.com

سامانه پیام کوتاه:

۳۰۰۰۶۱۳۲۰۰۸۰۰۰

کانال تلگرام:

spss19withfayaz@

 

دعوت به همکاری

راههای ارتباطی جهت اعلام تمایل به همکاری با تیم تحقیق، پژوهش و تحلیل آماری

در تلگرام

09131171497

 یا learnwithfayaz@