آموزش آمار آموزش نرم افزار های آماری و اقتصادی آموزش نرم افزار spss شمارش پاسخ ها - خلاصه کردن مشاهدات .
.
 

اطلاعاتی که در این بخش مورد تجزیه و تحلیل قرار می گیرند از فایل contact که یک مجموعه داده ی فرضی است می باشد و در ان مسئله مورد مطالعه لیست معاملات برای یک گروه از بازاریابها است و شرکت های مورد معامله در پنج حوزه فعالیت می کنند.
در این قسمت موارد زیر مورد مطالعه قرار می گیرند.

  • جدول فراوانی چیست و چه چیزی از آن به دست می آید؟
  • چه مواقعی و برای چه داده هایی از جدول فراوانی استفاده می کنیم؟
  • آیا داده های گمشده یا داده هایی که اشتباها وارد شده وجود دارد؟
  • درصد و درصد تجمعی چیست و چه زمانی از آن استفاده می کنیم؟
از روی یک جدول فراوانی می توانیم بگوییم که هر پاسخ چند مرتبه اتفاق افتاده یا هر پاسخ را چند نفر انتخاب کرده اند.
برای به دست آوردن جدول فراوانی از منوها موارد زیر را انتخاب می کنیم.
Analyze > Descriptive statistics > Frequencies  

کادر گفتگوی Frequencies باز می شود و مانند شکل زیر متغیر Department را انتخاب می کنیم.
به دست آوردن جدول فراوانی در نرم افزار spss
در این قسمت باید گزینه Display frequency tables را انتخاب کنیم.
سپس کلید ok را انتخاب می کنیم.
جدول زیر نمایش داده می شود.
به دست آوردن جدول فراوانی در نرم افزار spss
قبل از اینکه به بررسی معانی و مفاهیم اعداد جدول بپردازیم اگر بخواهیم در جدول به جای نمایش کد متغیرها خود متغیرها یا برچسب آنها نشان داده شود جه باید بکنیم؟
در مرحله اول باید برای متغیر خود برچسب ها و معانی مناسب را تعریف کنیم برای این مورد به قسمت ارزش گذاری یا تعریف سطوح متغیرهای کیفی (value label) در نرم افزار spss مراجعه کنید.
سپس در
Edit > options > output labels  

در قسمت variable values in labels shown as گزینه labels را انتخاب می کنیم.
به دست آوردن جدول فراوانی در نرم افزار spss
پس از اجرای مجدد دستورات خروجی به صورت زیر به دست می آید.
به دست آوردن جدول فراوانی در نرم افزار spss
برای تعیین تعداد دفعاتی که با سازمان های مختلف قرارداد داشته ایم به ستونی که برچسب frequencies دارد نگاه می کنیم برای مثال 30 قرارداد با شرکت هایی که در حوزه خدمات کامپیوتری و 13 قرار داد با شرکت هایی که در حوزه مالی فعالیت می کنند، منعقد شده است.
با توجه به ردیفی که برچسب total خورده متوجه می شویم که تنها 62 قرارداد از 70 قرارداد موجود برای ما شناخته شده است.
قسمت دوم جدول نشان می دهد در 8 مورد نوع فعالیت شرکت ذکر نشده و بنابراین ناشناخته است.
هرگز نباید داده هایی که نامعلوم هستند یا به اشتباه وارد شده اند را از مجموعه داده ها حذف کنیم بلکه باید با تعیین برچسب داده های گم شده (missing values) آنها را نیز وارد کرده ( برای مطالعه بیشتر به بخش اطلاعات نامعلوم یا مقادیر گمشده مراجعه کنید) و با توجه به صورت مسئله به تجزیه و تحلیل آنها بپردازیم.
به عنوان مثال 8 داده گمشده جدول فوق حاکی از عدم تعیین نوع فعالیت شرکت مورد مطالعه از طرف بازاریاب می باشد. یا به عنوان مثالی دیگر در بسیاری از تحقیقات پرسش نامه ای بعضی از سوالات بدون جواب باقی می ماند که می تواند علت آن ترس یا مواردی از این قبیل باشد و با حذف این داده ها اطلاعات زیادی را از دست می دهیم.
در ردیف آخر متوجه می شویم که کلا 70 قرار داد مورد بررسی قرار گرفته که از این میان 62 قرارداد شناخته شده و 8 قرارداد ناشناخته است.
در ستون بعد (percent) درصد قراردادهای منعقد شده با هر نوع سازمان مشخص شده است. برای مثال 42.9 درصد قرار دادها با شرکت هایی که در حوزه خدمات کامپیوتری فعالیت می کنند منعقد شده است.
چه زمانی از درصد برای توصیف متغیرها استفاده می کنیم؟ چه تفاوتی میان درصد و فراوانی وجود دارد؟
اگر 12 نفر از دانش آموزان کلاس الف و 14 نفر از دانش آموزان کلاس ب در امتحان ریاضی قبول شوند آیا می توان گفت که عملکرد کلاس ب بهتر بوده است؟
برای اظهار نظر در این زمینه باید تعداد دانش آموزان هر دو کلاس را در نظر بگیریم و نسبت قبول شدگان دو کلاس را مقایسه کنیم. اگر کلاس الف 16 دانش آموز و کلاس ب 22 دانش آموز داشته باشد نسبت قبول شدگان کلاس الف 75 درصد و نسبت قبول شدگان کلاس ب 64 درصد است. بنابراین کلاس الف عملکرد بهتری داشته است.
برای مقایسه چند جامعه با حجم های مختلف درصد ها را با هم مقایسه می کنیم.
برای محاسبه درصد تعداد نمونه هایی که یک پاسخ را انتخاب کرده اند بر تعداد کل نمونه ها تقسیم کرده و نتیجه را در عدد 100 ضرب می کنیم.
درصد پاسخ های صحیح valid percent
برای مجاسبه درصد، فراوانی مشاهده شده بر تعداد کل مشاهدات تقسیم می شود ولی در حالتهایی که داده گم شده وجود دارد یا تنها قسمت خاصی از نتایج مورد ارزیابی قرار می گیرد؛ درصد ارایه شده دارای اعتبار نیست و برای تحلیل باید فراوانی مشاهده شده را بر تعداد مشاهدات قابل قبول تقسیم کنیم که این امر در قسمت valid percent انجام می شود.
هنگامی که از ستون valid percent استفاده می کنیم باید به تعداد داده های گم شده و علل رخ داد آن توجه کرده و اگر تعداد این موارد از حد مطلوب تجاوز نمود حتما بررسی و گزارش گردد.
درصد تجمعی
یکی دیگر از مواردی که در جدول توزیع فراوانی گزارش می شود درصد تجمعی cumulative percent است.در هر ردیف جدول فراوانی؛ درصد تجمعی برابر با مجموع فراوانی آن ردیف و ردیف های قبل می باشد.
البته همواره نباید درصد تجمعی را گزارش نمود و تنها در مواردی که متغیر مورد بررسی دارای ترتیب است فراوانی تجمعی معنی دار بوده و می توان آنرا گزارش نمود.
به عنوان مثال اگر درامد خانوار را به صورت صعودی مرتب کرده باشیم آن گاه درصد تجمعی دارای تفسیر بوده و می توان از آن استفاده نمود.
به عنوان مثالی دیگر داده های جدول فوق دارای ترتیب منطقی نمی باشند و بنابراین ستون فراوانی تجمعی غیر قابل تفسیر بوده و باید حذف شود.
برای مطالعه بیشتر به درصد تجمعی چیست و چه زمانی می توان از آن استفاده کرد؟ مراجعه کنید.
نکته:
اگر هنگام ورود داده ها عدد نادرستی وارد کرده باشیم به صورت یک ردیف در جدول فراوانی ظاهر خواهد شد . بنابراین می توان از جدول فراوانی برای یافتن اشتباهات در فایل اطلاعاتی استفاده نموده و ان را اصلاح کرد.

مجله اینترنتی آموزش آمار و احتمال
http://amar.ibep.ir