تجزیه و تحلیل آماری
نوشتن پایان نامه و انجام تحلیل آماری برای کلیه مقاطع تحصیلی
 
 
یک شنبه 4 مرداد 1394برچسب:, :: 9:7 ::  نويسنده : هادی واحد پور

آزمون مک نمار

این آزمون از آزمونهای ناپارامتری است که برای ارزیابی همانندی دو نمونه وابسته بر حسب  متغیر دو جوابی استفاده می‌شود. متغیرها می‌توانند دارای مقیاسهای اسمی و یا رتبه ای باشند.

این آزمون در طرحهای ماقبل و مابعد می‌تواند مورد استفاده قرار گیرد (یک نمونه در دو موقعیت مختلف). این آزمون مخصوصا برای سنجش میزان تاثیر عملکرد تدابیر به کار می‌رود.



یک شنبه 4 مرداد 1394برچسب:, :: 9:6 ::  نويسنده : هادی واحد پور

آزمون تک نمونه ای دورها

این آزمون مواقعی به کار می‌رود که توالی مقادیر متغیرها را بخواهیم آزمون نماییم که آیا تصادفی بوده و یا نه. در واقع آزمون کی دو و یا آزمونهای دیگر که در آنها توالی متغیرها بی اهمیت است، در این آزمون مهم و اصل انگاشته می‌شود.

به عبارت دیگر، برای اینکه بتوانیم در یک نمونه که در آن رویدادهای مختلف از طرف فرد و یا واحد آماری رخ داده است، آزمون نماییم که آیا این رویدادها تصادفی است یا نه، به کار برده می‌شود.

هیچ آزمون دیگری همچون این آزمون نمی تواند توالی را مورد نظر قرار دهد. بنابراین برای این منظور منحصر به فرد می‌باشد.



چهار شنبه 24 تير 1394برچسب:تحلیل عاملی تاییدی CFA, :: 10:31 ::  نويسنده : هادی واحد پور

تحلیل عاملی تاییدی CFA

 

تحلیل عاملی می‌تواند دو صورت اکتشافی و تاییدی داشته باشد. اینکه کدام یک از این دو روش باید در تحلیل عاملی به کار رود مبتنی بر هدف تحلیل داده هاست. تمایز مهم روش‌های تحلیل اکتشافی و تاییدی در این است که روش اکتشافی با صرفه‌ترین روش تبیین واریانس مشترک زیربنایی یک ماتریس همبستگی را مشخص می‌کند. در حالی که روش‌های تاییدی (آزمون فرضیه) تعیین می‌کنند که داده‌ها با یک ساختار عاملی معین (که در فرضیه آمده) هماهنگ اند یا نه.

از سوی دیگر بیشتر مطالعات ممکن است تا حدی هم اکتشافی و هم تاییدی باشند زیرا شامل متغیر معلوم و تعدادی متغیر مجهول‌اند. متغیرهای معلوم را باید با دقت زیادی انتخاب کرد تا حتی الامکان درباره متغیرهای نامعلومی که استخراج می‌شود اطلاعات بیشتری فراهم‌اید. مطلوب آن است که فرضیه ای که از طریق روش‌های تحلیل اکتشافی تدوین می‌شود از طریق قرار گرفتن در معرض روش‌های آماری دقیق‌تر تایید یا رد شود. تحلیل اکتشافی نیازمند نمونه‌هایی با حجم بسیار زیاد می‌باشد.

تمایز مهم روش‌های تحلیل اکتشافی و تاییدی در این است که روش اکتشافی با صرفه‌ترین روش تبیین واریانس مشترک زیربنایی یک ماتریس همبستگی را مشخص می‌کند. در حالی که روش‌های تاییدی (آزمون فرضیه) تعیین می‌کنند که داده‌ها با یک ساختار عاملی معین (که در فرضیه آمده) هماهنگ اند یا نه.

تحلیل عاملی تاییدی(Confirmatory factor analysis (CFA) ): طی آن محقق انتظار دارد طرح و نقشه خاصی از عوامل پنهان در ماورای متغیرها را بیازماید. در این نوع، انتظار می رود متغیرها چیدمان خاصی داشته باشند. در این روش محقق به آزمون فرضیاتی مربوط به یک ساختار عاملی خاص اقدام می کند. در این تحلیل پژوهشگر به دنبال تهیه مدلی است که فرض می‌شود داده‌های تجربی را بر پایه چند پارامتر نسبتا اندک، توصیف تبیین یا توجیه می‌کند. این مدل مبتنی بر اطلاعات پیش تجربی درباره ساختار داده هاست که می‌تواند به یکی از اشکال زیر باشد:

  1. یک تئوری یا فرضیه
  2. یک طرح طبقه بندی کننده معین برای گویه‌ها یا پاره تستها در انطباق با ویژگی‌های عینی شکل و محتوا
  3. شرایط معلوم تجربی
  4. دانش حاصل از مطالعات قبلی درباره داده‌های وسیع.

این شکل از تحلیل عاملی از طریق نرم افزارهای Lisrel و Amos و … محاسبه می شود.



چهار شنبه 24 تير 1394برچسب:, :: 10:27 ::  نويسنده : هادی واحد پور

آزمون استقلال خی-دو

و نهایتا جعبه گفتگوای باز می گردد که می بایست متغیرهای کیفی مورد نیاز را به قسمت های Row و Column فراخوانی نماییم. به طور معمول و رویه ای استاندارد در تحلیل داده ها، با انتخاب گزینه Cells حداقل یکی از گزینه های بخش Percentages برای محاسبه درصد سطی، ستونی یا درصد از کل فراوانی مربوط به خانه های جداول توافقی مورد توجه قرار می گیرد. حال پاسخ سوال اصلی: برای انجام آزمون استقلال لازم است که گزینه Statistics و سپس گزینه Chi-Square را انتخاب نمود.

حال در خروجی جدول آزمون کای دو، ردیف اول آماره کای دو را به عنوان کای دو پیرسون خواهیم داشت و فرض استقلال را با مشاهده مقدار احتمال (p-value) می توان بررسی نمود. چنانچه سطح معنی داری در طبیعت مساله مورد تحقیق 5 درصد باشد و مقدار احتمال کمتر از 5 درصد باشد فرض صفر را رد می کنیم. رد فرض صفر در آزمون استقلال به معنی اینست که دو متغیر کیفی با یکدیگر در ارتباط هستند.
در انتها ذکر می نماییم که 1-تنها برای جداول 2 در 2 آماره دقیق فیشر محاسبه نمی شود بلکه در تمامی جداول توافقی با متغیرهای کیفی بیش از 2 سطح نیز این آزمون قابل محاسبه است و SPSS آن را در خروجی به محققین ارائه می دهد. در زمان گذشته به دلیل محاسبات سنگین تنها در همان جداول 2 در 2 آزمون دقیق مورد بحث قرار می گرفت. 2- می توان جداول توافقی را در چند لایه، یعنی بیش از دو متغیر کیفی بررسی نمود.
3- می توان به گسسته سازی متغیرهای کمی، آزمون استقلال را برای آن ها مورد توجه قرار داد. مثلا نمره کلاسی را به ترتیب از بیشترین نمره به کمترین به گروه های A ، B ، C و D تقسیم نمود.



آموزش نحوه محاسبه مدل رگرسیون لجستیک Binomial logistic regression در نرم‌افزار SPSS

 

 

در بسیاری از پژوهش ها متغیر وابسته مورد مطالعه ماهیتا یک متغیر گسسته است که برای برآورد رخداد هر یک از سطوح نیازمند استفاده از رگرسیون های کیفی هستیم. رگرسیون های با متغیر وابسته گسسته دارای انواع مختلفی هستند که با توجه به ماهیت متغیر وابسته تعیین می شوند. اگر متغیر وابسته دو بعدی(dichotomous) باشد رگرسیون لجستیک Binomial (or binary) logistic regression برای بیان پیش بینی استفاده می شود.منظور از دو وجهی بودن، رخ داد یک واقعه تصادفی در دو موقعیت ممکنه است. به عنوان مثال خرید یا عدم خرید، ثبت نام یا عدم ثبت نام، ورشکسته شدن یا ورشکسته نشدن و ... متغیر هایی هستند که فقط دارای دو موقعیت هستند و مجموع احتمال هر یک آنها در نهایت یک خواهد شد. کاربرد این روش عمدتا در ابتدای ظهور در مورد کاربرد های پزشکی برای احتمال وقوع یک بیماری مورد استفاده قرار می گرفت. لیکن امروزه در تمام زمینه های علمی کاربرد وسیعی یافته است. به عنوان مثال

مدیر سازمانی می خواهد بداند در مشارکت یا عدم مشارکت کارمندان کدام متغیر ها نقش پیش بینی دارند؟ مدیر تبلیغاتی می خواهد بداند در خرید یا عدم خرید یک محصول یا برند چه متغیر هایی مهم هستند؟ یک مرکز تحقیقات پزشکی می خواهد بداند در مبتلا شدن به بیماری عروق کرنری قلب چه متغیر هایی نقش پیش بینی کننده دارند؟ تا با اطلاع رسانی از احتمال وقوع کاسته شود.

مشخصا در این موقعیت پژوهشی نمی توان از رگرسیون های معمولی برای پیش بینی رخداد این متغیر های وابسته استفاده نمود. در این نوع از رگرسیون از نسبت برتری odds که نسبت (p/(1-p) می باشد استفاده می شود و برای به دست آوردن مدل لوجیت از این رابطه باید از آن لگاریتم گرفت. لذا مدل عمومی رگرسیون لجستیک به شکل زیر خواهد بود.

Ln (p/ (1-p) = intercept + b1*X1 + b2*X2 + ... + bk*Xk.

از آنجائیکه رگرسیون لوجستیک از خاصیت حداکثر درستنمایی به جای حداقل مربعات مرسوم در رگرسیون خطی استفاده می کند، از روی این فرمول در نهایت می توان احتمالات پیش بینی شده را بر اساس قاعده زیر بیان نمود:

p = e intercept + b1*X1 + b2*X2 + ... + Bk*Xk / (1+ e intercept + b1*X1 + b2*X2 + ... + Bk*Xk)

معادله رگرسیون لجستیک در نرم افزار SPSS به شکل زیر برآورد می شود:

z = ln(odds(event)) = ln(prob(event)/prob(nonevent)) = ln(prob(event)/[1 - prob(event)]) = b0 + b1X1 + b2X2 + ..... + bkX

پیش شرط های انجام رگرسیون خطی مانند وجود رابطه خطی بین متغیر های مستقل و وابسته، همسانی واریانس متغیر وابسته و متغیر های مستقل(Homoscedastic)، توزیع نرمال متغیر وابسته و باقیمانده ها یا خطای اندازه گیری مدل را نیاز ندارد. لیکن موضوع همراستایی چند گانه در رگرسیون لجستیک نیز وجود دارد که به معنای عملکرد خطی هر یک از متغیر های مستقل نسبت به یکدیگر است. برای این منظور برای هر ضریب بتا باید مقدار standard errors جزیی باشد. اگر هر متغیر مستقلی دارای خطای استاندارد بالایی باشد نشان از وجود همراستایی چند گانه روی آن متغیر دارد. در این جا سعی می شود تا با حل یک مساله نمونه در SPSS این موضوعات بررسی شود و نحوه محاسبات مربوط به رگرسیون دو دویی لجستیک بررسی شود. به عنوان مثال در نظر بگیرید یک موسسه مالی اعتباری می خواهد بداند در باز پرداخت به موقع چه متغیر هایی در جامعه مورد نظر دارای اثر پیش بینی کننده هستند؟ به این منظور با توجه به دو وجهی بودن متغیر وابسته (یعنی پرداخت یا عدم پرداخت)استفاده از مدل های لوجیت معنی پیدا می کند. داده های موجود از 850 نفر از کسانی که در این موسسه حساب دارند، در دسترس است که 700 نفر از آنها به موسسه بدهکار هستند و 150 نفر از آنها بدهی ندارند و فقط جهت اعتبار سنجی مدل داده های آنها را فعلا نگه می داریم. با توجه به اینکه 700 نفر از این مشتریان بدهکار هستند ابتدا برای تفکیک آنها به کسانی که وام خود را به موقع خواهند پرداخت یا اینکه پرداخت منظمی نخواهد داشت؛ به مسیر زیر رفته تا پنجره اعداد رندوم باز شود.

آموزش SPSS آموزش تکنیکهای SPSS

در این پنجره Set Starting Point. را انتخاب و سپس Fixed Value را علامت زده و مقداری تصادفی مانند 9191972 را وارد می کنیم. حال از منوی Transform گزینه Compute Variable... را انتخاب می کنیم. و نام متغیر جدید را Validate و Expression را روی rv.bernoulli(0.7) تنظیم می کنیم.

Compute Variable - SPSS

این دستور با پارامتر احتمالی 0.7 به دنبال ایجاد تصادفی دادهای تحت عنوان Validate است. از آنجائیکه در داده های موجود افرادی هستند که مشتریان قبلی موسسه نبوده اند یعنی وامی دریافت نداشته اند، لذا لازم است تا ابتدا فقط مشتریان بالفعل مورد ارزیابی قرار گیرند. لذا در این پنجره گزینه If را زده و مقدار MISSING(default) = 0 را در زیر گزینه Include if case satisfies condition فعال شده وارد می کنیم. با این کار این اطمینان حاصل می شود که داده ها بدون مقدار گم شده وارد مدل می شوند و نشان می دهد که این افراد جزء مشتریان قبلی موسسه بوده اند و وامی دریافت کرده اند. حال کلید Continue و سپس کلید Ok را انتخاب می کنیم. اگر از این متغیر درصد بگیریم مشخص می شود که 70 درصد از مشتریان را کسانی تشکیل داده اند که در باز پرداخت وام خود درست عمل کرده اند و 30 درصد این کار را به موقع انجام نداده اند و 150 نفر نیز به عنوان مقدار گم شده معرفی شده اند زیرا اینان مشتریان بالقوه هستند و هنوز وامی را دریافت نداشته اند.

Validate Table - SPSS

برای شروع آنالیز مسیر Analyze - Regression - Binary Logistic را انتخاب می کنیم.

آموزش تکنیکهای پیشرفته SPSS

ابتدا متغیر Previously defaulted را در قسمت dependent variable و متغیر های Select Age in years تا Other debt in thousands را به عنوان covariates انتخاب می کنیم. روش Forward: LR را از بین روش های ورود متغیر استفاده می کنیم. متغیر validate را در قسمت selection variable وارد می کنیم.

حال گزینه Rule را انتخاب و مقدار یک را وارد می کنیم و سپس کلید Continue را انتخاب می کنیم.

آموزش SPSS

حال کلید Categorical را انتخاب و متغیر Select Level of education را به عنوان categorical covariate و سپس کلید Continue را انتخاب می کنیم.

Logistic Regression - SPSS

آموزش SPSS

در این فاز کلید Save را انتخاب و موارد زیر را علامت گذاری می کنیم و سپس کلید Continue را انتخاب می کنیم.

Logistic Regression Save - SPSS

در این مرحله برای دیدن آزمون برازش کلی مدل و همچنین پلات توزیع و تفکیک، از منوی Option گزینه های Classification plots و Hosmer-Lemeshow goodness-of-fit.را انتخاب می کنیم. در نهایت کلید Continue و سپس Ok را انتخاب می کنیم.

Logistic Regression: Options - SPSS

تمام مراحل فوق از طریق کد نویسی زیر قابل دسترسی خواهد بود:

LOGISTIC REGRESSION VAR=default /SELECT validate EQ 1 /METHOD=FSTEP(LR) age ed employ address income debtinc creddebt othdebt /CONTRAST (ed)=Indicator /SAVE PRED COOK SRESID /CLASSPLOT /PRINT=GOODFIT /CRITERIA PIN(.05) POUT(.10) ITERATE(20) CUT(.5)

اولین خروجی مدل بیانگر برازش کلی مدل است که آزمون Hosmer and Lemeshow می باشد. از انجا که مقدار سطح معنی داری بالای 05/0 است، لذا فرض صفر مبنی بر توضیح قابل قبول داده ها توسط مدل تائید می شود. لذا در آخرین سطح که مقدار سطح معنی داری 0.565 محاسبه شده است نشان می دهد در پایان گام چهارم مدل برازش یافته ای وجود دارد و نتایج حاصله از آن معتبر و قابل استناد است. بر خلاف نسخه های قبلی SPSS، نسخه 18آن برای محاسبه ابتدا با تجمع گروه ها در طبقات مشابه اقدام به محاسبه تست برازش می کند که این امر سبب افزایش اعتبار آن شده است.

Hosmer and Lemeshow Test - SPSS

از آنجا که تغییرات واریانس در مدل ثبت نمی شود برای بررسی وضعیت باقیمانده ها لازم است در این مرحله به مسیر Transform> Compute Variable... رفته و مقدار متغیری به نام chgdev ایجاد و سپس sre_1**2 را در بخش فرمول وارد می کنیم. با این دستور مربع استاندارد شده باقیمانده ها در متغیر chgdev ذخیره می شود. برای دیدن این نتیجه به منوی Graph و سپس گزینه Chart builder رفته و در محور y متغیر chgdev و در محور X متغیر Predicted probability را وارد می کنیم. و مدل Scatter/Dot را از gallery انتخاب می کنیم.

Chart Builder - SPSS آموزش

سپس کلید Ok را انتخاب می کنیم تا چارت مورد نظر ایجاد شود. تغییرات زیاد انحراف به معنای برازش ضعیف مدل به واسطه آن موارد یا پاسخگویان است.

Predicted Probablity - SPSS

منحنی که از سمت چپ به سمت بالا می آید بیانگر مواردی است که متغیر وابسته مقدار صفر را دارد. لذا در مورد کسانی که احتمال پیش بینی برای آنها در مورد عدم پرداخت بالا بوده است، انحراف زیادی را شاهد هستیم و این نشان از برازش ضعیف اطلاعات این افراد برای پیش بینی درست است. بر اساس این چارت مشخص است که بعد از احتمال 0.8 موارد کم و انحراف زیاد است. منحنی که از سمت بالا به پائین حرکت می کند به معنای افرادی است که متغیر وابسته در مورد انها مقدار یک را دارد. لذا کسانی که پرداخت کننده وام هستنند دارای بخش کوچکتری هستند که شناسایی نشده است. به عبارت دیگر غالب پرداخت کنندگان وام دارای مقادیری هستند که توسط متغیر های پیش بین موجود تبیین می شوند. نتایج نشان می دهد احتمال زیر 0.2 تعداد موراد کمی را به خود اختصاص داده است. با شناسایی این موارد در هر دو چارت می توان به شناسایی سایر متغیر های مستقل پیش بین پرداخت که در مدل جاری مورد توجه نبوده اند. برای بهتر دیده شده این موضوع بهتر است مجددا به منوی Graph و سپس گزینه Chart builder رفته و در محور y متغیر Analog of Cook's و در محور X متغیر Predicted probability را وارد می کنیم. و مدل Scatter/Dot را از gallery انتخاب می کنیم. سپس کلید Ok را انتخاب می کنیم تا چارت مورد نظر ایجاد شود.. مواردی که از سطح افقی دور شده اند نماینده افرادی هستند که اطلاعات آنها با نمونه موجود دارای اختلاف است که با افزایش فاصله این شکاف بیشتر می شود.

آموزش spss

مدل Forward stepwise با مدلی شروع می شود که هیچ متغیر پیش بینی کننده ای وجود ندارد. در اولین مرحله هر متغیری که دارای سطح معنی داری زیر 05/0 برای مقدار Score باشد وارد مدل می شود.

Variables not in the Equation

لذا در آخرین گام انتظار داریم که متغیر یا متغیر هایی که بیشتر از 05/0 دارای سطح معنی داری هستند حذف شوند. به طور کلی بهتر است برای نشان دادن معنی داری متغیر های باقیمانده در هر مدل از Change in -2 Log Likelihood به جای آماره هایی چون والد استفاده شود.

Model if Term Removed - SPSS

در مدل های پیش بینی مقدار R2 بیانگر مقدار واریانسی است که توسط متغیر های مستقل وارد شده به مدل تفسیر می شوند و بین صفر تا یک قرار دارد و هر چه به یک نزدیک تر باشد بیانگر قدرت بیشتر مدل است. لیکن در مورد مدل هایی که متغیر وابسته کیفی است، این مقدار محاسبه نمی شود زیرا سطح به صورت گسسته است. Cox and Snell's R2 و Nagelkerke's R2 و McFadden's R2 از الترناتیو هایی هستند که برای این موضوع معرفی شده اند. تفسیر این مقادیر به راحتی R2 نیست و عمدتا برای مقایسه بین مدل ها به کارگرفته می شوند تا بهترین تخمین زننده مشخص شود. به کمک classification table مشخص می شود که تا چه حد جدا سازی افراد طبق تابع پیشنهادی امکان پذیر است که برای این تمرین 82 درصد بیان شده است.

آموزش نرم افزار SPSS

در نهایت اصلی ترین جدول نشان داده می شود که بیانگر ضرایب متغیر های وارد شده به مدل است.

Variables in the Equation - آموزش SPSS

ضرایب نشان داده شده در آخرین مرحله که در اینجا Step4 است بیانگر معنی داری 5 متغیر وارد شده به مدل است. به دلیل دشوار بودن گزارش B بهتر است مقدار Exp(B) به عنوان ضرایب رگرسیونی هر یک از متغیر های وارد شده به مدل استفاده شود. در واقع اگر عدد eرا به توان B ببریم مقدار Exp(B) به دست می اید. در نهایت به کمک این راهنمای گرافیکی می توانیم نحوه تفکیک افراد نمونه را بر اساس این معادله ببینیم.

آموزش SPSS

 

 



این روش تصمیمات را بر اساس اهمیت درجه بندی می کند و به تصمیم گیران امکان می دهد تا داده های ملموس عددی و غیر ملموس را از منابع مختلف در کنار هم به منظور تصمیم گیری تحلیل کند.

نرم افزار Super Decisions، فرآیند تحلیل شبکه ای (ANP) را انجام می دهد.

برای دریافت برنامه به سایت  http://www.superdecisions.com  مراجعه کنید.



نرم افزار اکسپرت چویس Expert Choice  ویژه محاسبات فازی و تکنیک‌های تصمیم گیری چندمعیاره MCDM و شاخه‌های آن MADM و MODM است. اکسپرت چویس Expert Choice برای فرایند تحلیل سلسله مراتبی AHP و فرایند تحلیل شبکه ANP طراحی شده است. لینک دانلود نسخه کامل این برنامه ارائه شده است. لینک دانلود نرم افزار Expert Choice از سایت مدیافایر و فورشیرد قرار داده شده است.



نمونه سوالات رایگان استخدامی آموزش و پرورش

سلام دوستای خوبم

لینک زیر رو کپی و تو یه مرور گر بازنشانی کنید. 

http://uplod.ir/s7qiw4o1l3rf/amoozesh-parvaresh.rar.htm

موفق باشید.



یک شنبه 12 بهمن 1393برچسب:, :: 8:5 ::  نويسنده : هادی واحد پور

برخی از فنون رایج بکار گرفته شده تحت عنوان داده‌کاوی عبارتند اند از:

  • ابزارهای پرس و جو
  • فنون آماری
  • مصورسازی
  • پردازش تحلیلی پیوسته  
  • یادگیری مبتنی بر مورد
  • درختان تصمیم‌گیری
  • قوانین وابستگی
  • شبکه‌های عصبی
  • الگوریتم ژنتیکی


لبخندیکی از مفروضاتی که در رگرسیون مد نظر قرار می گیرد، استقلال خطاها (تفاوت بین مقادیر واقعی و مقادیر پیش بینی شده توسط معادله رگرسیون) از یکدیگر است. در صورتی که فرضیه استقلال خطاها رد شود و خطاها با یکدیگر همبستگی داشته باشند امکان استفاده از رگرسیون وجود ندارد. به منظور بررسی استقلال خطاها از یکدیگر از آزمون دوربین-واتسون استفاده می شود.

 

 



درباره وبلاگ


به وبلاگ من خوش آمدید. نگران تحلیل پایان نامه ها و مقالات و پروژه ها تون نباشید. اعتماد کنید. بابت هزینه هم با هم کنار میایم.
آخرین مطالب
پيوندها

تجزیه و تحلیل آماری ، نوشتن پایان نامه، نوشتن مقاله





نويسندگان


خبرنامه وب سایت:





آمار وب سایت:  

بازدید امروز : 2
بازدید دیروز : 14
بازدید هفته : 25
بازدید ماه : 30
بازدید کل : 262431
تعداد مطالب : 44
تعداد نظرات : 0
تعداد آنلاین : 1

Alternative content