תורת המבחן הקלאסית
מבחן הוא המכשיר המדעי במידה שהיא מודדת מה היא מתכוונת, כלומר, היא תקפה, והיא נעה היטב, כלומר היא מדויקת או אמינה. אם נמצא מכשיר שאיננו יכולים לבטוח בו, הם נשתנים מעת לעת כאשר אנו מודדים את אותו האובייקט, אז נגיד שהוא אינו מהימן. מכשיר, כדי למדוד כראוי משהו, זה חייב להיות מדויק, כי אחרת, למדוד את מה שאתה למדוד, למדוד את זה לא נכון. לכן, להיות מדויק הוא תנאי הכרחי אך לא מספיק. בנוסף, עליו להיות תקף, כלומר, מה שהוא מודד במדויק יהיה מה הוא נועד למדוד, ולא שום דבר אחר.
אתה עשוי להתעניין גם ב: תגובת תגובה פריט - יישומים ובדיקותאמינות:
אמינות מוחלטת יחסית: ניתן לטפל בבעיית המהימנות של בדיקה בשתי דרכים שונות, אם כי ברקע הם עולים בקנה אחד.
מהימנותו של אי-דייקת המדידות שלו: כאשר נושא מגיב למבחן, הוא מקבל ציון אמפירי, המושפע מטעות. אם לא היתה טעות, הנושא היה מקבל את הציון האמיתי שלו. המבחן אינו מדויק, משום שהציון האמפירי אינו תואם את הציון האמיתי האמיתי. הבדל זה בין שני הציונים הוא טעות הדגימה, שגיאת המדידה. ה שגיאת מדידה טיפוסית יהיה סטיית התקן של טעויות המדידה. ה שגיאת מדידה טיפוסית מציין את הדיוק המוחלט של המבחן, שכן הוא מאפשר להעריך את ההפרש בין המדידה המתקבלת לבין זו שתתקבל אם לא הייתה שגיאה.
האמינות כמו יציבות של המדידות: בדיקה תהיה אמינה יותר יציב או יציב את התוצאות שהוא מספק כאשר הוא חזר על עצמו. ככל שהתוצאות יציבות יותר בשני מקרים, כך המתאם ביניהם גדול יותר. מתאם זה נקרא מקדם מהימנות. זה מבטא אותנו, לא את כמות השגיאה, אלא את הקוהרנטיות של המבחן עם עצמו ואת הקביעות של המידע שהוא מציע. ה מקדם מהימנות מבטא את האמינות היחסית של הבדיקה.
מקדם האמינות ומדד האמינות: - מקדם האמינות של מבחן הוא המתאם של המבחן עם עצמו, המתקבל למשל, בשתי צורות מקבילות: rxx. - מדד הדיוק הוא המתאם בין הציונים האמפיריים של המבחן לבין ציוניו האמיתיים: rxv מדד הדיוק תמיד יהיה גדול ממקדם המהימנות כדי לגלות את מקדם המהימנות של שלוש השיטות הקלאסיות:
- מצא את המתאם בין המבחן לבין החזרה שלו: שיטת החזרה או שיטת הבדיקה החוזרת: היא מורכבת מיישום אותו מבחן לאותה קבוצה בשני מקרים ומתואמת המתאם בין שתי סדרות הציונים. קורלציה זו היא מקדם האמינות. שיטה זו בדרך כלל נותן מקדם אמינות גבוהה יותר מאשר אלה שהושגו על ידי נהלים אחרים, ועלולים להיות מזוהמים על ידי גורמים מטרידים.
- מצא את המתאם בין שתי צורות מקבילות של המבחן: השיטה של צורות מקבילות: הכינו שתי צורות מקבילות של אותו מבחן, כלומר שתי צורות מקבילות שנותנות את אותו מידע, והן חלות על אותה קבוצה של נושאים. המתאם בין שתי הצורות הוא מקדם המהימנות. בשיטה זו, על ידי לא לחזור על אותו מבחן, מקורות מטרידים של אמינות הבדיקה מחדש נמנעים.
- מצא את המתאם בין שני חצאי מקבילים של הבדיקה: שיטת שני החצאים: המבחן מחולק לשני חצאים שווים ומתאם ביניהם. זוהי השיטה המועדפת, שכן היא פשוטה ומתעלמת ממגבלות ההליכים הקודמים. אתה יכול לבחור את האלמנטים המוזרים של הבדיקה, כדי להוות חצי, ואת האלמנטים אפילו להוות את השני.
מקדם האמינות וקורלציה בין בדיקות מקבילות
ה מקדם מהימנות של מבחן מציין את היחס שהשונות האמיתית היא השונות השונה: 10 תוכל מקדם המהימנות של הבדיקה משתנה בין 0 ל 1. לדוגמה: אם המתאם בין שני מבחנים מקבילים הוא rxx´ = 0.80, כלומר, 80% מהשונות של הבדיקה נובעת מהמדד הריאלי, והשאר, כלומר, 20% מהשונות של המבחן נובע מהשגיאה. ה - מדד אמינות של המבחן הוא המתאם בין הציונים האמפיריים לבין מדד הציונים האמיתי שלו = מדד האמינות שווה לשורש הריבועי של מקדם המהימנות
לאחר שתי צורות מקבילות של מבחן פותחו, נוהל ניתוח השונות מוחל על מנת לבדוק את ההומוגניות של השונות ואת ההבדל בין האמצעים. אם השונות היא הומוגנית, ההבדל בין האמצעים אינו משמעותי, ושתי הצורות בנויות עם אותו מספר של אלמנטים מאותו סוג ותוכן פסיכולוגי, ניתן לומר כי הם מקבילים. אם לא, אתה צריך לתקן אותם עד שהם. חוסר האמינות מזוהה עם הערך rxx´= 0 4. טעות השגיאה האופיינית: ההבדל בין הציון האמפירי לבין הציון האמיתי הוא טעות אקראית, הנקראת שגיאת מדידה. סטיית התקן של שגיאות המדידה נקראת טעות מדידה טיפוסית. ה שגיאת מדידה טיפוסית מאפשר לבצע הערכות לגבי האמינות המוחלטת של הבדיקה, כלומר, כדי להעריך כמה שגיאת מדידה משפיעה על ציון.
אמינות ואורך: אורך הבדיקה מתייחס למספר האלמנטים שלה. האמינות תלויה באורך זה. אם הבדיקה מורכבת משלושה אלמנטים, נושא יכול פעם לקבל ציון של 1 או אחרת, או באופן מקביל, ציון של
מרגע אחד למשנהו, הניקוד השתנה בנקודה אחת; נקודה מעל שלוש היא וריאציה של 33%, וריאציה גבוהה. אם הנבדקים מקבלים שינויים אקראיים מסוג זה, המתאם של המבחן עם עצמו או עם שתי צורות מקבילות של המבחן יהיה מופחת באופן משמעותי ולא יכול להיות גבוה. אם הבדיקה היא הרבה יותר, אם יש לך, למשל, 100 פריטים, נושא יכול לקבל 70 נקודות בהזדמנות אחת ו 67 על בסיס מקביל. מ אחד למשנהו זה השתנה 3 נקודות; היא שונה יחסית יחסית למבחן הכולל, במיוחד 3%. השינויים הזעריים הקטנים הללו, המתרחשים בציוני הנבדקים, כאשר הם יוצאים מצורה אחת למקביל, הם חסרי חשיבות יחסית ולא יקטנו כפי שהיה לפני המתאם בין שני הדברים.
מקדם האמינות יהיה גבוה בהרבה מהמקרה הקודם. משוואת ספירמן-בראון מבטאת את הקשר בין אמינות ואורך. הדיוק של הבדיקה הוא אפס כאשר האורך הוא 0, והוא מגדיל ככל שהאורך גדל. למרות הגידול הוא קטן יחסית כמו אורך אשר חלק גדול יותר. משמעות הדבר היא כי הדיוק גדל הרבה בהתחלה, ופחות מאוחר יותר. כאשר אורך נוטה אינסוף, מקדם האמינות נוטה
על ידי הגדלת אורך הבדיקה, הדיוק שלה עולה כי זה מגדיל את השונות האמיתית בשיעור גבוה יותר מאשר שונות השגיאה. משמעות הדבר היא כי הדיוק של הבדיקה עולה כי שיעור השונות עקב השגיאה פוחת. הנוסחה של רולון, כמו גם הנוסחה של פלנגן וגוטמן, רלוונטית במיוחד בעת חישוב מקדם האמינות על פי שיטת שני החצאים. אלו הן נוסחאות המשמשות לחישוב מקדם המהימנות.
אמינות ועקביות: מקדם האמינות ניתן למצוא גם בדרך אחרת, זה מה שנקרא מקדם אלפא o מקדם של generalisability או ייצוג (Cronbach). זה מקדם אלפא מציין את הדיוק שבו כמה פריטים למדוד היבט של אישיות או התנהגות. ניתן לפרש את זה כ: הערכה של המתאם הממוצע של כל הפריטים האפשריים בהיבט מסוים. מידה של דיוק המבחן על פי הקוהרנטיות שלו או עקביות פנימית (הקשר בין האלמנטים שלו, עד כמה רכיבי הבדיקה מודדים כל זאת) ואורכו. ציון הייצוגיות של המבחן, כלומר, הסכום שבו מדגם הפריטים המרכיבים אותו מייצג את האוכלוסייה של פריטים אפשריים מאותו סוג ותוכן פסיכולוגי. ה מקדם אלפא משקפת בעיקר שני מושגים בסיסיים בדייקנות של מבחן: 1. הקשר בין האלמנטים שלה: המידה שבה כולם מודדים את אותו הדבר.
אורך הבדיקה: כאשר מגדילים את מספר המקרים של מדגם, ואם טעויות שיטתי יבוטלו, המדגם מייצג את האוכלוסייה טוב יותר מאשר הוא מופק וזה יותר סביר כי השגיאה בשוגג מעורב. אם הפריטים של הבדיקה הם דיכוטומיים, (כן או לא, 1 או 0, הסכם או מחלוקת, וכו '), המשוואה של מקדם אלפא היא פשוטה, המביא את המשוואות של Kuder-Richardson (KR20 ו KR21). בהתחשב במספר מסוים של פריטים, מבחן יהיה אמין יותר, כאשר הומוגנית יותר. מקדם אלפא מספר לנו את האמינות כפי שהוא מייצג הומוגניות ועקביות או עקביות פנימית של האלמנטים של הבדיקה.
תקנים וקריטריונים לאמינות
על פי המודל של מרחב המדגם של פריטים, מטרת הבדיקה היא לאמוד את המדד אשר יושג אם כל הפריטים במרחב המדגם שימשו. מדד זה יהיה הציון האמיתי, אשר המדידות האמיתיות משוער פחות או יותר. בהתאם למידה שבה מדגם של פריטים בקורלציה עם ציונים נכון, הבדיקה היא פחות או יותר אמינה. במודל זה, מטריצת המתאמים בין כל הפריטים במרחב המדגם היא מרכזית, מודל הדגימה הזה מתעקש יותר על עקביות פנימית, וככל שהוא משיג אותו, מבטיח בעקיפין יציבות..
המודל הליניארי של הבדיקות המקבילות מתעקש יותר על יציבות הציונים, וככל שהוא משיג יציבות, הוא מעדיף בעקביות עקביות פנימית. אם נשתמש בבדיקה כדי לקבוע אבחנות ותחזיות אינדיווידואליות, מקדם המהימנות צריך להיות 0.90. בתחזיות ובסיווגים קולקטיביים, זה לא כל כך הדרישה, למרות שזה לא נוח לברוח הרבה מ 0'90 ל 0'80.
לפעמים, סוגים מסוימים של בדיקות, כגון בדיקות אישיות, קשה להשיג מקדמים של יותר מ 0.70. אם טפסים מקבילים, או חצאים מקבילים, מוחלים לאחר מרווח גדול יותר או פחות, שגיאות מזדמנות יכולות להיות רבות יותר מאלו המשפיעות על מקדם האלפא. זאת משום שמה שמקטין את המתאם אינו רק טעויות אקראיות המהותיות במבחן ובמקרה אחד, שהן אלה המתחשבות במקדם אלפא, אלא גם משפיעות על כל השגיאות שיכולות לבוא משני המצבים השונים , אשר עשויים להיות שונים בהרבה פרטים. לכן, מקדם אלפא הוא בדרך כלל גדול יותר מאשר מקדמים אחרים.
למעט המקדם שנמצא על ידי חזרה על אותו מבחן, שכן יש יותר הסתברות כי טעויות אקראיות של היישום הראשון חוזרים על השני, ובמקום להפחית את המתאם בין השניים, להגדיל את זה. זה חייב להיות מובטחת כי היישום השני הוא עצמאי לחלוטין הראשון. אם אנו להשיג זאת, זו תהיה השיטה הקלה והזולה ביותר, מומלץ כאשר מנסים להעריך את היציבות של ציונים, במיוחד במהלך תקופות זמן ארוכות עם בדיקות מורכבות. > הבא: תוקף הבדיקות
מאמר זה הוא אינפורמטיבי בלבד, ב פסיכולוגיה באינטרנט אין לנו את הפקולטה לעשות אבחנה או להמליץ על טיפול. אנו מזמינים אתכם ללכת לפסיכולוג לטפל במקרה שלכם בפרט.
אם אתה רוצה לקרוא מאמרים נוספים דומים תורת המבחן הקלאסית, אנו ממליצים לך להיכנס לקטגוריה של הפסיכולוגיה הניסויית.