תורת התגובה לפריט - יישומים ובדיקות

תורת התגובה לפריט - יישומים ובדיקות / הפסיכולוגיה הניסויית

בתוך שדה תורת הבחינות הפסיכומטריות כתמים שונים הופיעו כי כיום לקחת את השם של "תורת תגובת פריט" (לורד, 1980). ערך זה מציג כמה הבדלים ביחס למודל הקלאסי: 1. היחס בין הערך הצפוי של ציוני הנושא לבין התכונה (המאפיינת את הערכים) אינו בדרך כלל ליניארי. 2. שואפת ליצור תחזיות אישיות מבלי להתייחס למאפייני הקבוצה הנורמטיבית.

אתה עשוי להתעניין גם ב: תורת המבחן הקלאסי מדד
  1. תורת התגובה לפריט או לדגמים של התכונה הסמויה בתיאוריית המבחנים
  2. מודלים של תיאוריית תגובת פריט (טרי)
  3. הערכת פרמטרים
  4. מבחן הבנייה
  5. יישומים של תיאוריית תגובת פריטים
  6. הפרשנות של ציונים

תורת התגובה לפריט או לדגמים של התכונה הסמויה בתיאוריית המבחנים

אנו רואים, אם כן, שתורת התגובה הזאת לפריט מספקת אפשרות לתאר בנפרד את הפריטים, כמו גם את הפרטים; היא גם רואה שהתשובה שניתנה לנושא תלויה ברמת המיומנות שיש בטווח הנחשב. מקורם של מודלים אלה נובע מ Lazarsfeld, 1950, שהציג את המונח "תכונה סמויה" .

מכאן, כי לכל פרט יש פרמטר יחיד אשר אחראי על המאפיינים של הנושא, המכונה גם "תכונה". תכונה זו אינה ניתנת למדידה ישירה, ולכן הפרמטר היחיד נקרא המשתנה הטמון. כאשר החלת בדיקות אתה יכול לקבל שני דברים שונים, את הציון האמיתי ואת כושר בקנה מידה; זה מושג אם נעבור שני מבחנים על אותה הכושר לאותה קבוצה.

בתיאוריה של תכונה או תיאוריה חבויים של התגובה לפריט הציון האמיתי הוא ערך זה צפוי מן הציון שנצפה. לדברי לורד, את הציון האמיתי ואת כושר הם אותו דבר אבל לידי ביטוי שונים מאזני המדידה.

מודלים של תיאוריית תגובת פריט (טרי)

מודלים שגיאה בינומי: הוצגו על ידי לורד (1965), אשר מניחים כי הציון שנצפה מתאים למספר התשובות הנכונות שהושגו במבחן (אשר פריטים יש את כל הקושי אותו יש עצמאות מקומית, כלומר, ההסתברות להגיב נכון לפריט אינו מושפע מהתשובות שניתנות לפריטים אחרים).

מודלים של פואסון: מודלים אלה מתאימים למבחנים בעלי מספר רב של פריטים, ובהם ההסתברות של תשובה נכונה או שגויה היא קטנה. בתוך קבוצה זו, בתורו, יש לנו מודלים שונים:

  1. דגם פואסוני של ראש, שהשערותיהם הן: לכל בדיקה יש מספר רב של פריטים בינאריים שאינם תלויים באופן מקומי. ההסתברות לטעות בכל פריט היא קטנה. ההסתברות שהנושא עושה שגיאה תלויה בשני דברים: הקושי במבחן ובכישרון של הנושא. את הרגישות של הקשיים, שהובנו כתוצאה מערבוב שתי בדיקות מקבילות במבחן יחיד, אשר הקושי שלו הוא סכום הקשיים של שני הבדיקות הראשוניות.
  2. מודל Poisson כדי להעריך את המהירות: מודל זה הוצע גם על ידי Rasch ומאופיין בגלל המהירות בביצוע הבדיקה נלקחת בחשבון. ניתן להציע את המודל בשתי דרכים: לספור את מספר השגיאות שבוצעו ואת מספר המילים שנקראו ביחידת זמן. לספור את מספר השגיאות שבוצעו ואת הזמן שבילה להשלים את הקריאה של הטקסט. ההסתברות של מימוש מספר מסוים של מילים במבחן (i) על ידי נושא (j), לזמן (t)
  3. מודלים אופייביים רגילים: הוא מודל שהוצע על ידי לורד (1968), המשמש בבדיקות עם פריטים דיכוטומיים, ומשתנה אחד בלבד משותף: הגרף שלו יהיה כדלקמן: הנחות היסוד המאפיינות מודל זה הן:
  • המרחב של וריאנט סמוי הוא חד מימדי (k = 1).
  • עצמאות מקומית בין אינטמס.
  • ניתן לבחור את הערך עבור המשתנה הטמון כך שעקומת כל פריט היא ראש הקרב הרגיל.

מודלים לוגיסטיים; זהו מודל דומה מאוד לקודמו, אבל יש לו גם יתרונות רבים יותר בהשוואה לטיפול המתמטי שלו. הפונקציה הלוגיסטית לוקחת את הצורה הבאה: ישנם מודלים לוגיסטיים שונים בהתאם למספר הפרמטרים שיש להם:

  • 2 פרמטרים מודל לוגיסטי, בירנבאום 1968, בין מאפייניו אנו מזכירים כי הוא חד מימדי, יש עצמאות מקומית, האלמנטים הם דיכוטומי, וכו '
  • 3 פרמטרים מודל לוגיסטי, לורד, מאופיין כי ההסתברות להכות על ידי ניחוש הוא גורם שישפיע על הביצועים של הבדיקה. 4.3. מודל לוגיסטי 4 פרמטרים: מודל שהוצע על ידי מקדונלד 1967 ו ברטון-לורד ב -1981, שמטרתו להסביר את המקרים בהם נבדקים בעלי רמת כושר גבוהה אינם מגיבים כראוי לפריט.
  • המודל הלוגיסטי של Rasch: מודל זה הוא זה שיצר את המספר הגדול ביותר של מקומות עבודה למרות חסרון, זה כי ההתאמה שלו לנתונים האמיתיים היא קשה יותר, אבל בניגוד לכך היתרון שעושה את זה כל כך בשימוש היא שזה לא דורש גדול גדלים לדוגמה עבור ההתאמה שלך.

הערכת פרמטרים

השיטה ששימשה ביותר היא מקסימום סבירות, לצד שיטה זו נוהל קירוב נומרית כגון ניוטון רפסון ו ניקוד (ראו) משמשים. שיטת ההסתברות המקסימלית מבוססת על העיקרון של קבלת אומדנים של הפרמטרים הלא ידועים הממקסמים את ההסתברות לקבלת דגימות כאמור. בנוסף ל"סיכוי המקסימלי ", נעשה שימוש בהערכה הבייסיאנית, המבוססת על משפט בייז, הכולל את כל המידע הידוע מראש, הרלוונטי לתהליך קבלת ההמלצות. מחקר מעמיק יותר של שיטת Bayesian להערכת הפרמטרים הכושר הוא זה של Birnbaum (1996) ו Owen (1975). .

פונקציות מידע

המבחן הטוב ביותר שניתן לבנות הוא זה המספק את רוב המידע על תכונה חבוי. הכמות של מידע זה נעשה באמצעות "פונקציות מידע". הנוסחה של פונקציית המידע, בירנבאום 1968, היא כדלקמן: יש לקחת בחשבון שהמידע המתקבל במבחן הוא סכום המידע של כל פריט, מלבד תרומתו של כל פריט אינו תלוי בשאר הפריטים שמרכיבים את המבחן. באופן כללי אנו יכולים לומר כי המידע, בכל הדגמים:

  • משתנה עם רמות כושר.
  • ככל שיפוע של עקומת, מידע נוסף.
  • תלוי בשונות של הציונים, כך גבוה יותר, פחות מידע.

מבחן הבנייה

המשימה הראשונה ואחד החשובים ביותר בעת בניית המבחן הוא בחירה של הפריטים, אקורד הקודם של ההנחות התיאורטיות, כי יש להגדיר את המאפיין כי הבדיקה מתכוונת למדוד. המושג "ניתוח פריט" מתייחס לסדרה של נהלים פורמליים המתבצעים על מנת לבחור את הפריטים שיוצגו בסופו של דבר. המידע הנחשב לרלוונטי ביותר ביחס לפריטים הוא:

  1. קושי של הפריט, אחוז האנשים שעונים על זה.
  2. אפליה, מתאם של כל פריט עם הציון הכולל על המבחן.
  3. משגיחים או ניתוח שגיאות, השפעתה רלוונטית, משפיעה על הקושי של הפריט וגורמת להערכת ערכי האפליה.

בעת קביעת האינדיקטורים למדדים השונים, נעשה שימוש בנתונים הסטטיסטיים או במדדים, והשימוש בהם הוא הגבוה ביותר:

מדד קושי מדד אפליה מדד האינדקס מדד התוקף המדדים המוכרים שיש לקחת בחשבון בבחירת הפריטים שייצרו את המבחן, נראה מה הצעדים הדרושים לבניית בדיקה:

  1. מפרט הבעיה.
  2. הצג קבוצה רחבה של פריטים וניקח אותם באגים.
  3. בחירת המודל.
  4. בדוק את הפריטים שנבחרו מראש.
  5. בחר את הפריטים הטובים ביותר.
  6. בחן את תכונות הבדיקה
  7. קבעו את נורמות הפרשנות של המבחן הסופי שהתקבל.

מן הנקודות הקודמות יש לציין כי בחירת המודל, נקודה 3, תהיה תלויה במטרות שנקבעו במבחן, במאפיינים ובאיכות הנתונים, ובמשאבים הזמינים. כאשר נבחר מודל, בהתחשב בתנאים התיאורטיים שבהם ניתן ליישם אותו, לא למרות מעלותיו יש לנתח אותם בכל מקרה ובנסיבות מסוימות. המאפיינים המיוחסים לאותם דגמים המרכיבים את תורת התגובה על הפריט (TRI), הם יכולים להיות מושפעים על ידי:

  • את מימדיות של הבדיקה את הזמינות הנמוכה של חוסר המדגם של משאבי המחשב ישנם מספר העדפות בעת שימוש אחד או מודלים אחרים, בואו לראות אותם: דגמי ראש נפץ רגיל לא משמשים בדרך כלל ביישומים, הערך שלהם הוא תיאורטי.
  • Rasch: מתאים להשוואה אופקית (מבחנים דומים ברמות קושי עם הפצות כושר דומים). יש צורות שונות של אותו מבחן. * 2 ו 3 פרמטרים: הם אלה המתאימים ביותר למגוון של בעיות.
  • כדי לזהות דפוסי תגובה שגויה. עבור השוואת אנכי של בדיקות (להשוות בדיקות עם רמות שונות של קושי והפצות שונות עבור כושר).

פרמטרים 1 ו -2:

  • מתאים לבנות בקנה מידה אחד, כך שתוכל להשוות את הכישורים ברמות שונות.

בחירת המודל, בנוסף למטרה שננקטה, יכולה להיות מושפעת מגודל המדגם; במקרה שהמדגם גדול ומייצג, לא תהיה שום בעיה במודל הקלאסי או בתכונה הסמויה. אבל ב TRI ( תיאוריית תגובת פריטים ) מדגם קטן כוחות לבחור מודלים עם מספר קטן של פרמטרים, אפילו מודל uniparameter.

יישומים של תיאוריית תגובת פריטים

נראה מה הן היישומים הנפוצים ביותר: א) השוואת הבדיקות, לפעמים יש צורך לקשר את הציונים שהתקבלו במבחנים שונים, עם שתי מטרות אפשריות:

  • אופק אופקי: הוא ביקש להשיג צורות שונות של אותו מבחן.
  • שוויון אנכי: המטרה היא לבנות קנה מידה יחיד של כישרון עם רמות שונות של קושי. לגבי השוואת הבדיקות, לורד (1980) מציג את המושג "הון", מה שמרמז שלכל נושא שני מבחנים יכולים להיות ניתנים להחלפה שכן הוא מיושם שאחד או השני לא ישנה את רמת הכישרון שנאמדה. עבור הנושא.

מחקר של הטיה פריט, פריט הוא מוטה כאשר, בממוצע, זה נותן ציונים שונים באופן משמעותי בקבוצות ספציפיות, כי הם מניחים להיות חלק מאותה האוכלוסייה.

בדיקות מותאמות או ממוצעות , באמצעות TRI, בודדים בודדים ניתן לבנות המאפשרים להסיק בצורה מדויקת יותר את הערך האמיתי של תכונה המדוברת. הפריטים ינוהלו ברצף, קביעה מראש של פריט זה או אחר תהיה תלויה בתשובות שניתנו לעיל. ישנם סוגים שונים של בדיקות מותאמות, אנו מציינים את הדברים הבאים:

  • הליך שני שלבים, לורד 1971; ברץ ווייס 1973 - 1974. בדיקה אחת מועברת תחילה ובהתאם לתוצאות הבדיקה השנייה.
  • נוהל בכמה שלבים, זהה לזו הקודמת, רק התהליך כולל שלבים נוספים.
  • מודל הסתעפות קבוע, לורד 1970, 1971, 1974; Mussio 1973. כל הנושאים לפתור את אותו פריט, בהתאם התגובה, קבוצה של פריטים נפתרה.
  • מודל מסועף משתנה, מבוסס על העצמאות בין הפריטים לבין המאפיינים של אומדני ההסתברות המקסימלית.

בנק פריטים, לאחר קבוצה גדולה של פריטים הוא משהו שישפר את איכות הבדיקה אבל בשביל זה הפריטים חייבים לעבור תהליך איתור באגים הראשון. כדי לסווג את הפריטים, יש צורך לקחת בחשבון איזה תכונה נועד למדוד את הבדיקה כי פריט זה יהיה חלק.

הפרשנות של ציונים

סולמות: מטרתו היא להציע רצף לסדר, לסווג או לדעת מהו הגודל היחסי של התכונה המוערכת; זה יאפשר לנו ליצור הבדלים ודמיון אצל אנשים ביחס לתכונה זו. המאזניים המשמשים בפסיכולוגיה הם: נומינלי, מסודר, מרווח והגיון; קשקשים אלה נבנים מתוצאות הבדיקות, תוצאות הנקראות "ציונים ישירים" .

שנה : כדי לאפיין מבחן היא להפוך את ציוני ישיר לאחרים כי הם פרשנית בקלות מאז הציון מאופיינת יגלה את המיקום של הנושא ביחס לקבוצה, יאפשר לנו לעשות השוואות תוך אינטרקטיביים. קיימים שני סוגים של הקלדה:

  1. ליניארי, לשמור על צורת ההפצה ולא לשנות את גודל המתאמים.
  2. לא ליניארי, הם לא לשמר את ההפצה או את גודל המתאמים .

מדד ה - APTITUDE SCALE ב - TRI, קנה המידה שנבנה הוא הסולם המתאים לרמות הכושר; סולם זה מאופיין משום שהאומדנים וההתייחסויות נעשים ישירות ביחס לכישרון ולסולם. בנוסף לכך, הכישרון המוערך תלוי רק בצורת הצורה האופיינית של הפריטים. בתוך הקשקשים האפשריים אנו מציינים שתיים:

  1. קנה המידה, שהוצע על ידי Woodcock (1978) והוא מוגדר על ידי הנוסחה הבאה:
  2. Wits קנה המידה, המוצע על ידי רייט (1977), סולם זה הוא שינוי של הקודם והוא נתון על ידי היחסים הבאים:

מאמר זה הוא אינפורמטיבי בלבד, ב פסיכולוגיה באינטרנט אין לנו את הפקולטה לעשות אבחנה או להמליץ ​​על טיפול. אנו מזמינים אתכם ללכת לפסיכולוג לטפל במקרה שלכם בפרט.

אם אתה רוצה לקרוא מאמרים נוספים דומים תורת התגובה לפריט - יישומים ובדיקות, אנו ממליצים לך להיכנס לקטגוריה של הפסיכולוגיה הניסויית.