מה זה מדגם מייצג?

פרק ראשון במושגי יסוד בסטטיסטיקה וסקרים


אנו שומעים מכל עבר "סקר שנערך בקרב מדגם מייצג המונה 500 איש...מגלה כי...".

מה זה אומר?

ובכן, מובן שלסקר שלנו היינו רוצים לקבל את הדיוק המקסימלי ביותר, אך אין לנו באמת יכולת להגיע ל-100% מהאוכלוסייה. מה עושים? בוחרים נציגים, שכשמם כן הם: "מייצגים".

הנה, נערוך כאן יחד לדוגמא מדגם מייצג בישראל.

למשל, אוכלוסיית ישראל מונה כ- 8.5 מיליון איש. וכמה שהם מגוונים, אין צורך לספר.

על מנת לייצג אותם במינון המדויק ביותר ע"י הנציגים של כל האוכלוסיות הקיימות, חייב לדעת מה גודלה היחסי של כל תת-אוכלוסייה.

בואו נתחיל לחתוך לדוגמא (במספרים מעוגלים לשם הדוגמא).

אנו צריכים במדגם שלנו:

75% יהודים ו- 25% שאינם יהודים (מוסלמים ואחרים).

את אוכלוסיית היהודים (ואח"כ גם את השאר באופן דומה) לחלק לגברים ונשים (50:50).

חלוקה גילאית: כל קבוצה צריכה להתחלק לכלל הגילאים כך שייצגו טוב את חלקם היחסי באוכלוסייה.

למשל, יש יותר צעירים מאשר מבוגרים, לכן בכל קבוצה יהיה משקל גבוה יותר של צעירים לעומת מבוגרים. בקבוצה החרדית והערבית לדוגמא היחס יהיה אף עוד יותר לטובת הצעירים.

אז חילקנו את הלאום, המגדר, והגיל. כעת נצלול למשתנים בין המגזרים השונים באוכלוסייה, מה שנקרא מידת דתיות ונראה כיצד ה-100% שלנו מתחלק:

10% חרדים (50 איש),

10% דתיים לאומיים (50 איש),

10% מסורתיים דתיים (50 איש),

20% מסורתיים לא דתיים (100 איש),

25% חילונים (150 איש)

20% ערבים מוסלמים (125 איש),

ו-5% ערבים שאינם מוסלמים (25 איש).

נזכיר, כי כל קבוצה כאן מתחלקת לגברים ונשים, וגם על פי גילאים.

לכן, בקבוצת 25 החרדים הגברים, יהיו למשל כ- 10 צעירים עד גיל 25, 6 בוגרים יותר עד גיל 35, 5 נוספים עד גיל 45, ו-4 נותרים בגילאי 45 ומעלה.

וכך בדיוק גם בקבוצת 25 הנשים החרדיות, ובכל קבוצת אוכלוסייה אחרת, אם כי במינונים מעט שונים.



מה קורה עם אזור גיאוגרפי? שהרי אין דומה צפוני לגוש-דני, הרצליאני לטבריאני. לכן ניתן גם לכל אזור משקל שווה בהתאם לגודלו.

אותם 10 חרדים צעירים עד גיל 25, יתחלקו לבודדים מכל אזור כדי לייצג את כלל הצעירים החרדים מכל רחבי הארץ.

וכדי להקשות, לא התחשבנו עדיין ברמה החברתית כלכלית של כל נציג במדגם. לא ייתכן שניתן ל-25 גברים חרדים בעלי הכנסה גבוהה לייצג את אוכלוסיית הגברים החרדים בכל הארץ. דעותיהם עלולות להיות שונות מהותית, מאשר אותה אוכלוסייה אך עם הכנסה נמוכה מהממוצע. לכן, נתחשב גם במאפיין זה, ונאזן את המדגם ביחס הנכון.

וגם כאן, כללים שונים לכל אוכלוסייה בנפרד.

טוב, ויש עוד כמה משתנים כמו: ארץ מוצא, שנת עלייה, השכלה ועוד.

עקרונית, אם הצלחנו להביא נציגים מדויקים מכל תתי-האוכלוסיות, כלומר כאלו שייצגו באופן מדויק מכל בחינה (השכלה, הכנסה, אזור וכד') את תת האוכלוסייה שלהם, המדגם שלנו מסוגל להציג את דעת הקהל בדיוק מקסימלי.

מדגם מכלל האוכלוסייה, כלומר באופן יחסי. מדגם מייצג.


וכאן האתגר: להצליח לייצג את כל תתי האוכלוסיות בעזרת נציגים בודדים מכל אחת. והאתגר מתעצם עוד יותר: כל שלב משפיע באופן קריטי, החל משיטת האיסוף של המשיבים, ועד אופן הצגת השאלות. אבל על כך במאמר אחר.

בשורה התחתונה, מדגם מייצג הוא קבוצת הנציגים שלנו לאוכלוסייה הנחקרת, אשר חוסכת לנו הגעה לכל הפרטים באוכלוסייה זו.

וקצת יותר במונח המדעי, להחזיק חזק:

מדגם מייצג הוא קבוצה קטנה של פריטים מתוך האוכלוסייה עליה אנחנו מבצעים את הסקר, אשר מייצגת את האוכלוסייה ברמה המיטבית במשתנים הרלוונטיים לסקר.


מאמר הבא: מהו גודל המדגם הרצוי?

מאמר נוסף: מהי טעות הדגימה?

מה חשוב לדעת לפני הזמנת סקר?

מהן שיטות המחקר המופעלות בקבוצות המיקוד?

מדגם מייצג באוכלוסייה היהודית בישראל. חלוקה לתתי קבוצות רבות בחברה הישראלית, עם מורכבות רבה.
מדגם מייצג באוכלוסייה היהודית בישראל. חלוקה לתתי קבוצות רבות בחברה הישראלית, עם מורכבות רבה.
מדגם מייצג מחייב בחירת אוכלוסיות בדגימה מדוקדקת.
מדגם מייצג מחייב בחירת אוכלוסיות בדגימה מדוקדקת.