top of page
  • תמונת הסופר/תOren Farber

המספרים לא משקרים - רק מי שממציא אותם

בואו נעשה ניסוי מעניין: כדאי לא לדלג, זה ייקח 30 שניות! רשמו לפניכם סידרה של 20 מספרים תלת ספרתיים בצורה אקראית ככל האפשר. שימרו את הרשימה בצד, מייד נשתמש בה.


ברור לכל שתוצאת הבחירות באיראן ב-2009 זויפו. אחמדיניג'ד זכה ליתרון עצום באזורים שבהם האוכלוסייה מתעבת אותו, ובמקומות שבהם האופוזיציה עמדה לזכות ברוב גורף חסרו (כמה מפתיע) פתקי הצבעה. אבל האם ניתן להיעזר בסטטיסטיקה כדי לחשוף את ההונאה? כנראה שכן. במאמר שהתפרסם בוושינגטון פוסט מצביעים מומחים על העובדה הבאה: כאשר בוחנים את רשימת מספרי הקולות שנספרו ב-116 הפרובינציות נתון שפורסם על ידי וועדת הבחירות) ובודקים את הספרה האחרונה בכל מספר, מגלים שלא כל הספרות (0..9) מופיעות באותה שכיחות. מה זה אומר?


בניגוד לספרה הראשונה המייצגת את סדר הגודל של האוכלוסייה שהצביעה, הספרה האחרונה אינה אמורה לייצג דבר, וזה העניין – היינו מצפים שתהיה שם התפלגות אחידה פחות או יותר. למשל, אם ניקח רשימה אקראית של 1,000 מספרים נצפה שבערך 100 מהם יסתיימו בספרה 1, 100 יסתיימו ב-2 וכן הלאה. כמובן שיש רעש סטטיסטי ולכן נקבל מספרים קצת גדולים או קטנים מ-100, אבל אם ספרה מסוימת תחזור 170 פעמים הדבר יעיד בהסתברות גבוהה למדיי שהסדרה אינה אקראית באמת.

כאשר מנתחים את המספרים מאירן (ע"פ מאמר מ- cognitive daily) מקבלים בדיוק את זה: הספרה 7 מופיעה בשכיחות של 17% בעוד שהספרה 5 מופיעה בשכיחות של 4% בלבד. כעת בדקו את רשימת המספרים שרשמתם. כמה מהם מסתיימים ב-7? כמה מסתיימים ב-5? האם הספרה 7 מופיעה בלפחות 4 מספרים? מה לגבי הספרה 5? מן הסתם נוכחתם שלבן-אנוש מאוד לא פשוט לייצר סדרה אקראית 'אמיתית'. דוגמה נוספת: כאשר נתנו לקבוצת אנשים לבחור מספר אקראי בין 1-20 בניסוי הזה, המספר 17 התקבל ב-18% מהמקרים והמספר 7 ב-12% : ביחד 30%, שהם פי 6 (!) ממה שהיה מתקבל אילו מחשב היה מבצע את הבחירה באקראיות לא מוטית. עד כמה שזה ישמע מטופש, 17 עבורנו הוא יותר 'אקראי' ממספרים אחרים.

בגרף רואים את הטיית התפלגות הספרה האחרונה במספרים מאיראן (כחול) לעומת התפלגות שהייתם מקבלים עבור סדרה 'אקראית' שהייתם ממציאים (ירוק). אם משמרות המהפכה אכן וניסו לפברק מספרים שיראו אמינים, מאוד סביר שהספרה 7 תופיע כספרה אחרונה ביותר מ-10% מהמקרים. למעשה, החוקרים חישבו ומצאו שהסיכוי לקבל סדרת מספרים אקראית כמו זו שהתקבלה בבחירות באיראן הוא פחות מ- 1/200 או חצי אחוז.

בניגוד לאמרתו של מרק טווין ש: "יש שלושה סוגי שקרים: קטנים, גדולים וסטטיסטיקה" נראה שכאן הסטטיסטיקה דווקא עוזרת לחשוף את השקרנים (בהסתברות של 99.5%). בקטנה: מארק טווין השאיל את הרעיון מד'יזראלי שאמר: Lies, damn lies and statistics

תגובות

דירוג של 0 מתוך 5 כוכבים
אין עדיין דירוגים

הוספת דירוג
bottom of page