הקונספירציה, הסטטיסטיקה..והבאג

Oren Farber
9 במאי
זמן קריאה 2 דקות

עודכן: 10 במאי

מאז 2022 מופצות ברשת רשימות מפורטות של מדענים שמתו או נעלמו - לעיתים עם רמיזה לדפוס אפל: פיזיקאים גרעיניים, חוקרי היתוך, אנשי אווירונאוטיקה. אנשים אינטליגנטיים שאלו בצדק: מה קורה כאן?!

אבל האמת לעיתים מגיעה לא ממודיעין חשאי אלא מסטטיסטיקה בסיסית.

ואם מרחיבים רגע את המבט, אפשר ללמוד מזה משהו עמוק יותר על איך המוח שלנו עובד, איך מודלי שפה עובדים, ועל סוג של זהירות אינטלקטואלית שהעידן הזה דורש.

הבעיה הראשונה: 13 מתוך כמה?

כשאומרים ״13 מדענים״, המספר נשמע דרמטי.

אבל בלי מכנה, מספרים הם כמעט חסרי משמעות.

בארה"ב לבדה פועלים מאות אלפי עד מיליוני אנשי מחקר, תלוי איך מגדירים ״חוקר״. באוכלוסייה גדולה כזו, לאורך כמה שנים, מקרי מוות, תאונות, היעלמויות וטרגדיות אישיות אינם אירועים חריגים.

השאלה הנכונה איננה:״האם 13 זה הרבה?״

אלא: ״13 מתוך כמה?״

ברגע שמחזירים את ההקשר, התמונה משתנה.

זו אחת משגיאות החשיבה הידועות ביותר: התעלמות משיעור הבסיס (base rate neglect).

פשוט: אנחנו נוטים להיבהל ממספר מוחלט, בלי לשאול האם הוא באמת חריג ביחס לגודל האוכלוסייה.

הצלף מטקסס

יש כשל קוגניטיבי מפורסם שנקרא ״הצלף מטקסס״.

מישהו יורה אקראית על קיר, ואז מצייר עיגול סביב קבוצת הפגיעות הצפופה ביותר.

מבחוץ זה נראה כמו מקבץ מרשים. בפועל - המטרה צוירה אחרי הירי.

כך פועלות לא מעט רשימות קונספירטיביות.

מתוך אוכלוסייה עצומה, בוחרים בדיעבד מקרים שמתאימים לנרטיב מסוים: ״תחום רגיש״, ״נסיבות מסתוריות״, ״תזמון מחשיד״.

ואז נוצרת אשליה של דפוס.

לפעמים יש דפוס אמיתי, אבל עצם קיומה של "רשימה" איננו הוכחה לכך.

כאן AI נכנס לתמונה

וזה החלק המעניין.

המוח האנושי נוטה לזהות דפוסים - גם כשהראיות חלשות. מודלי שפה נוטים לייצר תשובות שנשמעות כמו דפוס קוהרנטי - גם כשהבסיס חלש.

אבל זה לא אותו מנגנון.

המוח מחווט לזהות משמעות. מודל שפה אומן לחזות המשך טקסט סביר.

אבל התוצאה יכולה להיראות דומה באופן מפתיע!

שאל מודל: ״מה הקשר בין X ל-Y?״

אם השאלה מניחה שיש קשר, לעיתים קרובות הוא יפיק תשובה משכנעת גם אם הקשר רופף, ספקולטיבי, או פשוט לא מבוסס מספיק.

לא משום שהוא ״משקר״, אלא משום שזה בדיוק מה שהוא בנוי לעשות: לייצר המשך טקסט שמתאים לתבנית הציפייה. בקיצור, צפייה יוצרת הזיה.

הבאג והכוח הם אותו מנגנון

וזו הנקודה המרתקת.

אותו מנגנון המאפשר לנו לזהות פנים בעננים - הוא גם זה שמאפשר לנו לזהות את הילד שלנו בתוך קהל.

אותו מנגנון שמאפשר למודל שפה להציע קשר חלש מדי - הוא גם זה שמאפשר לו לייצר אנלוגיה מבריקה שלא חשבנו עליה.

זיהוי דפוסים איננו באג נפרד מהמערכת.

זו הארכיטקטורה עצמה - הכוח והכשל מגיעים מאותו מקום.

שלוש הגנות שימושיות

זה לא "מדריך" אלא הצעה להרגלים אינטלקטואליים טובים:

1. חפש את המכנה הנסתר

בכל פעם שמציגים לך דפוס, שאל:

ביחס למה?
מה גודל האוכלוסייה (מכנה)?
מה היה קורה גם בלי שום הסבר מיוחד?

אין מכנה - אין משמעות.

2. היזהר משאלות ״למה״

מודלי שפה חזקים יחסית בסיכום, הסבר, חישוב, ניתוח טקסט

הם מסוכנים יותר כשמבקשים מהם:

להסביר מניעים
לבנות קשרים סיבתיים
לפרש כוונות
לנבא

ככל שהשאלה פתוחה יותר, כך עולה הסיכון לקבל התאמה לדפוסים במקום אמת.

3. חשוד בביטחון מופרז

הסימן המדאיג ביותר איננו בהכרח טעות - אלא ביטחון מופרז.

טעות מגומגמת קל לזהות. טעות חלקה, מסודרת, רהוטה ובטוחה בעצמה מטעה הרבה יותר.

זה נכון לגבי: מודלי שפה, כותרות, מומחים... ואנחנו. ריצ'רד פיינמן אמר בהקשר זה שאתה האדם שהכי קל לך לרמות.

שורה תחתונה:

ספק בריא לא שואל רק: ״האם זה נכון?״

הוא שואל: ״מאין הביטחון?״

אולי זו השאלה החשובה ביותר לעידן של רשתות חברתיות, AI, ותשובות שנשמעות טוב מדי.