טעות חיובית או שלילית

הנה הודעה שהוציא היום משרד הבריאות לעיתונות – תקלה באפליקציית "המגן" הובילה לכך שאנשים קיבלו התראה על כך ששהו ליד מי שנדבקו בנגיף, למרות שבפועל לא שהו בסביבתם.

ברור שמדובר בטעות, אבל לאור העובדה שנתקלתי במספר התיחסויות מבלבלות לגבי איזו מין טעות זו – ננצל את ההזדמנות ונעשה סדר.

הבדיקה שנועדה לבחון אם מישהו שהה ליד מי שנדבקו בנגיף הקורונה היא בדיקה סטטיסטית. היא מדויקת במידה רבה, אבל כמו כל ניסוי או בדיקה סטטיסטית – יתכנו בה גם טעויות.

במחקר מדעי נהוג להיות זהירים כשבודקים משהו חדש, למשל כאשר בוחנים אם בדיקה חדשה היא יעילה או אם טיפול חדש משפיע. לאור זאת, "השערת האפס" של הבדיקה, כלומר התוצאה הצפויה (מסומנת כ- H0) היא שאין לאוביקט הנבדק השפעה.

במהלך הניסוי יבדקו החוקרים אם יש די נתונים כדי לדחות את השערת האפס ובכך לקבל את "ההשערה האלטרנטיבית" (H1), או שאין די נתונים כאלו ולכן נישאר עם השערת האפס.

ארבעה סוגים של תוצאות

בניסוי או בדיקה כזו חשוב להבחין בין סוגים שונים של טעויות או של תשובות נכונות. נתייחס לכל אחד מהם בנפרד (הצבעים – בהתאמה לאיור המצורף).

נתחיל בשני סוגי הטעויות:

טעות מסוג I: הבדיקה גילתה משהו שלא קיים במציאות (דחינו בטעות את השערת האפס). טעות זו מכונה False Positives משום שהתוצאה החיובית של הבדיקה היא שגויה.

טעות מסוג II: הבדיקה לא גילתה משהו שכן קיים במציאות (קיבלנו בטעות את השערת האפס). טעות זו מכונה False Negatives, מפני שהתוצאה השלילית של הבדיקה היא שגויה.


תוצאות הבדיקה יכולות להיות גם נכונות באחת משתי דרכים, כפי שאפשר לראות בתמונה:

הבדיקה זיהתה נכון את קיומו של האפקט הנבדק – True Positives

הבדיקה לא זיהתה את קיומו של האפקט הנבדק, והוא אכן לא קיים במציאות – True Negatives

הסיבה לכך שחשוב להבחין בין סוגי הטעויות היא שלכל אחת מהן יש השלכות שונות:

טעות מסוג I עלולה להוביל לטיפול יתר, כתוצאה מהזיהוי השגוי של האפקט (במקרה שלנו – הכנסת הנבדק לבידוד).

טעות מסוג II עלולה להוביל לפספוס כתוצאה מהזיהוי השגוי של האפקט (במקרה שלנו – אנשים שלא ייכנסו לבידוד, למרות שיתכן ונדבקו).

מניח שכבר זיהיתם שהטעות שמתוארת בכתבה היא טעות מסוג I, או False Positives. טוב שעלו עליה, ונקווה שלא יתגלו גם טעויות מהסוג השני.

בבדיקה שמסתמכת על השערות סטטיסטיות יש דרכים לכמת את ההסתברות לכל אחת מהשגיאות, על בסיס מדדים של רגישות ודיוק. משתמשים בהם בין היתר כשרוצים לצמצם את אחת השגיאות (בגלל המשמעויות הכבדות שלה), גם במחיר הגדלת ההיקף של הטעות השניה. זה כבר שווה פוסט קצרצר נוסף – בקרוב.

עד כאן להפעם!