Nov 17 2009
מספרים משקרים
הגרף הזה הוא אחד מאסופות הנתונים המטעות ביותר שיצא לי להתקל בהן:
(מקור: Kotaku.com)
למה הוא כל-כך מטעה? כי הוא משדר באופן מאד בוטה מסר שאין בו. על פניו, הוא מעיד על ירידות במכירות, ואכן זה חלק ממה שיש בו, אבל הוא מאד מעורר תהיות. איך זה שיש ירידות כאלה גדולות לקראת דצמבר? הרי זו עונת הקניות המטורפת!
הסיבה לבלבול הוא שהגרף הוא בכלל לא של היקף מכירות. הוא רק של שינוי בהיקפי מכירות, כשההשוואה היא לחודש המקביל בשנה שלפני. בחודש דצמבר 2007 אנחנו מרגישים שהיתה ירידה דרסטית במכירות, אבל מה שסביר להניח שקרה הוא המצב הפוך – שבדצמבר מכרו יותר מאשר בספטמבר. אז למה הירידה הדרסטית בגרף? כי בדצמבר 2007 מכרו טיפה פחות מאשר בדצמבר 2006 (לכן הגרף טיפה מתחת ל-0%), בעוד שבספטמבר 2007 מכרו ב-80% יותר מאשר בספטמבר 2006. בעצם אין שום קשר בין הנקודה של ספטמבר על הגרף לזו של דצמבר, מבחינת היקפי מכירות. הגרף הזה לא מדבר על השטויות הללו בכלל. יכול להיות שביוני 2009 – הנקודה הנמוכה ביותר בגרף – המכירות עברו את ספטמבר 2007. אני לא חושב שזה נכון, אבל אי אפשר לדעת מהגרף הזה.
אז מה הבעיה עם זה? יש גרפים של מכירות, ויש גרפים של שינויים במכירות. ולאנשים כלכלה ותעשייה איכפת, יש להניח, משניהם. הבעיה היא שגרפים כאלה מוצאים את דרכם גם לאתרי חדשות כלליים, ואתרי משחקים כמו Kotaku לעיל, ואפילו לעיתונים היומיים. וזה לא משנה שכותרת המשנה של הגרף מנסה להסביר מה בעצם קורה בו. הכותרת הראשית היא עדיין “מכירות משחקים”. וכפי שאפשר לראות באתר שממנו לקחתי את הגרף, גם לשים הסבר בגוף הכתבה לא עוזר – התגובות מראות שאנשים יפרשו את המידע לא נכון. אז למה Kotaku שמו אותו? כי זה נראה מרשים. דרמטי. פופוליסטי. Graph porn.
אין הרבה מה לעשות חוץ מלנסות להעלות את המודעות של הקוראים לבעייתיות של נתונים מספריים, בצורת גרף או אחרת, בכל הזדמנות. ברכה על ראשם של העומלים על כך.
* * *

גם אני לא אוהב את זה. תודה על הפוסט.
אני מחשיבה את עצמי די טובה בעניין הזה של הגרפים, אבל שום סיכוי שבעולם שאני אבין מה זה Monthly Data, Y/Y % Change – לא בלי ההסבר שלך (תודה אבנר).
עומר: בתור מישהו שצריך לספק אינפוגרפיקה לכתבה בשעה הקרובה, אני יודע כמה זה קשה להעביר משהו משמעותי בגרף. אבל זה כל כך קל להעביר משהו לא משמעותי ושיראה מרשים…
דפנה: גם אני לא הייתי עולה על זה אם לא הייתי נחשף למונח Year on year changes בעבודה בזמן האחרון. לא סתם שזה לא קונצפט אינטואיטיבי, גם הניסוח (Y/Y%) הוא עמוק במעמקי ה-Nerdview. או הז’רגון המקצועי, אם תרצי.
אני מקבל את ההבחנה. Kotaku, אם כך, הוא מנוע טרנספורמציה שהופך ז’רגון מקצועי ל-Nerdview. היאח!
ובבקשה אל תגיע למצב שאתה עושה דברים נוראיים כמו זה: http://www.calcalist.co.il/local/articles/0,7340,L-3362401,00.html
כן, אני זוכר את הכתבה הזו. מה, לא חשוב לך לדעת ש-100% מהרופאים למדו רפואה? ושל-100% מהאנשים עם תואר דוקטור יש תואר שלישי ומעלה? שירות לציבור!
אורי: צריך אתר שיתופי, במודל ויקי כזה או אחר, שמישהו יכול לקשר לגרף או נתון כלשהו ולשאול מה המשמעות האמיתית שלו, ובתקווה שמומחים בתחום יבואו ויסבירו. זה דורש לפתח קהילה מומחית, כמו בויקיפדיה. אולי זה יהיה אפשרי תחת מסגרת אידאולוגית כמו ויקיפדיה, או סתם לגייס תמיכה באמצעות סיסמאות מחתרתיות של “לנצח את השקרים של הממסד”