ארכיון התגית 'אינפוגרפיקה'

Aug 11 2010

פינת האינפוגרפיקה: סקס מבלבל

הרבה אקשן רץ היום בבלוגוספירה ובאתרי חדשות הטכנולוגיה. OKCupid, אתר ההיכרויות לחנונים, התחיל לפני כמה זמן לפרסם פוסטים מעניינים עם נתונים סטטיסטיים מעניינים על המשתמשים שלהם, וכל מי שאוהב לקחת מידע סטטיסטי ולהוציא ממנו מסקנות אופרטיביות לחיים מיד התחיל להתלהב. אבל העדכון האחרון לגמרי שיגע כתבי טכנולוגיה ואת העורכים שלהם, עד כדי פספוס מלא.

בעדכון האחרון, OKCupid עשו מחקר השוואתי בין איכות הצילום והמצלמה של המנוי באתר, לבין הפופולריות והנחשקות של אותו מנוי. בנוסף למידע סטטיסטי מופרך יותר (“מצלמות פנאסוניק = סקסי, מצלמות קודאק = לא סקסי”) או פחות (“תמונות עם פלאש גורמות לדירוג יופי נמוך יותר”), עלתה מהמחקר שלהם מסקנה לגבי משתמשי סמארטפונים. בואו נעשה את זה בצורה של תרגיל מודרך:

SexAndSmartPhones

* Picture is © OKCupid.

 

מה אנחנו רואים כאן? על פניו, ועל פי הכותרת, יש כאן גרף של פעילות מינית של בעלי סמארטפונים. המספרים מאד מובהקים: משתמשי אנדרואיד: 6! משתמשי אייפון: 11! המסקנה? משתמשי אייפון מקיימים פי שתיים יחסי מין! כותרת! סקס מוכר!

הרבה בלוגים טכנולוגיים ואתרי חדשות פרסמו את הסיפור הזה. זה לא משנה ש-OKCupid רצו רק לעודד אנשים להצטלם באופן יותר אטרקטיבי, והתובנה על הסמארטפונים היתה משנית. לעורכים היתה כותרת – “משתמשי אייפון מזיינים יותר”. אבל משום מה אף אחד לא עבר את הכותרת של הגרף והסתכל מה בעצם כתוב שם.

המספרים עצמם כבר אמורים להיות חשודים. פעילות מינית לגברים עם אנדרואיד: 6. אבל שש מה? מה יחידות המידה? את התשובה אפשר לראות בצד שמאל של הגרף – “מס’ ממוצע של פרטנרים מיניים עד גיל 30”. אין כאן שום קורלציה לפעילות מינית – אם לאדם היו 10 פרטנרים מיניים עד שנת 2007, ויובש מיני מוחלט מאז שקנה את האייפון – הוא עדיין יחזק את הטענה המופרכת שמשתמשי האייפון פעילים יותר. אם משתמש אנדרואיד מקיים יחסי מין באופן יום-יומי עם חמש נשים שונות, הוא עדיין יוריד את הממוצע, ואת התפיסה של הפעילות המינית של המכשיר שלו.

אם כבר יש משהו שאפשר ללמוד מהגרף, הוא על הרגלי המונוגמיה של אנשים, אבל גם שם לא הייתי ממהר להוציא כותרות בנוסח “אייפון זנותי, אנדרואיד חסוד”. הנתונים הסטטיסטיים האלה מתעלמים מעשרים אלף גורמים חיצוניים, כמו המדינות בעולם שבהם נמכרים אייפונים ו/או אנדרואידים, וכו’, והמטענים התרבותיים שלהם. אנחנו לא יודעים אם מדובר ב-10 פרטנרים חד פעמיים או 10 מערכות יחסים ארוכות טווח. אנחנו לא יודעים כלום. חוץ משלושה דברים: את הנתונים המספריים היבשים שאנחנו רואים שם בגרף. את העובדה ש-OKCupid עצמם, בין אם בטעות או בשביל לגרור צפיות, נתנו לנתונים כותרת מטעה. ושעורכים וכתבים ברחבי העולם, עם כמה יוצאי דופן ראויים לציון, יוותרו לחלוטין על הבנה של טקסט, שלא לומר על הבנה של אינפוגרפיקה שאמורה למנוע בלבולים, כדי לתקוע כותרת סנסציונית וחסרת משמעות. אבל זה כבר לא ממש מפתיע, נכון?

2 תגובות

Jun 02 2010

פינת האינפוגרפיקה: עמודות וסדרי גודל

שלום קוראים יקרים, שוב אני בפינת האינפוגרפיקה המטעה, והפעם שבנו לעסוק בכלכליסט. אני אציין רק שאני מתמקד בכלכליסט לא כי הם חוטאים במיוחד בתחום הזה, אלא כי בתוקף תפקידי ככתב ועורך שם אני פשוט נחשף למקרים רבים יותר של חטאי-אינפוגרפיקה מצידם.

calcalistGraph

הבעיה כאן פשוטה מאד. חוץ מאשר הטעות הגסה בכותרת המשנה (מדובר במיליארדים, לא במיליונים), גרף עמודות מסתמך על הנחה בסיסית שהיחס בגדלים בין העמודות הוא יחס ישר. לאורך העמודות הראשונות, בשנת 2004-2007 למשל, אפשר לראות שהבדלים קטנים במספרים מתבטאים בהבדלים קטנים בגרף. אם ניקח את 2004 כאמת מידה, אז העמודה בגובה 96 פיקסלים מייצגת 1.23 מיליארד שקל, כלומר 11.6 מיליון שקל לפיקסל. העמודה השניה, בגובה 79 פיקסלים על 1.14 מיליארד שקל, מייצגת 14.6 מיליון שקל לפיקסל. לא אחיד, אבל ההבדל לא עצום.

אבל אז אנחנו מגיעים ל-2009 והקפיצה הגדולה. 1.69 מיליארד על 188 פיקסל הם 6.2 מיליון שקל לפיקסל, חצי מהסטנדרט שנקבע בהתחלה. 2011, לעומת זאת, מייצגת 30 מיליון שקל לפיקסל- 900 מיליון ש”ח על 30 פיקסלים בלבד.

המטרה כאן ברורה. בשביל להעביר ביקורת על קיצוץ תקציבי המדען הראשי, העיתון מנסה להדגיש את הצמצום. אבל יש כאן ניצול לרעה של גרף העמודות האובייקטיבי-לכאורה, אבל שבא להציג ירידה של 46% בתקציב באמצעות ירידה גרפית של 84% כמעט פי שתיים משיעור הירידה האמיתי.

7 תגובות

Mar 02 2010

פינת האינפוגרפיקה: ספרים דיגיטליים

היססתי בהתחלה עם הפוסט הזה, לא הייתי בטוח שהוא לגמרי מוצדק. לא מתוך לויאליות למערכת כלשהי, אלא כי החטא כאן הרבה פחות מובהק מאשר במקרים אחרים. אבל בכל זאת, אינפוגרפיקה מטעה היא אינפוגרפיקה מטעה.

בכתבה הזו של עומר כביר בכלכליסט (גילוי נאות וכו’: אני עובד עם עומר בדסק הטכנולוגי של כלכליסט, אבל לא הייתי מעורב בשום צורה בכתבה הזו) שולבה אינפוגרפיקה לגבי היקף מכירות ספרים דיגיטליים מתוך סך הספרים שנמכרו בארה”ב:

כל הזכויות שמורות לכלכליסט. התמונה מובאת לצורכי ביקורת
ebook_infographics

הגרף לא משקר ישירות, ואפילו לא חוטא למטרה שלו, שהיא להדגיש את הגידול המרשים בהיקף המכירות של הספרים הדיגיטליים. אבל הוא מציב שני נתונים שונים אחד ליד השני, והעיצוב הגראפי מוביל לבלבול:

הגרף עצמו לא מייצג אחוזים, אלא נתון ישיר – מכירות, במליוני דולרים. הבעיה היא שהנתון מוצג כגרף אופקי, ולא אנכי, והוא תחום בתוך ספר לבן, מה שיוצר את הרושם שסוף הספר הוא הסוף, כלומר המקסימום האפשרי לנתון הזה. התחושה הזו לא הייתה ממש מפריעה אם לא היה את הנתון השני שמוצמד משמאל, שהוא השיעור של הספרים הדיגיטליים מכלל מכירות הספרים. ביחד, הגרף יוצר את הרושם שב-2009 היקף הספרים הדיגיטליים היה כ-90% משוק הספרים בכלל, כי הוא מגיע כמעט עד הדופן הימנית של התרשים. בגרף כזה מאד קל לרפרף על המספרים ולהסתכל על הגרפיקה, וכאן זה נראה שהעמודות של הגרף מייצגות את המספר משמאל.

זה כמובן לא המצב. ב-2009 מכירות הספרים הדיגיטליים היו רק 3.3%. והנתון הרי רשום שם, שחור על גבי צהוב, וכל קריאה קפדנית תראה את זה. אבל כל המטרה של אינפוגרפיקה היא לתמצת נתונים באופן גראפי כך שלא נצטרך קריאה קפדנית, אלא שתעביר את המסר, את הטרנד הכללי, באופן מיידי. וההצבה הזו של שני הנתונים כחלק מאותו תרשים משדרת תחושה שהספרים הדיגיטליים מהווים נתח נכבד משוק הספרים. בכתבה שדנה בשליטתה המממשת ובאה של גוגל בשוק הספרים הדיגיטליים, התחושה הזו תורמת, כמובן, למסר של הכתבה. רק חבל שהיא משתמשת כאן באינפוגרפיקה דמגוגית, במכוון או שלא במכוון, כדי לתמוך במסר. אני חושב שהוא חזק מספיק בפני עצמו.

10 תגובות

Nov 17 2009

מספרים משקרים

הגרף הזה הוא אחד מאסופות הנתונים המטעות ביותר שיצא לי להתקל בהן:

GameIndustryGraph

(מקור: Kotaku.com)

למה הוא כל-כך מטעה? כי הוא משדר באופן מאד בוטה מסר שאין בו. על פניו, הוא מעיד על ירידות במכירות, ואכן זה חלק ממה שיש בו, אבל הוא מאד מעורר תהיות. איך זה שיש ירידות כאלה גדולות לקראת דצמבר? הרי זו עונת הקניות המטורפת!

הסיבה לבלבול הוא שהגרף הוא בכלל לא של היקף מכירות. הוא רק של שינוי בהיקפי מכירות, כשההשוואה היא לחודש המקביל בשנה שלפני. בחודש דצמבר 2007 אנחנו מרגישים שהיתה ירידה דרסטית במכירות, אבל מה שסביר להניח שקרה הוא המצב הפוך – שבדצמבר מכרו יותר מאשר בספטמבר. אז למה הירידה הדרסטית בגרף? כי בדצמבר 2007 מכרו טיפה פחות מאשר בדצמבר 2006 (לכן הגרף טיפה מתחת ל-0%), בעוד שבספטמבר 2007 מכרו ב-80% יותר מאשר בספטמבר 2006. בעצם אין שום קשר בין הנקודה של ספטמבר על הגרף לזו של דצמבר, מבחינת היקפי מכירות. הגרף הזה לא מדבר על השטויות הללו בכלל. יכול להיות שביוני 2009 – הנקודה הנמוכה ביותר בגרף – המכירות עברו את ספטמבר 2007. אני לא חושב שזה נכון, אבל אי אפשר לדעת מהגרף הזה.

אז מה הבעיה עם זה? יש גרפים של מכירות, ויש גרפים של שינויים במכירות. ולאנשים כלכלה ותעשייה איכפת, יש להניח, משניהם. הבעיה היא שגרפים כאלה מוצאים את דרכם גם לאתרי חדשות כלליים, ואתרי משחקים כמו Kotaku לעיל, ואפילו לעיתונים היומיים. וזה לא משנה שכותרת המשנה של הגרף מנסה להסביר מה בעצם קורה בו. הכותרת הראשית היא עדיין “מכירות משחקים”. וכפי שאפשר לראות באתר שממנו לקחתי את הגרף, גם לשים הסבר בגוף הכתבה לא עוזר – התגובות מראות שאנשים יפרשו את המידע לא נכון. אז למה Kotaku שמו אותו? כי זה נראה מרשים. דרמטי. פופוליסטי. Graph porn.

אין הרבה מה לעשות חוץ מלנסות להעלות את המודעות של הקוראים לבעייתיות של נתונים מספריים, בצורת גרף או אחרת, בכל הזדמנות. ברכה על ראשם של העומלים על כך.

10 תגובות

« הקודם

  • הודעות אחרונות

  • לרישום בדואר

  • תגיות ונושאים

  • מהעבר

  • Meta

  • עמודים קבועים