Mar 08 2009
טעות לעולם וכו’
בפוסט הקודם שלי טעיתי באיות הביטוי “קיתונות של בוז” כ-“קיטונות” – טעות נפוצה למדי עקב העובדה שהמילה “קיטון”, נידחת ככל שתהיה, עדיין נפוצה ומוכרת יותר מאשר “קיתון”, ותודה לישראל על שתיקן אותי.
אז תהיתי באמת אם רק אני חטאתי כאן או שהטעות נפוצה. פניתי, מעשה חברי Language Log, לגוגל כמנוע מחקר ראשוני בנושא.
את הביטוי “קיתונות של בוז” (כביטוי תחום במרכאות) אפשר למצוא 1,340 פעם. את “קיטונות של בוז” – 1,550. על פניו, נראה שהטעות נפוצה יותר מהאמת. אבל אם נחדד את בדיקה לחיפוש שמכיל את “קיטונות של בוז” אבל לא את “קיתונות של בוז” – רק את הטעות – ירדנו ל-86 תוצאות בלבד. “קיתונות” בלי “קיטונות”, לעומת זאת – 154 תוצאות.
מה המשמעות? המשמעות הראשונית, המתבקשת, היא שיש כמעט פי 10 עמודי באינטרנט שדנים בטעות הזו מאשר שבעצם משתמשים במטבע הלשון. זה נראה לי קצת קיצוני. אפשרות נוספת היא שכל פעם שמישהו טעה, הוא מיד קיבל תיקון – בטוקבקים או תגובות – מה שהופך את החיפוש לחסר משמעות כמתודה מחקרית.
ומה עוד יותר סביר? שגוגל מעוותים כל כך את השאילתא שלי, מוציאים ממנה שורשים (stemming) ומלים נפוצות (stop words) שאין שום דרך לדעת מה באמת נפוץ יותר.
* * *

“גרביים ארוכים” – 266 תוצאות
“גרביים ארוכות” – 1,240 תוצאות
אבל לא הכל שחור:
“מכנסיים ארוכים” – 14,400 תוצאות
“מכנסיים ארוכות” – 1,820 תוצאות
בכלל, נראה לי שבעניין הגרביים זה מאבק אבוד. חוץ מזה שמאיר שלו כנראה צודק ותוך דור-שניים יהיה פיצול לעברית ספרותית ועברית מדוברת.
ואני יכול לומר שהשימוש של הערבים בשפה המדוברת בשום פנים ואופן לא בא על במקום שליטתם בשפה המדוברת. הערבית המדוברת, כשמה כן היא, לא עולה כלל על הכתב (אם אתה או את כותבים ערבית מדוברת זה אומר שאתם יהודים מישראל, ככל הנראה חיילים בשירות חיל המודיעין). ערבית שמופיעה בספרים, בעיתונים, בנאומים, במסגדים, בטלוויזיה וברדיו (למעט תכניות שמביאות את הרחוב או אמורות לשקף אותו) היא ערבית ספרותית. בן אנוש ערבי מבין את הערבית הזו והוא יודע להשתמש בה.
עוד משהו: גם בערבית שמות עצם ומספרים מחולקים לזכר ולנקבה (למה, בעצם, שנייחס מין לכדור או לריבה?). ואני יכול לומר בוודאות שאחרון הבורים והערסים ששמעתי במהלך השנים לא החליף בערבית בין זכר ונקבה.
ודבר אחרון: אבנר, אצל ערבים גם לא הייתה נופלת טעות כמו זו שלך. ההבדל בהגייה בין ת’ ל-ט’ הוא עצום.
אז איך מאייתים בעברית את השם Buster Keaton ?
וגם יש הבדל במלים עצמן, פה ושם. כשפלסטיני ישאל אותך מה שלומך הוא ישאל “כיפכ?”. הסורי ישאל “שלונכ?”. העראקי ישתמש באותן מילים אבל יהגה אותן אחרת: “שלונצ’?” וצ’יפצ’?” (כמו ברומנית). מצרי ישאל “אזאיכ?”. אבל על כל מילה כזו יש לא מעט מלים שמשותפות לכולם.
אני חושב שמעניין בהקשר הזה לדבר על חשיפה לשפות זרות. הלהג המצרי הוא להג שמכיל באופן יחסי מינון גבוה של מלים בצרפתית או בתורכית. אני לא לגמרי יודע למה דווקא זה קורה אצלם. במקביל, יש בשפה הערבית (גם בזו הספרותית) מלים בפרסית. לא זיהיתי, במעט העיראקית ששמעתי בחיי, השפעות חזקות יותר של הפרסית על הערבית של השכנים מעראק.
זה לגבי הפער בין הלהגים, והרחבתי כי נראה לי שזה מעניין (לפחות אותי).עם זאת אני לא חושב שהחלוקה בין ערבית ספרותית למדוברת קשורה בהכרח בפריסה הגיאוגרפית הרחבה של השפה. לכולם יש ערבית מדוברת, כולם שולטים בזו הספרותית.
חיפוש “קיתונות של” ללא קיטון/קיטונות – 8,760 תוצאות
חיפוש “קיטונות של” ללא קיתון/קיתונות – 6,840 תוצאות
העם עם הגירסה הנכונה, אבל זה ממש גבולי.
“זורע חול” – 1,660 תוצאות
“זורה חול” – 42,400 תוצאות
הללויה! התוצאות מתקרבות הרבה יותר כשעוברים ל”זורעים חול” מול “זורים חול” – 1,670 מול 5,650 תוצאות, אבל עדיין יותר כותבים נכון.
למעשה, חוץ מהגרב המסכן, לא הצלחתי למצוא דוגמאות שבהן הצורה השגויה על פי האקדמיה היא השגורה יותר בגוגל. “בוא נראה” יותר נפוץ מ”בו נראה”, “התראה אחרונה” יותר נפוץ מ”התרעה אחרונה”. אתגר?
משקר אותי, הוא שיקר אותי הם משקרים אותי וכו’ – אם יש טעות שמחרפנת אותי,הרי זוהי
בקיצור החדשות דווקא טובות.
משקר אותי זוכה ל674 אזכורים לעומת 18,700 למשקר לי.
במקום שלישי, ראוי לציין יש את משקר עלי עם 245 אזכורים.
ואם נחזור לדיון של עברית ספרותית ועברית מדוברת, זה מרגיש כאילו בעברית מדוברת זוכה ‘משקר אותי’ פופולריות הרבה יותר גבוהה ממה שמיוצג בגוגל