נכתב בשיתוף עם ד"ר ירדן קדר
לפני מספר ימים כתבתי כאן על עקרון פארטו וציינתי מספר מקומות פחות מוכרים שבהם אפשר לראות אותו מתקיים. בין היתר כתבתי שעקרון פארטו עובד גם בתחום השפה, וש- 80% מהשפה שבה אנו משתמשים מורכבים מ- 20% של המילים השימושיות ביותר.
אנחנו עובדים עכשיו, ד"ר ירדן קדר ואני, על סדנת לימוד אנגלית שמיועדת במיוחד ליזמים צעירים, אז חשבנו שיהיה נכון לבדוק את זה בעצמנו. אחרי הכל, אחד הכלים החשובים בסדנה כזו היא אוצר מילים ייעודי שיהיה אפקטיבי במיוחד לאותם יזמים.
אז הנה שלושה דברים מעניינים שגילינו ונשלב בסדנה, אבל על הדרך שווה להכיר:
כן, יש מילים ממש שימושיות באנגלית
עשר המילים הכי נפוצות באנגלית (The, Of, And, A, To, In, Is, You, That, It) מהוות לבד כ- 25% מהשפה הטבעית.
אלף המילים הנפוצות ביותר באנגלית מהוות כ- 77% מהטקסטים הכתובים ומעל 87% מהשפה המדוברת!
אבל כמה מילים בכלל יש באנגלית? למען האמת אין תשובה מוחלטת לשאלה הזו, מכיון שאף אחד (כולל לא ארגונים מוכרים וותיקים שעוסקים בשפה האנגלית) לא מוכן להתחייב על זה. בכל זאת, יש באנגלית הרבה מאד מונחים שהגיעו משפות אחרות, מונחים טכניים שונים וכו'. אם אתם מתעקשים לקבל מושג – מעריכים שיש לפחות 240,000 מילים בשפה העשירה ביותר בעולם.
יש גם מילים שימושיות במיוחד ליזמים
עשינו ניסוי קטן, ולקחנו כמה עשרות מאמרים בנושאי יזמות טכנולוגית מהאתר TechCrunch. בדקנו את השכיחות של כל מילה במאמרים האלו, ובאופן לא מפתיע – גם כאן כיכבו אלף המילים השימושיות ביותר באנגלית. עכשיו כל מה שנשאר לנו זה לבדוק אילו מילים נוספות הן הנפוצות ביותר (כי אנחנו מניחים שאת האלף הראשונות יזמים צעירים כבר מכירים).
אחרי שהורדנו את המילים ה"כבדות", כבר קיבלנו התפלגות קצת יותר מאוזנת, אבל עדין אפשר לחלץ ממנה את המילים המשמעותיות יותר – אלו שחשוב להכיר מראש כדי לקרוא ברצף ולהבין בקלות יחסית. אם מסדרים אותם לפי התהליכים שמאפיינים כל עסק חדש, כמו שאנחנו עשינו, אפשר גם ללמוד אותן הרבה יותר בקלות.
תכירו את האח של עקרון פארטו - חוק זיפף
ואם כבר סיפרנו על התפלגויות של מילים – תכירו את חוק זיפף, שהתגלה על ידי הבלשן האמריקאי ג'ורג' קינגסלי זיפף. החוק קובע שאם ניצור טבלת שכיחות של מילים בטקסט טבעי וניתן לכל מילה דירוג לפי המיקום שלה בטבלה (המילה השכיחה ביותר תקבל דירוג 1, הבאה אחריה תדורג 2 וכך הלאה) – השכיחות של כל מילה תהיה ביחס הפוך לדירוג שלה.
במילים אחרות: המילה הנפוצה ביותר תופיע בטקסט כפליים מהמילה השניה (בעלת דירוג 2), פי שלושה מהמילה השלישית בתפוצתה וכך הלאה.
לפי מה שראינו קודם זה די הגיוני, גם אם לא עובד באופן מוחלט על טקסטים מיוחדים, כמו טקסטים מקצועיים מיוחדים. מה שיותר מעניין זה שחוק זיפף מתאר גם התפלגויות אחרות, כמו גודל האוכלוסיות בערים של מספר מדינות או התפלגות של צפיה בערוצי טלויזיה. מכירים עוד? ספרו לנו.
ואם אתם מתעניינים בסדנה – פשוט דברו איתנו. היא כוללת הרבה יותר מאשר רשימת מילים.
עד כאן להפעם.