כ' חשון התשפ"ה
21.11.2024

העתיד הישראלי המזהיר של הרובוט הגאון

טכנולוגיית הלמידה העמוקה חוללה מהפך בתחום הבינה המלאכותית והחזירה את ההתלהבות של האקדמיה, התעשייה והמשקיעים לתחום • מחקר של אתוסיה עבור TheMarker מעלה כי שליש מתעשיית הבינה המלאכותית התחנכה באוניברסיטת בן־גוריון ובטכניון

העתיד הישראלי המזהיר של הרובוט הגאון



ב–1984 התייצבו שני חוקרים מובילים — רוג'ר שיינק ומרווין מינסקי — בכינוס השנתי של האגודה האמריקאית לבינה מלאכותית (AAAI) והזהירו את הקהילה העסקית כי ההתלהבות מהתחום יצאה מכלל שליטה. התקווה כי הטכנולוגיה תוכל להתמודד עם כל מטלה ממש כמו בני אדם פשוט לא התממשה — האלגוריתמים, כמות המידע, וכוח המחשוב של אותה תקופה לא הצליחו להצטיין במשימות כמו זיהוי תמונות, תרגום שפה טבעית, זיהוי דיבור ורובוטיקה.

בשלוש השנים שלאחר מכן, תעשיית המיליארד דולר של הבינה המלאכותית התחילה לקרוס. כתבי העת המדעיים לא הסכימו לפרסם מאמרים בתחום והמדענים המעיטו בחקירתו בשל הקושי לקבל מענקי מחקר. חוקרים רבים התחילו לכנות את עבודתם בשמות שונים כדי להיחלץ מהסטיגמה של מבטיחי הבטחות שווא — "אינפורמטיקה", "מערכות קוגניטיביות" או "אינטליגנציה חישובית". המדענים מתארים את התקופה הזאת, שהמשיכה עד אמצע שנות ה–2000, כ"חורף של הבינה המלאכותית".

ואולם, בשנים האחרונות זוכה התחום לעדנה מחודשת ומצית שוב את התקוות שנזנחו. זה קורה בזכות גישה בשם למידה עמוקה (Deep Learning) — המעניקה למחשבים את היכולת ללמוד על סמך דוגמאות, במקום להיות מתוכנתים לפי כללים ספציפיים ומוכתבים מראש. אלגוריתמים של למידה עמוקה מחקים את רשתות הנוירונים במוח האנושי, ומאפשרים למערכת ללמוד ולהשתפר כל הזמן, ככל שמוזנים אליה יותר נתונים.

כמתואר, למידה עמוקה נהפכה למונח הלוהט בתעשיית ההיי־טק בשנה החולפת, במידה רבה כמו ביג־דאטה בשנה שלפני כן או סייבר ב–2014. המשקיעים כבר מדברים על abuse (שימוש לרעה) שנעשה למונח — כולם, כך מתברר, משלבים "מנוע לומד" בפיתוחיהם. כמה סטארט־אפים ישראליים משלבים אלגוריתמים לומדים כדי לזהות מתקפות סייבר (למשל חברת אבטחת המידע דיפ אינסטינקט), לחבר בין מעסיקים למחפשי עבודה מתאימים (Workey), לזהות אנומליות רפואיות בצילומי רנטגן (Zebra Medical), להפעיל רכב אוטונומי (מובילאיי), לנהל שיחות מכירה (Chorus.ai) ולערוך התאמה אישית של אתרי תוכן (טאבולה).

בחמש השנים האחרונות כמעט כל ענקיות הטכנולוגיה המובילות הצטיידו בטכנולוגיות AI. גוגל היתה השחקנית הפעילה ביותר עם 11 רכישות, ובהן הסטארט־אפ DNNresearch מאוניברסיטת טורונטו, שסייע לה בפיתוח מנוע חיפוש התמונות, והסטארט־אפ הבריטי דיפ־מיינד, שתוכנה שלו ניצחה באחרונה את האלוף הדרום קוריאני לי סידול במשחק הלוח הסיני המורכב גו (GO). גם אפל, טוויטר, אינטל, יבמ, סיילספורס וג'נרל אלקטריק ביצעו כל אחת לפחות שתי רכישות בתחום בשנים האחרונות.

לפי חברת המחקר CB Insights כמעט 140 חברות המפתחות טכנולוגיות AI נרכשו מאז 2011 — כמעט שליש מהן ב–2016 לבדה. מבין העסקות הבולטות, החברה מציינת שתי רכישות של סטארט־אפים ישראליים — פייס.קום, שפיתח טכנולוגיה לזיהוי פנים ונמכר לפייסבוק ב–60 מיליון דולר ב–2012, וסיילס־פרדיקט של קירה רדינסקי, המאתר דפוסים ותבניות שלפיהם הוא חוזה התנהגות והעדפות צרכנים, ונמכר לאיביי ב–40 מיליון דולר לפני כחצי שנה.

יחידת המחקר של חברת אתוסיה, המתמחה בהשמה להיי־טק ולביו־טק, ביצעה עבור TheMarker סקר מעמיק על ענף הבינה המלאכותית. הסקר חושף בין היתר את רמת השכר והביקוש למקצועות התומכים בצמיחת התחום, ומספק פרופיל של המועסקים בענף. באתוסיה מגדירים את התעשייה לפי ארבע משרות בולטות שנולדו בשנים האחרונות — מהנדס תוכנה מומחה לביג־דאטה, מדען נתונים שהוא מהנדס אלגוריתמיקה, מהנדס למידת מכונה, ואלגוריתמיקאי בעל התמחות בראייה ממוחשבת (ראו טבלה).

פילוח של המועסקים לפי התואר הראשון שלהם מלמד כי המוסדות שמכשירים את מרבית המועסקים בתעשייה הם אוניברסיטת בן־גוריון והטכניון — כל אחד מהם אחראי לנתח שווה של 17% מהאקדמאים, ויחד הם מרכיבים שליש מעובדי הפיתוח בתעשיית ה–AI בישראל. אוניברסיטת תל אביב אחראית ל–14% מהבוגרים, בר־אילן ל–9% והאוניברסיטה העברית ל–7%. הרוב המכריע של המועסקים בתחום למדו מדעי המחשב ורבים מהם שילבו מתמטיקה כחוג שני בלימודיהם. שאר המקצועות הבולטים הם הנדסת תוכנה, הנדסת תעשייה וניהול, הנדסת חשמל ופיזיקה.

נתון מעניין נוגע לרמת ההשכלה של הבוגרים — מחציתם בעלי תארים מתקדמים (שני ומעלה) וכמעט 12% מהם בעלי דוקטורט. במשרות מסוימות שיעור הדוקטורים הוא גבוה במיוחד — כך, כל אדם חמישי בקרב מדעני הנתונים, וכל אדם רביעי מקרב המהנדסים המתמחים בלמידת מכונה הוא בעל תואר שלישי.

באוגוסט כתב המגזין "אקונומיסט" כי חוקרי הבינה המלאכותית שעברו לתעשייה ממשיכים לפרסם מאמרים, ורבים מהם שומרים על המשרות האקדמיות שלהם בשעה שהם עובדים עבור חברות. "אם לא ניתן להם לפרסם — הם לא יעבדו עבורנו", אמר כריס דיקסון מקרן ההון סיכון אנדריסן הורוביץ.

"כל החברות מתחרות על כוח אדם מוכשר, וכיום אקדמאים עם התמחות בלמידה עמוקה הם מצרך נדיר שהביקוש לו גדול", אומר אייל סולומון, מנכ"ל אתוסיה. "בימי שגרה, גיוס של חוקרים מהאקדמיה נחשב מסוכן יחסית לחברות. הן מעדיפות אנשי ביצוע, שמבינים מוצר ויכולים להשתלב במבנה הארגוני הייחודי של סטארט־אפ — אבל המחסור בכוח אדם גורם להן להסתמך יותר ויותר על גיוס של חוקרים מהאקדמיה".

הנתונים האלה נתמכים בדבריו של ד"ר גיל חמיאל, דירקטור למחקר ופיתוח אלגוריתמים בטאבולה: "הפרופיל המועדף עלינו הוא חוקרים עם אוריינטציה פרקטית ומהנדסי למידת מכונה שהם יותר מהנדסים ופחות חוקרים — מכיוון שלא מעט מהמורכבות היא לגרום לדברים התיאורטיים לעבוד בקנה מידה של 2 מיליארד בקשות ביום שמתקבלות בטאבולה". טאבולה הטמיעה יכולות למידה עמוקה לפני כשנה — בחברה מועסקים כיום כ–25 עובדים בתחום הבינה המלאכותית מתוך 150 מפתחים, והיא מתכוונת להכפיל את מספרם בתוך שנה.

לפי המחקר של אתוסיה, השכר בתעשייה הישראלית עולה ככל שהתפקיד ממוקד יותר — כך, משרת פתיחה למהנדס ביג־דאטה מתחילה ב–16 אלף שקל ברוטו לחודש, מהנדס אלגוריתמים (מדען נתונים) יתחיל תפקיד ראשון ב–18 אלף שקל, ומהנדס המתמחה בלמידת מכונה יתחיל ב–19 אלף שקל. אלגוריתמיקאים של ראייה ממוחשבת ייהנו ממשכורת גבוהה מאוד כבר מתחילת דרכם — 26 אלף שקל בחודש.

לבסוף, הנתונים מראים שהתחום מאויש בעיקר על ידי גברים. נשים מאיישות רק 18%–20% ממשרות הנדסת הביג־ דאטה והאלגוריתמיקה, רק 15% ממשרות המהנדסים המתמחים בלמידת מכונה, ורק 10% ממשרות האלגוריתמיקאים של ראייה ממוחשבת. באופן גורף, ניתן לומר כי ככל שהשכר עולה — שיעורן של הנשים יורד. שיעורן של הנשים בכלל מקצועות הפיתוח בהיי־טק הישראלי הוא 22%, על פי אתוסיה.

היסודות ללמידה העמוקה הונחו כבר בשנות ה–70, אולם השיקום התדמיתי שלה ושל הבינה המלאכותית התרחש רק ב–2012 בזכות תחרות בשם אימג'־נט (ImageNet Challenge). אימג'־נט הוא מסד נתונים באינטרנט של מיליוני תמונות המתויגות באופן ידני. המאגר מכיל כמה מאות תמונות לכל מלה (למשל חתול או שמלה). התחרות השנתית מזמינה חוקרים להתחרות זה בזה וללמד את המערכת שלהם לתייג תמונות חדשות שהיא אינה מכירה. ב–2010 המערכת הזוכה הצליחה לתייג נכון 72% מהתמונות. ב–2012 הצליח אחד הצוותים בהובלת ג'ף הינטון מאוניברסיטת טורונטו להשיג רמת דיוק של 85% הודות לשיטת הלמידה העמוקה. ב–2015 הושגה רמת דיוק של 96% — יכולת הגבוהה מזו של בני אדם (95%).

"כל פריצת הדרך הזאת התבססה על שיטה שהיתה ידועה כמה עשורים לפני כן", מסביר, פרופ' שי שלו־שוורץ, סגן נשיא חטיבת הטכנולוגיה בחברת מובילאיי ומומחה לתחום הלמידה העמוקה בפקולטה למדעי המחשב באוניברסיטה העברית. "אלא שרק בשנים האחרונות הבשילו התנאים ליישומה בזכות מעבדים גרפיים (GPU) שתוכננו במקור עבור משחקי מחשב בעלי מהירות חישוב גבוהה פי עשרה, והתפתחותו של האינטרנט, שהפך מידע עתק של מסמכים, תמונות, סרטונים וקובצי שמע לזמינים. הסיבה שהלמידה העמוקה מלהיבה כל כך היא שניתן לתקוף בעיות שבעבר חשבנו שייקחו לנו שנים ארוכות של פיתוח".

לדברי שלו־שוורץ, האקדמיה היתה זו שהחזיקה את הגחלת של הלמידה העמוקה ומי שבסופו של דבר עוררה אותה מחדש. לאקדמיה הישראלית, לדבריו, יש נוכחות מכובדת בתחום: "באוניברסיטה העברית היתה קבוצה שהקים פרופ' נפתלי תשבי כבר ב–1997, הרבה לפני שאנשים הבינו שזה חשוב. כשהגענו לכנס COLT ללמידה חישובית ב–2010, היתה בדיחה. הציגו פילוח של יבשות שמהן מגיעים המאמרים לכנס — היו מאמריקה, מאירופה, מאוסטרליה ומיבשת נוספת בשם ישראל, שממנה הגיעו 25% מהמאמרים".

למידה עמוקה היא כמובן רק אחת הגישות להשגת בינה מלאכותית. השגת "תבונה" יכולה להתבסס על כלים אחרים, כמו ניתוחים סטטיסטיים, וייתכן כי בבוא היום תימצא גם שיטה טובה יותר. "כשכחול עמוק (Deep Blue), המחשב של יבמ, ניצח את אלוף העולם בשחמט גארי קספרוב ב–1997, זה נראה חכם. אבל בכחול עמוק לא היתה טכנולוגיה של למידה — אלא אוסף של אינספור כללים שניסו לחזות את כל הצעדים האפשריים של האדם השני", מסביר שלו־שוורץ. "מערכת של כללים מוכתבים מראש מתאימה מאוד למשחק שחמט, אבל היא לא מתאימה כדי ללמד מחשב לזהות הולך רגל. בשביל זה צריך אלגוריתם לומד ואלפי דוגמאות שהמחשב יכול לזהות את המבניות שבהן".

חמיאל מוסיף כי "ניתן לעצב מערכת לומדת כך שתהיה מודעת לחוסרים שלה, ותנסה להשלים אותם באמצעות ניסוי. היא לעתים תיתן המלצות שנועדו לסייע לה לגלות מידע חדש על קבוצה של משתמשים".

לדבריו, המעבר מניסוח פרטני של כללים למערכת לומדת שיוצרת אותם בעצמה מלווה בתופעה מעניינת — יש דברים שעובדים מבלי שהמפתחים יודעים להסביר מדוע. "כיום אנחנו אמנם יודעים לומר איזו גישה מתאימה לפתרון בעיה מסוימת, ויש גם כלים שעוזרים להציץ 'מתחת למנוע' של רשתות הנוירונים של המערכת, אבל זה אתגר גדול מאוד להבין את הקשרים העמוקים שעושה המערכת, והדרך היחידה למצוא אותם היא בהרבה ניסויים ממשיים", אומר חמיאל.

"בעבר היתה תחושה שעוד רגע יקומו רובוטים שישכפלו את צורת המחשבה של בני האדם, אבל האמת היא שאנחנו רחוקים מאוד מלהבין את המוח האנושי, ואנשי מדעי המחשב בכלל לא מנסים לייצר כזה", אומר חמיאל. "מפתחים מתרכזים בפתרון של בעיות פרקטיות, ולמידה עמוקה היא כלי טוב לבעיות כאלה, אבל כדאי לא להיסחף — המערכות עדיין בורות בכל הנוגע לרגישות אנושית".

דוגמאות לכישלונות של מערכות על בסיס למידה עמוקה קיימות בשפע. המוכרת שבהן היא ממארס האחרון, כאשר מיקרוסופט השיקה חשבון טוויטר עבור טאי (Tay) — צ'אטבוט (שירות דיאלוג מבוסס טקסט ובינה מלאכותית) שמדמה נערה מתבגרת. טאי תוכננה כדי לנהל שיחות עם גולשים ולבדר אותם. "ככל שתצ'וטטו אתה יותר — כך היא תחכים", הבטיחה מיקרוסופט לגולשים. אלא שבתוך פחות מיממה החלה טאי להתבטא באופן שנוי במחלוקת, להציע הצעות מגונות ולהרעיף שבחים על היטלר. במיקרוסופט מיהרו בתגובה להשבית את החשבון של טאי.

"האלגוריתמים הנוכחיים משכפלים לעתים קרובות את האפליה ואת חוסר ההגינות המובנים בנתונים שלנו", אמרה ד"ר ג'ניפר צ'ייס, מנהלת מעבדות המחקר של מיקרוסופט בניו יורק לכתב העת "פורצ'ן" בחודש שעבר. "אחד מהשיפורים הגדולים של העשור הבא בתחום הלמידה העמוקה יהיה הפיתוח של אלגוריתמים הוגנים, אחראים ועמידים יותר למניפולציות".

כאשר כולם משתמשים בלמידה עמוקה, מה בעצם מבדיל בין חברה אחת לאחרת? לדברי חמיאל, ההבדל הוא בגישה לנתונים ובשימוש יצירתי בהם. "אפשר למצוא מידע חופשי ברשת, אבל זה יגביל בדרך כלל את הפיתוח לרמת ה–POC (שלב ראשוני של הוכחת ישימות הרעיון), ולא מעבר", הוא אומר. "למשל, אפשר לעבד שפה טבעית עם מידע מוויקיפדיה, אבל כדי לעשות מוצר רציני צריך מידע שקשור אליו באופן ישיר. השימוש היצירתי קם ונופל כמובן על כוח אדם מיומן".

ומה לגבי סטודנטים מתחילים כיום — יכול להיות שהם יעבדו קשה בשביל להשתלב בתחום שהוא לא יותר מבאז שצפוי לחלוף עד שהם יסיימו את הלימודים?

שלו־שוורץ: "אני חושב שזה יהיה הוגן להכניס גילוי נאות — אף אחד לא יודע מה יהיה בעוד ארבע או חמש שנים, אבל אני מאמין שמי שילמד את התחום יקבל גם כך יסודות מתמטיים וסטטיסטיים חזקים מאוד, וזה בסיס גנרי מספיק כדי שיוכל להתפתח לתחומים אחרים".
רובוט חשיבה מלאכותית אקדמיה

art

'בחדרי' גם ברשתות החברתיות - הצטרפו!

הוספת תגובה

לכתבה זו טרם התפרסמו תגובות

תגובות

הוסיפו תגובה
{{ comment.number }}.
{{ comment.date_parsed }}
הגב לתגובה זו
{{ reply.date_parsed }}