הפודקאסט של מיכאל

פרק 8: סוכני AI אבולציוניים


Listen Later

מתי בפעם האחרונה שמעתם על בעיה במתמטיקה שאף אחד לא הצליח לשפר במשך חמישים ושש שנה? אני מדבר על תקופה שקדמה לנחיתה על הירח. עכשיו תדמיינו שבוקר אחד, אתם קמים ומגלים שבינה מלאכותית של גוגל, כזו שעוד לא שמעתם עליה, פשוט... עשתה את זה. זה בדיוק מה שקרה עם AlphaEvolve.

הוא לקח בעיה קלאסית במדעי המחשב, הכפלת מטריצות, ושיפר אלגוריתם משנת אלף תשע מאות שישים ותשע של מתמטיקאי בשם שטראסן. הוא הוריד את מספר פעולות הכפל הנדרשות למטריצת ארבע על ארבע מורכבת מארבעים ותשע לארבעים ושמונה. זה אולי נשמע כמו שיפור קטן, אבל בתחום הזה, שבו מוחות מבריקים שברו את הראש במשך יותר מחצי מאה, זה כמו לגלות יבשת חדשה. אז מה זה הקסם הזה? האם גוגל פשוט בנתה מתכנת-על? התשובה, כמו תמיד, הרבה יותר מעניינת. כי AlphaEvolve הוא לא מתכנת. הוא משהו אחר לגמרי.

בפרק הקודם דיברנו על Claude Code ואיך הוא הופך מתכנתים למפקחים. AlphaEvolve הופך מתכנתים לגננים. הוא לא חושב על פתרון, הוא מגדל אותו.

הכל מתחיל ונגמר בפונקציית התאמה (Fitness). זו לא התשובה, זה המדד להצלחה. זה כמו להגיד ל-AI, "אני לא יודע איך לנצח בשחמט, אבל אני כן יודע להגיד לך אם עשית שחמט. עכשיו לך תמצא את הדרך". אתה מגדיר את המטרה, למשל "תכתוב לי קוד שממיין מספרים כמה שיותר מהר ובלי להשתמש ביותר מדי זיכרון", והמערכת כבר תמצא את הדרך. שינוי תפיסתי. גוגל אומרים אל תממש, תן לי לפשפש.

אז איך זה עובד בפועל? המערכת מתחילה עם "אוכלוסייה" של פתרונות קוד ראשוניים, שיכולים להיות די גרועים, ואז מתחילה תהליך של ברירה טבעית. כל פתרון נבדק מול פונקציית ההתאמה. המוצלחים שורדים וזוכים "להתרבות". מה זה אומר להתרבות? להתפתח, ולא סתם באופן אקראי, אלא באמצעות הצעות יצירתיות לשינוי שמגיעות ממודל שפה גדול, במקרה הזה Gemini של גוגל. לא בכל עציץ צריך להשקיע, מודל Gemini Flash יכול להציע הרבה רעיונות מהר, ו-Gemini Pro יצלול לעומק לשפר את הטובים שבהם.

זה לא כזה חדש. גם מודלים קלאסיים ללמידת מכונה עוברים אימון חזרתי. פונקציית ההתאמה שלהם היא אחוז הטעות (כמה שונה התחזית שלהם מתוצאה היסטורית), אבל AlphaEvolve היא שילוב קטלני - תהליך מובנה של אלגוריתם אבולציוני עם יצירתיות של LLM מודרני. התהליך הזה הוא Cascading, מדורג. במקום להריץ בדיקה יקרה על כל רעיון גרוע שהמודל מנפיץ, יש שלב סינון ראשון, מהיר וזול. זה כמו בראיון עבודה: יש מבחן קצר בכניסה, אולי ב-Zoom, ורק מי שעובר אותו זוכה להיכנס לראיון עומק עם ראש צוות. זה חוסך המון זמן ומשאבים.

זה לא נייר אקדמי. גוגל משתמשת ב-AlphaEvolve כדי לשפר את לב התשתיות שלה. מערכת ניהול המשאבים של גוגל, Borg הצליחה לחסוך אפס נקודה שבע אחוז מכוח המחשוב העולמי של גוגל. נשמע לכם מעט? בסדר גודל של גוגל, זה כמו למצוא מדינה קטנה של שרתים שלא ידעתם שקיימת.

גם ב-Chip עצמו, AlphaEvolve הציע שינוי בדור הבא של שבבי ה-TPU, וכמובן בתוכנה - הכפלת מטריצות שהזכרתי בהתחלה.

מה יפה? ה-AI הציג את ההמלצות שלו לא סתם, לא בניפנופי ידיים, אלא בהסברים שמדברים את השפה של מהנדסי התשתיות, אנשי החומרה והמתכנתים.

מה עוד יפה? נוצר פה מעגל קסמים. Demis Hassabis, מנכ"ל DeepMind: "ידע מוליד עוד ידע, אלגוריתמים מייעלים אלגוריתמים אחרים. AlphaEvolve מייעל את המערכת האקולוגית של ה-AI שלנו, כך שגלגלי התנופה, הקידמה, מסתובבים מהר יותר".

ה-AI משפר את היעילות של הכלים שמשמשים לבניית הדור הבא של ה-AI, שיהיה חזק יותר, ויוכל לשפר את הכלים עוד יותר. זו כבר לא התקדמות לינארית, זה ריבית דריבית.

ואיפה שיש פריצת דרך של תאגיד ענק, יש גם קהילת קוד פתוח נמרצת. תוך ימים ספורים מפרסום המאמר, צצו ברשת מימושים פתוחים כמו OpenEvolve. זה מראה כמה הקהילה רעבה לכלים כאלה, או כמה שהיא לא סומכת על גוגל שתשחרר את הכלים האמיתיים. סיימון פרידר, חוקר AI מאוקספורד: "ל-DeepMind יש היסטוריה קצת מפוקפקת בכל מה שקשור לשחרור קוד מלא. המאמר מדהים, אבל לפעמים הקוד עם באגים". זה יוצר בעית אמון. אם AlphaEvolve פותר בעיה מתמטית מורכבת, והפתרון עצמו קשה לאימות על ידי בן אנוש, איך אנחנו יכולים להיות בטוחים שהוא צודק?

ועד ביקורת - הרבה אלגוריתמים מהירים יותר להכפלת מטריצות אינם יציבים מבחינה נומרית. כלומר, הם צוברים שגיאות עיגול קטנות שהופכות את התוצאה הסופית לחסרת משמעות בעולם האמיתי. האם AlphaEvolve לקח את זה בחשבון? האם היציבות הנומרית הייתה חלק מפונקציית ההתאמה שלו? המאמר לא מפרט, וזה דגל אדום מבחינת השימושיות של הפתרון.

פושמיט קוהלי, ראש תחום AI למדע ב-DeepMind: "סוכן הקידוד העל-אנושי הזה מסוגל לקחת על עצמו משימות מסוימות ולהגיע הרבה מעבר למה שידוע מבחינת פתרונות עבורן". כנראה שבעתיד הלא רחוק, הכישרון הכי חשוב שלנו לא יהיה לכתוב קוד, אלא להגדיר בעיות בצורה כל כך מדויקת, עם פונקציית התאמה כל כך טובה, שמערכת אבולוציונית כמו AlphaEvolve תוכל לפתור אותן עבורנו. אנחנו עוברים מלהיות בנאים לאדריכלים של פתרונות. פעם, להיות מתכנת היה לדעת לדבר עם המחשב. מחר, זה יהיה לדעת לשאול את השאלות הנכונות.

עד הפעם הבאה, תהיו טובים, ותמשיכו להיות סקרנים. יאללה ביי.

...more
View all episodesView all episodes
Download on the App Store

הפודקאסט של מיכאלBy מיכאל לוגסי

  • 5
  • 5
  • 5
  • 5
  • 5

5

2 ratings


More shows like הפודקאסט של מיכאל

View all
גיקונומי by ראם שרמן ודורון ניר

גיקונומי

93 Listeners

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi by רשת עושים היסטוריה

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi

158 Listeners

חיות כיס Hayot Kiss by כאן | Kan

חיות כיס Hayot Kiss

146 Listeners

השבוע - פודקאסט הארץ by הארץ

השבוע - פודקאסט הארץ

183 Listeners

מנועי הכסף by כלכליסט

מנועי הכסף

37 Listeners

התשובה עם דורון פישלר Hatshuva With Doron Fishler by רשת עושים היסטוריה

התשובה עם דורון פישלר Hatshuva With Doron Fishler

190 Listeners

בזמן שעבדתם by mako מאקו

בזמן שעבדתם

104 Listeners

לשחרר את הדב by בית הפודיום

לשחרר את הדב

40 Listeners

אחד ביום by N12

אחד ביום

317 Listeners

הכותרת by שרון כידון | Be.po

הכותרת

117 Listeners

חוץ לארץ by הארץ

חוץ לארץ

82 Listeners

הפודקאסט של נדב פרי by All•in & Nadav Perry

הפודקאסט של נדב פרי

53 Listeners

וויקלי סינק by בית הפודיום

וויקלי סינק

20 Listeners

מיכה סטוקס מגיש: שוק ההון. בורסה. וול סטריט. השקעות. מסחר by מיכה סטוקס MICHA.STOCKS

מיכה סטוקס מגיש: שוק ההון. בורסה. וול סטריט. השקעות. מסחר

5 Listeners

הקרנף - עם יואב רבינוביץ׳ by בית הפודיום

הקרנף - עם יואב רבינוביץ׳

24 Listeners