June 20, 2025

פרק 8: סוכני AI אבולציוניים

6 minutes

מתי בפעם האחרונה שמעתם על בעיה במתמטיקה שאף אחד לא הצליח לשפר במשך חמישים ושש שנה? אני מדבר על תקופה שקדמה לנחיתה על הירח. עכשיו תדמיינו שבוקר אחד, אתם קמים ומגלים שבינה מלאכותית של גוגל, כזו שעוד לא שמעתם עליה, פשוט... עשתה את זה. זה בדיוק מה שקרה עם AlphaEvolve.

הוא לקח בעיה קלאסית במדעי המחשב, הכפלת מטריצות, ושיפר אלגוריתם משנת אלף תשע מאות שישים ותשע של מתמטיקאי בשם שטראסן. הוא הוריד את מספר פעולות הכפל הנדרשות למטריצת ארבע על ארבע מורכבת מארבעים ותשע לארבעים ושמונה. זה אולי נשמע כמו שיפור קטן, אבל בתחום הזה, שבו מוחות מבריקים שברו את הראש במשך יותר מחצי מאה, זה כמו לגלות יבשת חדשה. אז מה זה הקסם הזה? האם גוגל פשוט בנתה מתכנת-על? התשובה, כמו תמיד, הרבה יותר מעניינת. כי AlphaEvolve הוא לא מתכנת. הוא משהו אחר לגמרי.

בפרק הקודם דיברנו על Claude Code ואיך הוא הופך מתכנתים למפקחים. AlphaEvolve הופך מתכנתים לגננים. הוא לא חושב על פתרון, הוא מגדל אותו.

הכל מתחיל ונגמר בפונקציית התאמה (Fitness). זו לא התשובה, זה המדד להצלחה. זה כמו להגיד ל-AI, "אני לא יודע איך לנצח בשחמט, אבל אני כן יודע להגיד לך אם עשית שחמט. עכשיו לך תמצא את הדרך". אתה מגדיר את המטרה, למשל "תכתוב לי קוד שממיין מספרים כמה שיותר מהר ובלי להשתמש ביותר מדי זיכרון", והמערכת כבר תמצא את הדרך. שינוי תפיסתי. גוגל אומרים אל תממש, תן לי לפשפש.

אז איך זה עובד בפועל? המערכת מתחילה עם "אוכלוסייה" של פתרונות קוד ראשוניים, שיכולים להיות די גרועים, ואז מתחילה תהליך של ברירה טבעית. כל פתרון נבדק מול פונקציית ההתאמה. המוצלחים שורדים וזוכים "להתרבות". מה זה אומר להתרבות? להתפתח, ולא סתם באופן אקראי, אלא באמצעות הצעות יצירתיות לשינוי שמגיעות ממודל שפה גדול, במקרה הזה Gemini של גוגל. לא בכל עציץ צריך להשקיע, מודל Gemini Flash יכול להציע הרבה רעיונות מהר, ו-Gemini Pro יצלול לעומק לשפר את הטובים שבהם.

זה לא כזה חדש. גם מודלים קלאסיים ללמידת מכונה עוברים אימון חזרתי. פונקציית ההתאמה שלהם היא אחוז הטעות (כמה שונה התחזית שלהם מתוצאה היסטורית), אבל AlphaEvolve היא שילוב קטלני - תהליך מובנה של אלגוריתם אבולציוני עם יצירתיות של LLM מודרני. התהליך הזה הוא Cascading, מדורג. במקום להריץ בדיקה יקרה על כל רעיון גרוע שהמודל מנפיץ, יש שלב סינון ראשון, מהיר וזול. זה כמו בראיון עבודה: יש מבחן קצר בכניסה, אולי ב-Zoom, ורק מי שעובר אותו זוכה להיכנס לראיון עומק עם ראש צוות. זה חוסך המון זמן ומשאבים.

זה לא נייר אקדמי. גוגל משתמשת ב-AlphaEvolve כדי לשפר את לב התשתיות שלה. מערכת ניהול המשאבים של גוגל, Borg הצליחה לחסוך אפס נקודה שבע אחוז מכוח המחשוב העולמי של גוגל. נשמע לכם מעט? בסדר גודל של גוגל, זה כמו למצוא מדינה קטנה של שרתים שלא ידעתם שקיימת.

גם ב-Chip עצמו, AlphaEvolve הציע שינוי בדור הבא של שבבי ה-TPU, וכמובן בתוכנה - הכפלת מטריצות שהזכרתי בהתחלה.

מה יפה? ה-AI הציג את ההמלצות שלו לא סתם, לא בניפנופי ידיים, אלא בהסברים שמדברים את השפה של מהנדסי התשתיות, אנשי החומרה והמתכנתים.

מה עוד יפה? נוצר פה מעגל קסמים. Demis Hassabis, מנכ"ל DeepMind: "ידע מוליד עוד ידע, אלגוריתמים מייעלים אלגוריתמים אחרים. AlphaEvolve מייעל את המערכת האקולוגית של ה-AI שלנו, כך שגלגלי התנופה, הקידמה, מסתובבים מהר יותר".

ה-AI משפר את היעילות של הכלים שמשמשים לבניית הדור הבא של ה-AI, שיהיה חזק יותר, ויוכל לשפר את הכלים עוד יותר. זו כבר לא התקדמות לינארית, זה ריבית דריבית.

ואיפה שיש פריצת דרך של תאגיד ענק, יש גם קהילת קוד פתוח נמרצת. תוך ימים ספורים מפרסום המאמר, צצו ברשת מימושים פתוחים כמו OpenEvolve. זה מראה כמה הקהילה רעבה לכלים כאלה, או כמה שהיא לא סומכת על גוגל שתשחרר את הכלים האמיתיים. סיימון פרידר, חוקר AI מאוקספורד: "ל-DeepMind יש היסטוריה קצת מפוקפקת בכל מה שקשור לשחרור קוד מלא. המאמר מדהים, אבל לפעמים הקוד עם באגים". זה יוצר בעית אמון. אם AlphaEvolve פותר בעיה מתמטית מורכבת, והפתרון עצמו קשה לאימות על ידי בן אנוש, איך אנחנו יכולים להיות בטוחים שהוא צודק?

ועד ביקורת - הרבה אלגוריתמים מהירים יותר להכפלת מטריצות אינם יציבים מבחינה נומרית. כלומר, הם צוברים שגיאות עיגול קטנות שהופכות את התוצאה הסופית לחסרת משמעות בעולם האמיתי. האם AlphaEvolve לקח את זה בחשבון? האם היציבות הנומרית הייתה חלק מפונקציית ההתאמה שלו? המאמר לא מפרט, וזה דגל אדום מבחינת השימושיות של הפתרון.

פושמיט קוהלי, ראש תחום AI למדע ב-DeepMind: "סוכן הקידוד העל-אנושי הזה מסוגל לקחת על עצמו משימות מסוימות ולהגיע הרבה מעבר למה שידוע מבחינת פתרונות עבורן". כנראה שבעתיד הלא רחוק, הכישרון הכי חשוב שלנו לא יהיה לכתוב קוד, אלא להגדיר בעיות בצורה כל כך מדויקת, עם פונקציית התאמה כל כך טובה, שמערכת אבולוציונית כמו AlphaEvolve תוכל לפתור אותן עבורנו. אנחנו עוברים מלהיות בנאים לאדריכלים של פתרונות. פעם, להיות מתכנת היה לדעת לדבר עם המחשב. מחר, זה יהיה לדעת לשאול את השאלות הנכונות.

עד הפעם הבאה, תהיו טובים, ותמשיכו להיות סקרנים. יאללה ביי.

...more