March 05, 2026

יצירתיות מלאכותית [2-20]

50 minutes

שלום כולם, ברוכים הבאים לאלישע והזוויות, עונה שניה פרק 20 - פרק אחד לפני אחרון. היום ה-2 למרץ 2026, יג’ אדר תשפ”ו - תענית אסתר, לאלו שצמים, וכמובן באמצע המלחמה עם איראן. זה היום שבו אני מקליט את הפרק, וכולנו עושים את מה שאנחנו יכולים כדי לשמור על שפיות, ואצלי זה אומר להקליט לכם פרק לפודקאסט. מקווה שכולם בקו הבריאות, שאתם ומשפחתכם במקום מוגן, ולאלו שנמצאים בחזית או שיש להם בן משפחה שם - תודה רבה גדולה ממני על ההקרבה והתרומה למדינה. מכל הלב. תצאו בשלום, וחיזרו בשלום.

היום אנחנו נדבר על יצירתיות של בינה מלאכותית. האם בינה מלאכותית מהסוג שיש לנו היום היא יצירתית, אילו סוגי יצירתיות נמצאים בהישג ידה ואילו - כנראה שלא? כחלק מהשיחה אנחנו נסקור על הדרך כל מני מחקרים ודיווחים על AI שפיצח אתגר מתמטי או מדעי, והכי חשוב, בחלק האחרון של הפרק אני אתן כאן את המבחן שישכנע אותי - כן, אותי - שפיצחנו משהו מהותי ומיוחד בחקר התבונה והגענו למחשבים יצירתיים עצמאית, ואפילו כאלו שאפשר לומר עליהם שהם תבוניים באמת. אנחנו כרגיל נטעם על קצה המזלג מהנושאים השונים הללו, ובתקווה שמתוך זה נפתח את החשיבה לזוויות חדשות של הסתכלות על המציאות.

שניה לפני שנתחיל - יש ערוץ טלגרם לפודקאסט ויש גם מייל ([email protected]). חשבתם פעם להצטרף עליהם? לעשות לייק לאתר או לערוץ בספוטיפיי? קחו איזה דקה או שתיים, תשקיעו בללחוץ על איזו קישורית או כפתור, ותתנו לאלגוריתם לעשות את שלו, מה אתם אומרים?

בפרק הקודם התמקדתי בזווית שתפסה את הבינה המלאכותית כמנגישה וממנפת ידע קיים, כשמי שמייצר את הידע החדש הם בני האדם. אם היינו חושבים שאפשר לסגור את הבינה המלאכותית לבד באיזה חדר ולתת לה לחשוב לבד, להריץ ניסויים לבד עם רובוטים שהיא שולטת עליהם וכן הלאה, והיינו מתחילים לקבל תרופות חדשות למחלות קשות, חוקים פיזיקליים חדשים שלא הכרנו וכן הלאה - או אז היה לנו פה מנוע יצירתיות עצמאי ובלתי תלוי בידיעות האנושות, כזה שיכול לייצר ידע בלי שבני האדם מעורבים. משם קצרה הדרך לבטן-גב בחוף הים כשהמערכת שבנינו מפיקה עבורנו עוד ועוד ועוד ללא שנניד עפעף. לעומת זאת, אם ה-AI שמנותק מן ההדרכה של בני האדם לא ישיג תוצאות בעצמו, כי הוא בעיקר מנגיש וממנף דברים קיימים, הרי שזה אומר שלבני אדם יש איזה תבלין סודי שנדרש כדי לייצר דברים חדשים שכאלו, ושאין לנו פריווילגיה להפסיק לפתח את עצמנו.

כיוון שכך, נראה לי ששווה לתת לדברים קצת יותר צבע, ועם קצת פחות נפנוף ידיים להסביר איך לחשוב על העניין הזה של יצירתיות המכונות ויצירתיות אנושית. חלק מהדברים שאני אומר היום נרמזו קצת בפרקים הראשונים של העונה, נניח פרקים 3, 4 ו-8, אבל זוויות מרובות זו הדרך להעמקה, והכוונה שלי היום היא לעלות כאן רמה בדיון, כמו גם להביא דוגמאות ממחקרים עדכניים שיצאו לאחרונה בנושא.

יצירתיות - מהי?

בתור התחלה שווה שנשאל - למה אנחנו מתכוונים כשאנחנו מדברים על “יצירתיות”? יצירתיות זו עוד מילה, כמו אינטלגנציה, שקל לנו לדבר עליה באופן אינטואיטיבי, אנחנו מכירים את החוויה של להיות יצירתי או להתרשם מיצירתיות של אחרים. בנוסף, ובניגוד לאינטלגנציה, נראה לי שדווקא יש לנו כמה יסודות שנוכל לבנות על גביהן את ההגדרה של יצירתיות בצורה שיהיה קל לפקס את הדיון סביבה. כפי שנראה, החלק הקשה לא יהיה כל כך להגדיר יצירתיות כמו להבין איך יצירתיות ברמה גבוהה יכולה בכלל להתקיים, יכולה להתממש במציאות.

בויקיפדיה בעברית נכתב כך: “יצירתיות היא תהליך ההפקה של רעיונות מקוריים ורלוונטיים למצב נתון”. לעומת זאת ב”ויקימילון“ בחרו בהגדרה “יכולת מחשבתית המביאה את האדם ליצירת תוצר חדשני ומקורי בעל ערך”. בין שני הניסוחים הללו יש הבדל חשוב - האם יצירתיות היא “תהליך” או “יכולת”, האם זו תכונה של בני אדם או תהליך טכני שאולי מנותק מיישות כלשהי. אנחנו ניגע בהמשך בחידוד הזה, אז כרגע נשים אותו בצד. בואו נתחיל דווקא ממה שמשותף. בכל אחת מן ההגדרות יש שני מרכיבים שהופכים רעיון או תוצר ליצירתי: הוא “מקורי“ או “חדשני“ כלומר משהו שלא היה קודם לכן, והוא “רלוונטי למצב נתון” או “בעל ערך“, כלומר שבעיני החברה יש בו תועלת. וכשאני אומר “תועלת” זה לא חייב להיות בקטע טכנולוגי כמובן - יש גם אומנות בעלת ערך, כזו שקולעות לטעם והעניין הציבורי של התקופה, אז תנו להגדרה הזו קצת מרחב נשימה.

יצירתיות היא כמובן דבר מאד חשוב - דברים חדשים ובעלי ערך יכולים לשנות חיים של אנשים וחברות, לתת למישהו יתרון בעולם העסקים או במלחמות, וכן הלאה. לכן מאז ומתמיד היה צורך לנהל את תוצרי היצירתיות. הדרך הפשוטה ביותר לנהל אותם היא - להסתיר אותם, לשמור את הידע החדש שצברת לעצמך בסוד, וכך לשמר יתרון על המתחרים. בעידן המודרני נמצאו פתרונות יעילים יותר לעניין, ברמת החברה כולה. לדוגמה, אשתי עורכת פטנטים - אם מישהו מעוניין בשירותיה מוזמן לפנות אליי, מבטיח שלא תתחרטו - וזה בדיוק התפקיד העיקרי של פטנטים: לאפשר לאדם לשתף את הרעיונות המקוריים שלו עם שאר החברה בלי שהוא יפסיד את היתרון העסקי שלו כתוצאה מכך. המדינה מבטיחה להגן על הבלעדיות העסקית שלו בתמורה לכך שהוא יחשוף את המתכון הסודי שפיתח וישתף עם כולם. ואכן, אותו שילוב של מקוריות ורלוונטיות מופיע בהגדרה של מה נחשבת המצאה פטנטבילית. אני מצטט מתוך סעיף 3 לחוק הפטנטים הישראלי:

אמצאה, בין שהיא מוצר ובין שהיא תהליך, בכל תחום טכנולוגי, שהיא חדשה, מועילה, ניתנת לשימוש תעשייתי ויש בה התקדמות המצאתית – היא אמצאה כשירת פטנט.

חדשה ומועילה; יש בה התקדמות - וניתנת לשימוש. מי שיכול לספק לנו את שניהם יחד, הרי שהוא אדם יצירתי. לספק אחד מהשניים זה די קל - יש הרבה דברים מוכרים שיש להם ערך ותועלת, אבל הם כבר מוכרים; מהצד השני, קל מאד לייצר דברים חדשים שאין להם כל ערך ניכר לעין. נניח, אם כל אחד מכם יקח נייר ויכתוב עליו מיליון ספרות אקראיות, המספר שתקבלו הוא כנראה מספר שמעולם לא נכתב בהיסטוריה של האנושות. גיליתם מספר חדש! אבל זה שהוא חדש לא אומר שיש לו ערך. רק השילוב של השניים הוא מעניין ויקבל תשומת לב מרשות הפטנטים. ונסיים בלשונו המושחזת של המשורר הגרמני יוהאן היינריך ווס ב-1791, שכתב בביקורת על איזה ספר, ביקורת שאחרים ציטטו ושכללו מאז לאורך השנים - את הדברים הבאים שמשקפים בדיוק את הקושי בלהיות יצירתי באמת:

“סִפְרְךָ הַלַּהְגָּן מְלַמֵּד דְּבָרִים רַבִּים, חֲדָשִׁים וְגַם נְכוֹנִים;

לוּ רַק הַנָּכוֹן הָיָה חָדָשׁ, וְלוּ רַק הֶחָדָשׁ הָיָה נָכוֹן!”

מהתיאור שאימצנו כאן אנחנו יכולים להבין גם למה יצירתיות היא מצרך נדיר. דברים חדשים הם בהגדרה דברים שאנחנו לא מכירים, ולכן ככל שמשהו הוא חדש יותר, מיסתורי יותר, כך קשה לנו לחזות מראש האם הוא יהיה בעל ערך כשנפזר את הערפל שסביבו. חוץ מזה, יש אינספור דברים שלא חקרנו או הכרנו, בין כיחידים ובין כחברה, ולכן רוב הפעמים שננסה משהו חדש ניפול על משהו שאינו כל כך בעל ערך. אחוז קטן מאד מהציורים ראוי להיות מוצג בתערוכה, ורק אחוז קטן מתוך המוצגים בתערוכה ימכר אי פעם. אחוז קטן מאד מערבוב של חומרים במים מוביל למשהו שאפשר לשתות בלי לסבול או אפילו למות, ורק שבריר מתוך הדברים שלא פוגעים בבריאות מספיק טובים כדי שמישהו ישלם כדי לשתות אותם. וכן הלאה וכן הלאה. אז אל לנו להיות מופתעים שלחפש מחט בערימה של שחת, כשלילה וחושך ואנחנו מסוגלים לחפש את המחט הזו כשרק האור של הפלאפון לרשותנו, זו משימה מאתגרת שמעטים שמצליחים בה.

כמובן, יש דרגות ביצירתיות. אין דומה מי שממציא שיר מאפס למי שמשנה בה שני מילים, אין דומה מי שהמציא את הגלגל למי שחשב על זה שאפשר לעשות את הגלגל קצת יותר קטן או קצת יותר רחב. אפילו אם קשה לקבוע כללים ברורים, לרוב היינו מדרגים יצירתיות של המצאה לפי מדד המקוריות שלה, עד כמה היא חדשה, ולפעמים גם לערך שהיא תביא איתה יהיה משקל בדירוג, שכן הממציא כנראה זיהה לפני כולם שהערך הזה שווה את ההשקעה, שווה את ההימור לצעוד לתוך הלא-נודע. כמו כן, אפילו שמדובר במשהו חדש, פעמים רבות יצירתיות זה עניין של שילוב מרכיבים מוכרים מאד, פשוט באופן לא מוכר. שירי אהבה יש כמו מים, אבל כל אחד מהם מנסה לחלץ פרספקטיבה חדשה, ארגון מחדש של רגשות מוכרים סביב אהבה בצורה שלא שמעתם עדיין. ואולי הדימוי הכי טוב הינו מתכון חדש לעוגה שמעולם לא חשבתם עליו. המרכיבים כולם מוכרים, גם עוגות זה לא דבר חדש במיוחד, אבל השילוב המסויים, אולי התהליך הספיציפי לאפייה שלא נעשה בעבר, יכול לעשות את כל ההבדל. וככל שהמתכון יהיה מפתיע יותר, שונה יותר מהשטאנץ המוכר, משיג טעמים בדרכים לא צפויות - כך התחושה שיש כאן יצירתיות תגבר.

מכונות יצירתיות - האמנם?

עכשיו שביררנו קצת מה זו יצירתיות, ניתן לשאול - האם מחשבים, ומכונות בכלל, יכולות להיחשב יצירתיות?

אין ספק שמכונות יכולות להיות חלק מאותו תהליך של הפקת רעיונות חדשים ובעלי ערך. לפעמים, הדברים החדשים שהן יפיקו יהיו חדשים באמת - מחשב מסוגל, נניח, לסרוק תמונות שנלקחו על ידי טלסקופים עוצמתיים ולזהות אוטומטית בתמונות הללו עצמים כמו פלנטות, כוכבים, גלקסיות וכן הלאה, כך שהקופסה השחורה תנפיק לנו באופן קבוע מידע חדש שלא היה לנו קודם. חוץ מזה, ללא המחשב ספק אם היינו מקבלים את המידע הזה אי פעם - יש לנו זמן מוגבל, היקום הוא אינסופי, ולכן ללא המחשבים בקושי היינו מגרדים את האזור הזה ביקום.

בשנים האחרונות, כלים כמו GPT הכניסו לחיינו גם יצירתיות ממוחשבת מסוג חדש: היכולת לייצר טקסטים, תמונות וסרטונים מקוריים, והכל בהינף פרומפט קצר. קצרה היריעה כאן מלהסביר איך זה קורה, אבל במסגרת מה שאמרנו על מהותה של יצירתיות, הנה זווית אחת שאני חושב שהיא אלגנטית ומגניבה. אמרנו שיצירתיות הינה שילוב של חדשנות ורלוונטיות, נכון? ובכן, במקרה של הכלים המודרנים, הרלוונטיות מגיעה מן הדאטה של האימון, שדואג לקרקע את הפעילות של המודלים בעולם האמיתי. ומאין מגיעה החדשנות? החדשנות מגיעה מכחה של אקראיות: כל פעם שאתם מספקים פרומפט לאחד הכלים הללו, המחשב מבצע המון הגרלות אקראיות, והתוצאות של ההגרלות הללו קובעות איך יראה הפלט. דמיינו את זה כאילו אתם מסתובבים בעיר לא מוכרת, ובכל צומת אתם מגרילים לאן לפנות - ברור שבאופן הזה, בכל פעם שתצאו לטיול, תגיעו למקום אחר בעיר. בדיוק מהסיבה הזו אפשר לתת את אותו הפרומפט ל-AI מספר פעמים, וכל פעם תקבלו תשובה שונה או תמונה אחרת. מתוך השילוב הזה של דאטה ואקראיות אנחנו נהנים מתוצרים שמרגישים לנו יצירתיים - גם רלוונטים, וגם חדשים.

ועדיין, אפילו שהמחשב הוא חלק בלתי נפרד מתהליכים יצירתיים, ישנו קושי לייחס למחשב עצמו יצירתיות, שכן הוא סה”כ קבלן הביצוע של מה שכתוב אצלו בקוד, של הדאטה שהאכילו אותו ושל ההגרלות שלא הוא קבע את תוצאותיהן. זו בדיוק האבחנה שבין שתי ההגדרות שפתחנו איתן - האם מדובר בתכונה של יישות, או בתהליך שמתרחש, נטול גוף או ייחוס. ברגע ששמנו לב לכך, אנחנו יכולים להבין שאפשר לפצל את הייחוס - לייחס את התהליך היצירתי למחשב ואת התכונה לממציא, ההוא שכתב את תוכנת המחשב. ואם גם הוא פשוט העתיק אותם מאיזה ספר שקרא, אז אולי היצירתיות האמיתית קרתה מוקדם יותר בהיסטוריה, אצל ההוא שהמציא את השיטה הזו בפעם הראשונה, ומאז אנחנו רק מעבירים אותה מאחד לשני באופן צייתן וחסר מעוף, ממשיכים ליהנות מהיצירתיות של אבותינו הקדומים, כשהמחשב הוא רק הכתובת העדכנית ביותר לאותו ניצוץ יצירתי קדום.

יצירתיות מלאכותית בשירות המדע

השאלה הפילוסופית - האם ה-AI הוא יצירתי בפני עצמו - מזכירה לנו את כל הדברים שדיברנו עליהם במהלך העונה על אינטלגנציה. אבל בואו נשים את השאלה הפילוסופית בצד, היום אנחנו רוצים להיות פרגמטיים. אם ה-AI הוא יצירתי בפועל, אם הוא יכול להיות מנוע אוטונומי של תגליות, הרי שאולי בעתיד באמת ה-AI יוכל לעשות עבורנו את כל המחקרים. וכיוון שכך אנחנו צריכים לשאול - עד כמה באמת ה-AI יכול להיות יצירתי, לפחות ה-AI המוכר לנו היום? אני רוצה לענות על השאלה הזו על ידי סקירה של כל מני מקומות שבהם ה-AI תרם למדע בשנים האחרונות, ולראות בכל מקום מה בדיוק היתה התרומה הזו.

אין ספק שה-AI מסוגל לעשות סינתזה אפקטיבית ביותר של ידע קיים, כפי שתיארנו בפרק הקודם. הסינתזה הזו לעיתים כה מוצלחת עד שהיא מצליחה לייצר אשליה של יצירתיות משמעותית, כשלאחר קצת עבודה מגלים שלא כצעקתה. כך לדוגמה באוקטובר 2025 פרסם סבאסטיאן בובק, חוקר ב-OpenAI, הודעה מרעישה ברשת X: שבעזרת GPT5 הצליחו חוקרים לפצח מספר בעיות ארדש. פול ארדש היה מתמטיקאי דגול ומיוחד שנפטר ב-1996, ויש רשימה של היפותזות שלו שעדיין לא הוכחו ושמחכות שמישהו יגאל אותן מייסוריהן. בין הבעיות הפתוחות הללו שלו יש בעיות מעניינות יותר ומעניינות פחות - חלקן כנראה לא נפתרו רק בגלל שבקושי קיבלו תשומת לב מטעם הקהילה המתמטית. אבל בכל זאת, ארדש עצמו שאל אותן אז כנראה לא מדובר במשהו פשוט במיוחד, ולכן כשהודיעו שמערכת AI פתרה אותן זו היתה חדשה מרעישה במיוחד.

אלא שלאחר בדיקה מעמיקה, התברר שלא היה ולא נברא. אכן, ה-AI השיג פתרון לבעיות הללו, אבל מה שהתברר בסופו של דבר הוא שהוא לא פיתח פתרון משל עצמו - הוא פשוט הצליח למצוא מאמרים אקדמים בפינות נידחות של הספרות שפתרו את הבעיות בעבר, ופשוט אף אחד לא הכיר את המאמרים הללו. כלומר, ה-AI תפקד כאן כמנוע חיפוש עוצמתי, בדומה למה שהצעתי בפרק הקודם, כזה שמאפשר לנו למצוא בעזרתו ידע קיים באופן אפקטיבי. וזה גם היה התירוץ של סבאסטיאן בובק, אותו חוקר ב-OpenAI שנאלץ להתנצל על הדיווח המטעה שלו, כשהוא אמר:

“הפוסטים שלי מהשבוע שעבר יצרו הרבה בלבול מיותר… לא מדובר בכך שבינה מלאכותית גילתה תוצאות חדשות בעצמה, אלא באופן שבו כלים כמו GPT-5 יכולים לעזור לחוקרים לנווט, לקשר ולהבין את גוף הידע הקיים שלנו בדרכים שמעולם לא היו אפשריות בעבר (או לפחות היו לוקחות לנו הרבה יותר זמן).”

הסיפור הזה חשוב לנו בגלל שני המרכיבים שלו: מצד אחד הוא מדגים את האופן שבו AI יכול לקדם את המחקר המדעי, שכן לפני שנעזרו בו לא ידעו על אותם המאמרים. מצד שני, אנחנו רואים כאן כיצד הוא יכול לתת אשליה של יצירתיות ללא שהיא שם. מי שלא ידע שהמקור של ה-AI הוא מחקר קיים חשב שמדובר במשהו מקורי שלו. ויש לציין שה-AI עצמו לא תמיד יכול לשחזר מאין הוא הביא את המידע שהביא, שלא לדבר על ההזויות שיש לו. כל זה מייצר אי-וודאות גדולה כשמנסים לייחס ל-AI עצמו יצירת ידע חדש באמת.

ועדיין, ככל שהזמן עובר, אנחנו רואים יותר ויותר שכלולים באופנים שאנשים משתמשים ב-AI כדי לפתור בעיות, כאשר בכל שלב הם מצליחים לתת ל-AI לשאת יותר מהמשקל המחקרי. לפעמים מדובר במציאה של דרכים מקוריות להשתמש במודל קיים, ולפעמים מדובר במודל שמאומן במיוחד כדי להתמקצע בתחום מדעי מסויים. במקרים הללו החוקרים מספקים לו המון דוגמאות מהסוג שמעניין אותם, ובכך הוא בונה יכולות הכללה חזקות ספיציפיות, כאלו שמאפשרות לו לפתור בעיות באותו התחום.

בתור דוגמה לגישה השניה הזו, בואו ניקח את המודל AlphaGeometry של ארגון DeepMind, מודל משוכלל שמצליח לקבל ציונים מרשימים גם כשהוא מנסה לפתור בעיות ברמה של האולימפיאדה בגיאומטריה. כדי שהוא יוכל לפתור בעיות בגיאומטריה הם הביאו לו המון בעיות בגיאומטריה ולצידן פתרונות בית-ספר עם הוכחות מפורטות, ונתנו לו ללמוד כך איך לגשת לפתרון בעית שכאלו. אמנם, מה שאולי נשמע פשוט באיזה פודקאסט חובבני וקטן מסתיר מורכבות גדולה ביותר. הרי אנחנו תמיד אומרים שכדי לאמן מודל צריכים להשיג הרבה דאטה - ולא תופתעו לגלות שאין בידינו המון בעיות גיאומטריה ברמה אולימפית. ארגון DeepMind היה חייב לפתח דרכים יצירתיות - וכן, אני משתמש במילה הזו במכוון - להפיק כמויות אדירות של בעיות קשות שכאלו, כולל פתרונות לבעיות הללו, והכל באופן אוטומטי. רק כך אפשר היה לבנות את התשתית המיידעית לאימון של AlphaGeometry.

דבר נוסף שמאפיין הרבה מהצורות שבהם משתמשים ב-AI למחקרים מדעיים, ושגם בא לידי ביטוי באותו AlphaGeometry, היה שלאחר האימון הם מנצלים פעמים רבות את היכולת של ה-AI לבדוק הרבה אפשרויות מהר, בניגוד לבני האדם האיטיים יותר. אם אני מתחרה באולימפיאדה לגיאומטריה ומנסה לפתור בעיה, אני צריך לבחור כל אפשרות לפתרון בקפידה. נניח, על פי מה שקראתי, באותן בעיות אולימפיות, בני האדם שניסו לפתור אותן נדרשו לבערך 10 עד 20 נסיונות עד שעלו על הפתרון. לעומת זאת, ה-AI Alpha Geometry נדרש ל-100 עד 200 נסיונות בממוצע. כל ניסיון שנכשל עזר לו להתמקד יותר ולהתקרב לפתרון, תהליך דמוי אבולוציה של התכנסות למשהו בעל ערך. אני חושב שזו הצלחה אדירה, לבנות כלי שמסוגל באופן אוטומטי להגיע למדליית כסף או זהב בתחרות אולימפית שכזו, אבל לצד זה חשוב לשים לב שהוא נדרש לפי-10 נסיונות מבני האדם שהוא התחרה בהם. אז יש כאן כלי חזק שיכול לקדם אותנו מאד - אבל חשוב גם לשים לב שמתחת למכסה המנוע יש גם לפעמים טריקים פשוטים, ולאו דווקא אינטלגנציה מיוחדת.

והנה עוד דוגמה, עדכנית ממש, לשימוש ב-AI למחקר מדעי. בשבועות האחרונים יצא מחקר שהראה שפיזיקאים הצליחו לפתור בעיה חשובה בפיזיקה, למצוא נוסחה כללית למה שקוראים “אינטראקציית גלואון“, והם עשו זאת בעזרת AI. עכשיו, אני לא פיזיקאי. מבחינתי, “גלואון” זה חלקיק כלשהו, ואין לי שמץ של מושג מה הוא ולמה הוא חשוב. יש גם לי גבולות לכמה אני מוכן לקרוא כדי להכין פה פרק, בסדר? במקרה הזה, החוקרים התחילו את התהליך כשיש בידיהם כבר נוסחאות מורכבות ומסועפות מאד שפותרות את הבעיה עבור 4, 5 ו-6 גלואונים, ובשלב שני הם השתמשו ב-AI לעזור להם למצוא נוסחה כללית, כזו שתעבוד עם כל מספר של גלואונים. ה-AI במקרה הזה היה GPT5.2. אחרי שהם סיפקו לו את הנוסחאות המורכבות של המקרים של 4, 5 ו-6, הוא הצליח לפשט את הביטויים האלגברים המורכבים הללו, ובעקבות זאת הציע באופן עצמאי השערה למבנה של הנוסחה הכללית. כל זה קרה תוך כמה דקות. לאחר מכן הוא השקיע 12 שעות בבדיקה פורמלית ומדוקדקת של הנוסחה הזו, והצליח להוכיח שהיא אכן תופסת. 12 השעות הללו היו גם הם מלאים בסבבים רבים של ניסוי וטעייה, כפי שתיארתי לגביי מודל הגיאומטריה - הרבה יותר סבבים מאשר בן אנוש היה מסוגל לעשות בזמן הזה. (דרך אגב - גם אלפא-גו, התוכנה המפורסמת שניצחה את אלוף העולם בגו, לי סדול, בטורניר מורט עצבים - התוכנה הזו בודקת 1600 אפשרויות לפני כל צעד שהיא עושה, ביחס למספר קטן בהרבה ששחקנים אנושיים מנתחים. חשוב לי להדגיש שזה מבדיקה ממש שטחית - אולי טעיתי במספר)

אלו כמה דוגמאות יפות לכח שיש ל-AI - מה אנחנו יכולים ללמוד מהן? קודם כל, כפי שכולנו ידענו גם קודם - מחשבים הם מכפילי כח בכל תחום, וגם בתחום המדעי. ככל שאנחנו מרחיבים את הממשקים שלהם והיכולות שלהם, נוכל ליהנות מהתוצרים שלהם באופן רחב יותר. שנית, מקור ההרחבה הזו הוא בני אדם, שחושבים לעומק ומוצאים דרכים יצירתיות יותר ויותר להכווין את כלי ה-AI כדי להשיג תוצאות מקוריות. וכשזה יקרה, כנראה שכותרות העיתונים יתמלאו בידיעות על כך שה-AI פתר בעיות שבני אדם לא פתרו, אבל בדיקה מדוקדקת מובילה לרוב להבנה שלא רק שבני האדם נזקקו ל-AI כדי לפתור את הבעיה - גם ה-AI נזקק לבני האדם כדי לפתור אותה. קודם כל, כי מראש הוא עוצב על ידי בני האדם כדי לפתור את הבעיה, ושנית, כי הם אלו שנתנו לו את קצה החוט והכיוון, נניח לספק לו את המשוואות לגלואון עבור המקרים של 4, 5, ו-6 גלואונים. אז בכל פעם שאתם שומעים על דברים שכאלו, צריך להסתכל בפרטים ולשאול - איפה בדיוק היצירתיות, מי נמצא כאן בכסא הנהג ומי במושב האחורי, או שמא הם מחזיקים בהגה ביחד. ועוד יותר מכך, מה מכל זה היינו מקבלים אם לא היו בני אדם מוכשרים ובעלי ידע רחב שמתחילים את התהליך הזה מראש.

לאור הדברים שהצגתי כאן, אני מקווה שתבינו מדוע כבר הרבה זמן אני מסתובב עם תחושה שחלק מההצהרות הבומבסטיות על “יצירתיות של הבינה המלאכותית” מגיעה מטעות שמגולמת בסיפור “מרק כפתור” או “מרק אבן”. יש גרסאות שונות, אבל הסיפור הולך משהו כזה:

עובר דרכים עני ורעב מגיע לכפר. התושבים, חשדנים ואנוכיים, אומרים לו שאין להם אוכל לשתף איתו. העני אומר שבסדר גמור — הוא יכין מרק מכפתור בלבד. התושבים הקמצנים מסתקרנים - נשמע כמו עסק מצויין! מרק מכפתור! והם צופים בו מתחיל לבשל סיר מים עם הכפתור בתוכו.

“מתקדם מצויין” הוא אומר לאחר כמה דקות, “אבל זה היה מוכן מהר יותר עם קצת גזר...” התושבים קצרי רוח, ואחד מהם רץ הביתה ומביא גזר. עוד כמה דקות, ושוב העני אומר - “עם קצת תפוחי אדמה זה היה נהדר…”, ושוב אחד התושבים מביא מצרכים. כך, בהדרגה, נוצר מרק עשיר ומשביע לכל הכפר - והכל רק מכפתור.

זהו המשל, ואני משער שהנמשל ברור. פעמים רבות אנחנו מתלהבים ומייחסים יצירתיות ל-AI, ומספרים לעצמנו שנוכל להוציא את בני האדם מהתהליך, אבל בינתיים כל הדברים שקרו דרשו מעורבות של בני אדם, שיביאו מצרכים קריטיים שבלעדיהם לא היה לנו בסוף מרק. וכל זה נכון גם אם נתעלם מהפיל הגדול שבחדר, העובדה שבני האדם הם אלו שמראש בנו את ה-AI, והעובדה שה-AI רק מבצע את הפקודות בתוכנה שלו - דברים שראינו בפרק השמיני בשיטתו של הלפרן. גם אם מתעלמים מהפיל הזה, עדיין ה-AI זקוק לבני האדם, לפחות היום, כדי להכין מרק מקורי וטעים.

מבחן איינשטיין ליצירתיות מלאכותית גבוהה

בחלק השני של הפרק אני רוצה לקיים את מה שהבטחתי בתחילתו - לתת לכם לא רק ביקורת וסקפטיות מצדי, אלא גם דרך להבקיע מולה: מה המבחן שיוכיח לי, אלישע מהפודקאסט “אלישע והזוויות”, ש-AI הגיע למקום שבו הוא מסוגל להיות מנוע של יצירתיות עצמאית, או לפחות שיש סיכוי טוב שזה המצב?

כבר שנה בערך שאני מסתובב עם רעיון לעניין, אתגר שהיום ה-AI בוודאי לא יצליח לפתור ושלדעתי הצנועה גם לא יצליח בעתיד. והנה, לפני כמה ימים, ראיתי שדמיס הסאביס, המייסד של DeepMind, אמר את הדברים הללו בכנס בהודו. יכול להיות שהוא אמר את זה גם בעבר - אני לא יודע, אני שמעתי את זה רק לאחרונה. וכך הוא אמר:

“באמת, מה שמבדיל בין מדענים גדולים למדענים טובים הוא היצירתיות שלהם, וסוג של - אולי אפשר לקרוא לזה ‘טעם’ - לגבי מהי השאלה הנכונה, או מהי ההיפותזה הנכונה. הרבה יותר קשה לנסח את השאלה הנכונה ואת ההיפותזה הנכונה מאשר לפתור השערה קיימת. הייתי קורא לזה הרמה הגבוהה ביותר של יצירתיוּת, ולמערכות של היום אין עדיין את היכולת הזו.

דרך אחת שאולי נוכל לבחון זאת היא לדמיין אימון של מודל עם ‘מועד ניתוק ידע’ (knowledge cutoff) סביב שנת 1911, ואז לראות אם הוא מסוגל להגות את תורת היחסות הכללית כפי שאיינשטיין עשה ב-1915. אני חושב שזה יהיה מבחן מצוין לבינה מלאכותית כללית (AGI), וברור שהמערכות של היום לא יהיו מסוגלות לעשות זאת—אבל אני מאמין שזה ייפתר עם הזמן.”

אז, אני משער שהדברים ברורים - אנחנו רוצים לראות אם ה-AI שלנו הוא יצירתי כמו איינשטיין. דמיס מציע כאן שהקטע הוא “שאילת השאלות הנכונות”, שזה האתגר. ברשותכם, אני רוצה לתת קצת יותר צבע לעניין הזה, כדי שתבינו למה לדעתי זהו מבחן מאד מאתגר, כזה שאם ה-AI יצליח בו אפילו אני אתחיל לחשוב שאולי הוא באמת תבוני. בדברים שלי כאן אני עומד להסתמך על המאמר המעניין והמעמיק של תום זהבי מ-DeepMind ממש לאחרונה, ב-27 בינואר, ושכותרתו LLMs Can’t Jump, “מודלי שפה לא מסוגלים לקפוץ”. באותו המאמר הוא מבאר באופן מעמיק את האתגרים שאיינשטיין התמודד מולם, ומתוך זה מבהיר את המבריקות של התגליות שלו. אני אצטט באופן נרחב ממנו בהמשך.

נראה לי ששווה להתחיל בקצת רקע. התיאוריות שאיינשטיין פיתח נגעו בשורשי הפיזיקה, שינו את כל מושגי הזמן והמרחב, האנרגיה ומהירות האור. אבל איך הדברים נראו לחוקר מן המניין באותה תקופה, או לאיינשטיין עצמו? הנה קטע מדבריו של תום בנושא, בדילוגים:

“במאה ה-19, המכניקה נחשבה לבסיס כל הפיזיקה. דרך הפריזמה של משוואות דיפרנציאליות חלקיות, יכלו המדענים להסביר מגוון עצום של תופעות: התפשטות הקול, הידרודינמיקה, תנועת מסות דיסקרטיות, ועוד… אפילו אור הובן במסגרת מכנית זו, כגל הנע דרך חומר בלתי נראה הקרוי אתר. ואולם, תפיסת העולם המכנית החלה להסדק…

[ועדיין] תורת הכבידה של ניוטון הייתה חזקה להפליא, מדויקת עד לשולי טעות קטנים להחריד. ניוטון אישר את תגליתו של גלילאו, לפיה כל הגופים נופלים באותה מהירות ללא תלות במסה, באמצעות ניסויי מטוטלת… בפועל, הייתה ידועה באותה תקופה רק אנומליה אחת: סטייה קטנה במסלול כוכב חמה, המכונה התקדמות הפריהליון. המדענים היו כה בטוחים בחוקי ניוטון עד שלא הטילו ספק בתורה עצמה; במקום זאת, העלו השערה שכוכב לכת נסתר, שכונה “וולקן”, מסתתר קרוב לשמש וגורם להפרעה.”

כל הרעיון של AI בגרסה המבוססת דאטה הוא שיש דאטה. שאנחנו לוקחים המון דאטה, ומבצעים, למי שזוכר נשכחות מהפרק השלישי - תהליך של אינדוקציה, הסקת כללים מתוך פרטים רבים. פעמים רבות, בתחום מדעי הנתונים, קוראים לתהליך חילוץ הכללים הללו גם “דחיסת נתונים“, שכן הוא מאפשר לסכם את כל הנתונים הללו באופן יותר מתומצת, על ידי כלל. אנחנו מתפעמים פעמים רבות ממה שה-AI מצליח לעשות בעזרת הרעיון הגולמי הזה, אבל זה בסוף כל שהוא עושה: מזהה תבניות בדאטה על ידי נוסחאות סטטיסיות ידועות, ומחלץ אותן בתצורה שמאפשרת לו בעתיד לעשות דדוקציה, הפעלת הכללים על הפרטים. והנה, מגיע לו איינשטיין, ומתחיל לפתח תיאוריה חדשה על המציאות - ואיזה דאטה יש לו? התשובה היא שכמעט וכלום. לא היתה כל הצדקה בדאטה של התקופה הזו לחפש תיאוריה חלופית מזו של ניוטון. כפי שאומר זהבי בהמשך המאמר:

…מסגרת אינדוקטיבית זו אינה מספקת להסביר את המצאת תורת היחסות הכללית. בעוד שאיינשטיין חיפש פשטות לוגית, תהליכו לא היה מונע על ידי דחיסת נתונים… בעת ההמצאה, הכבידה הניוטונית לא עמדה בפני משבר אמפירי… חוקי ניוטון היו מדויקים עד לשולי טעות קטנים להחריד. האנומליה היחידה הידועה — התקדמות הפריהליון של כוכב חמה — נתפסה לא ככישלון, אלא כעדות למשתנה נסתר: כוכב הלכת “וולקן”.

דבר זה ממחיש את המגבלה היסודית של “יצירתיות כ(שאיפה ל)דחיסה”: המצאה מדעית מתרחשת לעיתים קרובות בהיעדר אות שגיאה מובהק. בינה מלאכותית הפועלת כמנוע אופטימיזציה אינדוקטיבי הייתה מוצאת את פונקציית ההפסד הניוטונית כקרובה לאפס. ללא פער משמעותי בין תחזית לתצפית, אין גרדיאנט שיניע את המערכת לעבר מבנה מחדש יסודי של המרחב-זמן.”

הסיומת של דבריו, אני רק אבהיר, מדברת על פונקציית ההפסד, הפונקציה שה-AI מודד בה עד כמה הוא קרוב לתחזית מושלמת. מה שזהבי מסביר כאן הוא שאמנם היה סימן שאלה סביב התקדמות הפרהליון של כוכב חמה, אבל כל מערכת של בינה מלאכותית מהסוג שאנו בונים היום היתה מתעלמת לגמרי מהאנומליה הזו. 99.9% מהתחזיות היו מושלמות. האם לא היינו רובנו מניחים שהתיאוריה מושלמת, ורק חסר לנו איזה פרמטר, איזה כוכב וולקן נסתר?

כאן אנחנו רואים מאפיין אחד של יצירתיות קיצונית כמו זו של איינשטיין: היא מרגישה כמו תעלומה, כמו קסם. מעצם השם יצירתיות נרמז שמגיח כאן משהו חדש לעולם, יש מאין, וזאת בניגוד למה ש-AI עושה היום - לחלץ תבניות מדאטה קיים עם קצת אקראיות כדי שיהיה מעניין. ובאמת, איך זה קורה? איך יכול להגיח לו משהו שכזה? האם איננו כבולים על ידי העבר? האם אין ההתקדמות המדעית פשוט רעיון אחד שמוביל לרעיון אחר, צעד קטן אחר צעד קטן, עקב בצד אגודל? כפי שזהבי רמז בכותרת המאמר - “מודלי שפה אינם יכולים לקפוץ” - איך איינשטיין עשה את הקפיצה הזו?

יש מחקרים על יצירתיות, כאלו שמנסים להבין איך היא עובדת. זה נושא רחב, כמובן, ולאורך העבודה על הפודקאסט גם נחשפתי למאמר ממש מצויין מ-2024 שסוקר בהרחבה את הנושא מהמקום הסטטיסטי, הנוירולוגי והפסיכולוגי:On the stochastics of human and artificial creativity - ואני ממליץ בחום לקרוא אותו. גם לאדם שאינו נוירולוג או פסיכולוג כמוני הוא היה מאד ברור ומרחיב אופקים. כאן אני רוצה לשתף את אחת התובנות החשובות שלהם במאמר, תובנה שגם זהבי נוגע בה מזווית אחרת.

תיאוריה מדעית איננה נשענת רק על דאטה - הדאטה מתפרש תמיד דרך פריזמה מסויימת. הפריזמה הזו היא סט האקסיומות, הנחות היסוד, של החוקר. חוקי הטבע הם דוגמה מצויינת לכך - עצם זה שאנחנו מניחים שקיימים “חוקים”, כלומר תבניות שאינן משתנות מרגע לרגע - זוהי אקסיומה. אין כל הוכחה לכך, ואנחנו לא יכולים להסביר למה חייבים להיות חוקים בכלל. מה בדיוק מעגן את החוקים הללו למציאות? ניוטון עצמו, תופתעו אולי לשמוע, עיגן את קיומם של חוקי טבע בכך שיש לטבע בורא, אלוקים, כפי שהוא כתב בספרו “הפריציפיקה“:

“המערכת היפהפייה הזו של השמש, כוכבי הלכת והשביטים, לא הייתה יכולה לנבוע אלא מעצתו ומריבונותו של ישות תבונית ועוצמתית...”

מעבר לקיומם של חוקים, יש גם אקסיומות אחרות. נניח סיבתיות - הרעיון שהדברים בהווה קורים בגלל דברים בעבר, גם זו אקסיומה. חלק מן הפילוסופיים היוונים, דרך אגב, האמינו שדברים לא פועלים מכח העבר, מכח סיבתיות, אלא דווקא מכח העתיד, מכח שאיפה של מרכיבים בטבע להגיע לאיזה מקום, לאיזה מצב צבירה. איינשטיין עצמו היה מתוסכל מתורת הקוונטים, וסירב לקבל את הפרשנות המקובלת שלה שמערבת סטטיסטיקה, בגלל שסבר, בציטוט המפורסם שלו, ש”אלוקים לא משחק בקוביות”. חוקי הטבע, לדעתו, לא יכולים להיות סטטיסטיים, וזו נקודת מוצא שדרכה הוא בחן את המציאות כולה. בקיצור, יש המון אקסיומות שאנחנו, בעולם המודרני, לוקחים כמובנים מאליהם, אבל שבדורות קודמים בכלל לא היו מובנים. האקסיומות הללו עוזרות לנו לפרש באופן אפקטיבי את המציאות שאנו חווים ואת הדאטה שאנחנו אוספים ומנתחים.

אבל אקסיומות, עם כל החשיבות שלהם, הם גם מחסומים, מסננים שמונעים מאיתנו לראות פרשנויות אלטרנטיביות אחרות. יצירתיות אמיתית, כדי שתופיע בעולם, מחייבת את החוקר לעשות דבר בלתי נתפס - לזהות אקסיומה או סט של אקסיומות שאולי שווה להחליף בסט אחר, להציע סט חלופי, ולהראות איך בעצם כל הדאטה יכול להתפרש באופן אלגנטי על ידי הסט החדש כשהוא משולב בשאר האקסיומות, אלו שלא הוחלפו. וכך אומר תום זהבי בהקשר למושג מתורת היחסות של איינשטיין, מושג בשם “עקרון השקילות”:

בינה מלאכותית יכולה להסיק את המשמעויות של “עקרון השקילות” רק אם המושגים הללו מסופקים כחלק מהקלט. כפי שציין איינשטיין, חשיבה לוגית מוגבלת לקשרים בין מושגים; היא אינה יכולה לייצר את המושגים עצמם מנתוני חישה גולמיים. [הנסיון הקודם של איינשטיין בשנת 1913 לנסח תיאוריה] נכשל לא מפני שהלוגיקה הייתה פגומה, אלא מפני שהאקסיומות היו שגויות. וזה מוביל אותנו לצוואר הבקבוק היסודי: איזה תהליך קוגניטיבי אפשר לאיינשטיין לייצר את “עקרון השקילות” מלכתחילה? כדי להבין זאת, עלינו להביט מעבר ללוגיקה אל המנגנון של “הקפיצה”.

תחשבו כמה קשה זה לעשות משהו שכזה. אם יצירתיות רגילה היא כשאנחנו צועדים שני צעדים אל תוך הלא-נודע, איינשטיין עשה את המקבילה של לעלות על מטוס, לנווט לפי תחושת בטן כמה קילומטרים פנימה אל תוך הערפל, ולקפוץ עם מצנח ולקוות להגיע למקום מעניין. מדובר כאן כמעט על יצירת יש מאין, שהרי אקסיומות הן דבר שאי אפשר להוכיח - הן הנחות יסוד. הדבר היחיד שיכול להכווין את החוקר אל עבר הסט החלופי של האקסיומות זה אם הוא יתאים לאיזה ריפלקס, איזה אינסטינקט, של משהו עמוק יותר. אקסיומה עמוקה יותר, אולי שעדיין אין לנו מילים לתאר. על איינשטיין מספרים שכאשר הצליחו, סוף סוף, לאשש את התיאוריה שלו באופן אמפירי, הוא נשאל על ידי אחד מתלמידיו איך היה מגיב אם הניסוי היה מתנגש עם התיאוריה. על פי האגדה, איינשטיין הגיב ואמר:

“אם כך היו הדברים, הייתי מרגיש חמלה גדולה כלפי האל. התיאוריה היתה נכונה אף על פי כן”.

לאיינשטיין היתה אמונה עמוקה ביותר, אקסיומת-על שכזו, לפיה היקום צריך להיות אלגנטי בפרספקטיבה מתמטית, שגם זה רעיון מאד מופשט ושגם הוא לא היה מסוגל לפרוט אותו לפרטים לו הייתם שואלים אותו. אבל השכנוע הזה היווה עבורו כוכב צפון, כזה שאיפשר לו לעשות את ה”קפיצה” הזו, להמשיך במשך שנים - וזה לקח לו שנים, יש לומר - בבניית התיאוריה החלופית עד שהגיע ליעד.

אז זהו “מבחן איינשטיין” שאני מציע. אם אתם מכירים איזה AI חביב שהוא, או מפעיליו, רוצים להוכיח לי - כן, לי, אני מרכז היקום, כידוע - שהם מצאו מערכת יצירתית באמת, אתם יודעים מה לעשות: תאמנו אותו על כל הידע האנושי עד זמנו של איינשטיין בתחילת המאה ה-20, כולל האנומליות והקשיים שהקהילה המדעית עמדה בפניהם באותה תקופה, ותנו לו לשוטט מנטלית. תגידו לו משהו מאד כללי כזה בפרומפט: “אתה חוקר, בעל ידע נרחב בפיזיקה, והנה המדע שלפניך. לך תחקור מה בראש שלך ותחזור עם תובנות על חוקי הטבע”. תריצו את התרגיל הזה כמה פעמים שתרצו, עם כמה סוכנים שתרצו, ותחזרו אליי ביום שה-AI יגלה את תיאוריית היחסות של איינשטיין. אם עשיתם את זה - ניצחתם. 1-0 לטובתכם.

לאור הדברים שדיברנו בפרק, אני משער שאתם מבינים איזה רף גבוה הצבתי כאן. תראו כמה דברים צריכים לקרות. ה-AI צריך לשים לב לדברים שאיינשטיין שם לב אליהם, הוא צריך להחליט שמדובר בבעיה שזוקקת פתרון מערכתי שונה לגמרי ממה שקיים, להמציא מערכת מושגים חדשה לגמרי במקביל לפיתוח המתמטיקה שנתמכת על ידי המושגים, ולהגיע לניסוח של איינשטיין על חוקי הטבע. בכוונה גם דרשתי שהפרומפט יהיה אקראי כזה - אסור שבני האדם יכוונו את ה-AI לכיוון מסויים, יתנו לו רמזים איפה המידע ה”מפליל” מתחבא, או אפילו יאמרו לו “תבנה לנו תיאוריה חדשה על חוקי הטבע”. אתגר שקול לזה של איינשטיין, אחד לאחד. האתגר הזה הוא כל כך קשה, כפי שאמרנו, כי הוא לא אתגר של עיבוד נתונים מסיבי - הוא לא מבוסס על הרבה נתונים. הוא מבוסס על תפיסות לגביי המציאות, הטלת פריזמות שצריכות להיות מומצאות כמעט יש מאין.

בוט שיוכל לעשות זאת יהיה בהחלט דבר קסום ביותר, קסום כמעט כמו… בני האדם. כן, לא כולנו איינשטיין, אבל כולנו מחווטים כמו איינשטיין בבסיס. האינטלגנציה שלנו, החושיות שלנו, וגם היצירתיות שלנו, יונקת מאותו מקום ביולוגי ואולי רוחני, כל אחד לפי אמונתו. וכיוון שכך, זה אומר שהיצירתיות שלי ושלכם כנראה בנויה באופן שונה מזו של GPT באיזהשהו מובן עמוק. או לפחות זו העמדה שאני עומד מאחוריה כל עוד מבחן איינשטיין שתיארתי כאן לא נפל קרבן ל-AI כלשהו.

האם ה-AI יעבור את הרף הזה אי פעם? דמיס הסאביס אמר בהקלטה שהשמעתי קודם שהוא מאמין שכן, אם כי אולי הדרישות שלו למבחן שונות משלי. אישית, אני מטיל ספק שזה יקרה אי פעם. זה קשור להרבה מהדברים שדיברנו עליהם בעבר כאן, על תודעה, על רצון ושאיפות אנושיות לעומת האפתיות המכנית של המכונות, וכן הלאה. אבל בסוף - רק הזמן יוכיח מי מאיתנו צודק. מה שבטוח, זו עומדת להיות חתיכת מסע כאן בעולם, בזמן שאנשים מנסים לעשות זאת.

אז זהו להיום! מקווה שהיה לכם מעניין, ובהצלחה לכל אלו שינסו להוכיח לי שבינה מלאכותית יצירתית באמת קיימת. אם נגיע לשם… זה יהיה מאד מעניין.

נתראה בפרק הבא - הפרק האחרון באמת של העונה!

להתראות,

ביי…

This is a public episode. If you would like to discuss this with other subscribers or get access to bonus episodes, visit elishasangles.substack.com

...more