GLM-5.2: מפלצת הקוד בקוד פתוח שמביכה את הגדולים — בשישית מהמחיר
בדקתי את הדגל הפתוח החדש של Zhipu הסינית: מודל ענק שכותב קוד לאורך שעות, מנצח את GPT-5.5 בכמה בנצ'מרקים, ואפשר להוריד אותו חינם. אבל יש כוכבית אחת גדולה.
מאת Yuval Avidaniקריאה בת 5 דק׳
"שישית מהמחיר, וגם מורידים אותו הביתה" — זה המשפט שגרם לי לעצור הכל ולבדוק את GLM-5.2 לעומק. מסתבר שב-13 ביוני 2026 חברת Zhipu AI הסינית (שמותגת גם בתור Z.ai) שחררה את הדגל הפתוח-משקלים החדש שלה, ובניגוד להרבה הכרזות מנופחות שאנחנו רואים כל שבוע — הפעם המספרים באמת מעניינים. אז בואו נפרק את זה ביחד, בלי באז ובלי קסמים.
רגע, מה זה בכלל "פתוח-משקלים"?
לפני שנתלהב, חייבים להבין מילה אחת: open-weights, פתוח-משקלים. תחשבו על מודל שפה כמו על מתכון ענק עם מיליארדי "מספרי כוונון" — אלה ה"משקלים" (weights). כשמודל הוא סגור (כמו GPT-5.5 או Claude), אנחנו לא מקבלים את המתכון. אנחנו רק שולחים בקשה לשרת של החברה דרך API — צינור שדרכו אנחנו מדברים עם המודל שיושב אצלם — ומקבלים תשובה. המתכון נשאר נעול אצלהם.
כשמודל הוא פתוח-משקלים, החברה נותנת לנו להוריד את כל קובץ המשקלים. אנחנו יכולים להריץ אותו על המכונה שלנו (self-host), לכוונן אותו לצרכים שלנו (fine-tune), ולהשתמש בו מסחרית — בלי לשלם לאף אחד פר-בקשה. GLM-5.2 משוחרר ברישיון MIT, שזה הרישיון הכי מתירני שיש — קחו, עשו, מכרו, כמעט בלי תנאים. זאת בדיוק הסיבה שהקהילה מתרגשת.
מה החיה הזאת יודעת לעשות
עכשיו למספרים היבשים, כי הם מספרים סיפור. GLM-5.2 הוא מודל ענק עם בערך 753 מיליארד פרמטרים. פרמטר זה פשוט עוד שם ל"מספר כוונון" — וככל שיש יותר, ככה יש למודל יותר "מקום" ללמוד דברים. אבל הקטע המדליק הוא איך הם בנו אותו: בארכיטקטורת MoE.
MoE זה ראשי תיבות של Mixture-of-Experts, תערובת מומחים. תחשבו על זה כמו על בית חולים גדול: יש בו עשרות רופאים מומחים, אבל כשאנחנו מגיעים עם כאב בברך — לא מעירים את כל הצוות. רק האורתופד והפיזיותרפיסט נכנסים לחדר. בכל פעם שהמודל עונה, רק חלק קטן מהפרמטרים באמת "נדלק" ועובד — וזה מה שמאפשר מודל ענק במחיר ריצה סביר. זאת הסיבה שאפשר לקבל איכות של מודל-ענק בלי לשלם על חשמל של מודל-ענק בכל מילה.
ויש לו עוד נשק: חלון הקשר של מיליון טוקנים. טוקן הוא פיסת טקסט קטנה — בערך חלק ממילה (המילה "אינטליגנציה" יכולה להתפרק לכמה טוקנים). חלון ההקשר הוא כמה טקסט המודל יכול "להחזיק בראש" בבת אחת. מיליון טוקנים זה עצום — תחשבו על זה כמו זיכרון עבודה שמכיל ריפו קוד שלם, לא רק קובץ אחד. בדיוק בגלל זה הוא בנוי לסוכני קוד ארוכי-טווח: סוכן הוא מודל שלא רק עונה, אלא מבצע משימה רב-שלבית לבד — קורא קבצים, מריץ פקודות, מתקן באגים — לאורך זמן.
הבנצ'מרקים: כאן זה נהיה רציני
בנצ'מרק זה פשוט מבחן סטנדרטי שמריצים על כל המודלים כדי להשוות אותם באותם תנאים. בואו נראה איפה GLM-5.2 עומד, ואני אהיה הוגן — הוא לא מנצח בהכל.
ב-SWE-bench Pro הוא קיבל 62.1%. SWE-bench זה מבחן שלוקח באגים אמיתיים מפרויקטי קוד פתוח אמיתיים ובודק אם המודל מצליח לתקן אותם בעצמו — זה אחד המבחנים הכי קרובים ל"עבודת מתכנת אמיתית". ב-Terminal-Bench 2.1, שבודק עבודה בטרמינל, הוא הגיע ל-81.0%. בכמה בנצ'מרקים של קוד ארוך-טווח הוא עוקף את GPT-5.5 — וזה מודל פתוח שמורידים חינם מול דגל סגור ויקר.
ויש את Humanity's Last Exam, מבחן קשה במיוחד שנועד לאתגר את המודלים החזקים. עם כלים, GLM-5.2 קיבל 54.7 — לפני GPT-5.5 (52.2), אבל אחרי Opus 4.8 (57.9). אז כן, הוא מצוין, אבל הוא לא מלך העולם. בואו נסתכל על התמונה המלאה.
בדקו את עצמכם
מה היתרון המרכזי של ארכיטקטורת MoE (תערובת מומחים)?
במדד הכללי Artificial Analysis Intelligence Index — מדד שמשקלל המון מבחנים לציון אינטליגנציה אחד — GLM-5.2 קיבל 51. זה הציון הכי גבוה של מודל פתוח-משקלים בעולם כרגע, ומקום רביעי בסך הכל. לפניו: Claude Fable 5 (60), Opus 4.8 (56), ו-GPT-5.5 (55). שימו לב לפער: המודלים הסגורים עדיין מובילים באינטליגנציה הגולמית — הסיפור של GLM-5.2 הוא לא "הכי חכם", אלא "הכי חכם שאפשר להחזיק ביד ולשלם עליו פרוטות".
עכשיו לפלא האמיתי: המחיר
כאן זה נהיה מעניין באמת. ב-OpenRouter (שירות שמרכז גישה להמון מודלים) המחיר של GLM-5.2 הוא בערך 1.20 דולר למיליון טוקני קלט, ובערך 4.10 דולר למיליון טוקני פלט. למה זה משנה לנו? כי לעבודת קוד דומה, זה בערך שישית ממחיר GPT-5.5.
תחשבו על זה כמו ההבדל בין מונית מיוחדת לרכבת. אם אנחנו בונים סוכן שעובד שעות, קורא אלפי קבצים ומייצר טונות של קוד — כל טוקן מצטבר. פי שישה במחיר זה ההבדל בין פרויקט שאפשר להריץ לבין פרויקט שהחשבונית הורגת. וזה עוד לפני שדיברנו על האופציה להוריד את המשקלים מ-Hugging Face (האתר שבו הקהילה משתפת מודלים) ולהריץ הכל אצלנו בלי לשלם פר-טוקן בכלל.
השוואה
GLM-5.2 הפתוח מול הסגורים הגדולים
הכוכבית: לאן הולכים הנתונים שלנו
ועכשיו החלק שאסור לדלג עליו, גם אם המספרים מסנוורים. יש כאן הבחנה קריטית בין שתי דרכים להשתמש ב-GLM-5.2.
הדרך הראשונה: להוריד את המשקלים ולהריץ self-host. במצב הזה הכל אצלנו, הנתונים לא יוצאים החוצה — וזו בדיוק העוצמה של פתוח-משקלים. הדרך השנייה: לשלוח בקשות ל-API של Zhipu עצמם. השימוש ב-API שלהם נושא סיכון נתונים — מידע יכול לזרום לשרתים בסין, וזה שיקול אמיתי לכל מי שעובד עם קוד רגיש או מידע של לקוחות. זאת לא פאניקה, זאת הגינות: צריך לדעת איפה הנתונים שלנו יושבים. מי שרוצה את היתרונות בלי הסיכון — מוריד ומריץ בעצמו.
שורה תחתונה — בעיניי
בעיניי GLM-5.2 הוא רגע חשוב לקהילת הקוד הפתוח: לראשונה יש מודל פתוח-משקלים שנושף בעורף של הסגורים בעבודת קוד אמיתית, ברישיון MIT, ובמחיר שמזמין ניסויים נועזים. נכון, הוא לא מנצח את Opus 4.8 או את Claude Fable 5 באינטליגנציה הכללית — וזו הגישה השונה של החברות הסגורות, שמשקיעות במודל אחד מלוטש מאוד. אבל "פתוח, זול, ובר-הורדה" זה ערך שאי אפשר לקנות ב-API סגור בשום מחיר.
המגבלות שלי: לא הרצתי אותו על המכונה שלי לאורך שבועות, והבנצ'מרקים — כמו תמיד — לא מספרים את כל הסיפור של עבודה יומיומית. וכמובן, סיכון הנתונים ב-API הוא לא הערת שוליים. (ולמי שמגיע לכאן עם זווית השקעה — זו לא המלצת השקעה ולא ייעוץ פיננסי, רק ניתוח טכנולוגי.)
אז אני שואל אתכם: אם הייתם בונים סוכן קוד מחר בבוקר — הייתם הולכים על האיכות הגולמית של הסגורים, או על החופש והמחיר של GLM-5.2?
אמ;לק
4 הדברים שצריך לדעת
GLM-5.2 של Zhipu הסינית קיבל 51 ב-Artificial Analysis Intelligence Index — הכי גבוה בין הפתוחים, ומקום 4 בסך הכל אחרי Claude Fable 5, Opus 4.8 ו-GPT-5.5.
62.1% ב-SWE-bench Pro ו-81.0% ב-Terminal-Bench 2.1, עם MoE ענק (753B פרמטרים) וחלון הקשר של מיליון טוקנים לסוכני קוד.
כ-1.20 דולר למיליון טוקני קלט ו-4.10 לפלט ב-OpenRouter — או חינם לגמרי אם מורידים מ-Hugging Face ומריצים self-host ברישיון MIT.
שימוש ב-API של Zhipu נושא סיכון שמידע יזרום לסין. self-host מנטרל את הסיכון — הנתונים נשארים אצלנו.