חדשות

אנתרופיק משיקים את Claude Sonnet 5 — וזה הכי "אג'נטי" שראינו

מודל בשם קוד Fennec, תמחור היכרות אגרסיבי, ויכולת לרוץ לבד ולהשתמש בכלים. בעיניי הסיפור האמיתי הוא לא הדיוק — אלא השילוב של זול ועצמאי.

אנתרופיק משיקים את Claude Sonnet 5 — וזה הכי "אג'נטי" שראינו

"הכי אג'נטי עד כה." זה התיאור שאנתרופיק נתנו היום, 30 ביוני 2026, למודל החדש שלהם — Claude Sonnet 5. ואני יודע שהמילה הזאת, "אג'נטי", נשמעת כמו עוד באזז-וורד שזרקו על שקופית. אבל מסתבר שדווקא הפעם היא מחזיקה מים, ואני רוצה לפרק למה.

נתחיל מהשם המצחיק: שם הקוד הפנימי של המודל הוא Fennec — פנק, אותו שועל מדבר קטן עם האוזניים הענקיות. חיה שכל כולה חיישנים, שזזה מהר במדבר. במקרה או לא, זה תיאור די מדויק למה שהמודל הזה אמור להיות.

אז מה זה בכלל "אג'נטי", בלי הבולשיט

בואו נפרק את זה. מודל "אג'נטי" הוא מודל שלא רק עונה לנו — הוא מתכנן צעדים, מפעיל כלים בעצמו, ובודק אם הוא הצליח. תחשבו על ההבדל בין עובד שצריך להגיד לו כל פעולה ("עכשיו תפתח את הדפדפן, עכשיו תחפש, עכשיו תעתיק"), לבין עובד שאומרים לו "תמצא לי את שלוש הטיסות הזולות לפראג ותכין טבלה" — והוא הולך ועושה את כל זה לבד.

הכלים שאנתרופיק מציינים זה דפדפן וטרמינל. דפדפן זה ברור — לגלוש באתרים, לקרוא, ללחוץ. טרמינל זה החלון השחור שבו מריצים פקודות למחשב, מה שמתכנתים חיים בתוכו כל היום. כשמודל יכול להפעיל את שני אלה בעצמו, הוא כבר לא "צ'אט" — הוא משהו שיותר קרוב לעובד.

ההגדרה שכדאי לנו לזכור: Claude Sonnet 5 הוא מודל בינוני-מחיר של אנתרופיק, שמתכנן ומפעיל כלים בעצמו (אג'נטי) עבור מי שבונה אוטומציות וסוכנים מבלי לשרוף תקציב. והקטע המדליק הוא הסיפא — בלי לשרוף תקציב.

למה דווקא "זול" זה הסיפור, ולא "חכם"

כדי להבין למה אני מתרגש מהמחיר, צריך להבין איך משלמים על מודלים. כשאנחנו שולחים טקסט למודל, הוא לא רואה מילים — הוא מפרק אותן לטוקנים. טוקן הוא פיסת טקסט קטנה, בערך מילה או חצי מילה. תחשבו על זה כמו לבנות לגו של שפה: "שלום" יכול להיות טוקן אחד, ומילה ארוכה יכולה להתפרק לכמה.

למטה יש מנוע אמיתי שמראה את זה — נכתוב טקסט ונראה איך הוא מתפרק:

מנוע אמיתי · נסו בעצמכם

הטוקנייזר: איך טקסט הופך לטוקנים

זה לא סרטון. כתבו כאן מה שתרצו — בעברית, באנגלית, מספרים, סימנים — ותראו איך הטקסט מתפרק לטוקנים, הפיסות הקטנות שהמודל באמת רואה. ==שימו לב: עברית מתפרקת לצפוף יותר מאנגלית — ולכן עולה יותר טוקנים.==

17 טוקנים42 תווים~2.5 תווים לטוקן
שלום!␣אני␣בונה␣סוכן␣AI␣עם␣Claude␣Sonnet␣5.

זה טוקנייזר להמחשה: מודלים אמיתיים משתמשים בשיטה ששמה BPE (Byte-Pair Encoding) שמאחדת צמדי אותיות נפוצים, אז החלוקה המדויקת שונה. אבל האינטואיציה זהה — מילה נפוצה = טוקן אחד, מילה נדירה מתפרקת לכמה, ורווחים וסימנים נספרים גם הם. בדיוק לפי המספר הזה משלמים על כל בקשה.

עכשיו, תמחור per-token זה פשוט: משלמים לפי כמות הטוקנים שנכנסים (מה ששלחנו) ויוצאים (מה שהמודל ענה). תחשבו על זה כמו מונה במונית — ככל שהנסיעה ארוכה יותר, משלמים יותר.

וכאן המספרים של Sonnet 5. בתמחור היכרות, עד 31 באוגוסט 2026: $2 למיליון טוקני קלט, ו-$10 למיליון טוקני פלט. אחרי התאריך הזה זה עולה ל-$3 ול-$15. במזהה ב-API קוראים לו claude-sonnet-5, והוא מודל ברירת המחדל בתוכניות Free ו-Pro, וזמין גם ל-Max, Team ו-Enterprise.

למה זה משנה לנו? כי כשבונים סוכן, המודל לא רץ פעם אחת. הוא רץ בלולאה — מתכנן, מנסה, נכשל, מתקן, מנסה שוב. כל סיבוב כזה זה עוד טוקנים, עוד כסף על המונה. עם מודל יקר, סוכן אוטונומי הופך מהר לחור שחור בארנק. עם מודל זול שגם יודע לעבוד לבד — פתאום המתמטיקה עובדת.

הוגנות: זה לא הכי מדויק, וזה בסדר

חשוב לי להיות הוגן כאן, כי קל להתלהב. אנתרופיק עצמם ממצבים את Sonnet 5 כחלופה זולה — חלופה ל-Opus שלהם, ל-GPT-5.5 של OpenAI, ול-Gemini Pro של גוגל. שימו לב למילה "חלופה", לא "מנצח".

ובאותיות הקטנות, אנתרופיק אומרים את זה בעצמם: Opus 4.8 עדיין מדויק יותר במשימות מסוימות. זאת אומרת, אם אנחנו עושים משהו שבו כל טעות עולה ביוקר — ניתוח משפטי, קוד קריטי, החלטה רפואית — אולי דווקא נרצה לשלם יותר עבור המודל המדויק. זו גישה אחרת, לא נחותה. וגם ל-GPT-5.5 ול-Gemini Pro יש את היתרונות שלהם בתחומים שונים. אין כאן "המנצח היחיד", יש כאן כלים שונים לעבודות שונות.

השוואה

Sonnet 5 מול אחרים — גישות שונות, לא מנצח יחיד

איך המודל בכלל "מחליט" מה הצעד הבא

הרבה אנשים שואלים אותי איך מודל "מתכנן" אם הוא רק מנחש מילים. אז הנה האינטואיציה: מודל שפה, בלב שלו, מנבא את המילה (הטוקן) הבא הסביר ביותר. שוב ושוב. זה נשמע פשוט מדי כדי לעבוד — אבל כשעושים את זה מיליארדי פעמים על כמות עצומה של טקסט, נוצרת התנהגות שנראית כמו תכנון.

יש למטה מנוע אמיתי שמראה בדיוק את זה — נתחיל משפט והוא ינחש את המילה הבאה:

מנוע אמיתי · נסו בעצמכם

מודל השפה הקטן: נחשו את המילה הבאה

זה לא סרטון. זה מודל שפה אמיתי (זעיר) שספר, מתוך טקסט עברי אמיתי, איזו מילה באה אחרי איזו. כל אחוז למטה מחושב ממש עכשיו. ==בדיוק ככה עובד מודל ענק — רק בקנה מידה אדיר יותר.==

בחרו מילה ראשונה למטה…
זהיר וצפוייצירתי ומפתיע

המילים הסבירות הבאות לתחילת משפט:

שימו לב: בטמפרטורה נמוכה המכונה כמעט תמיד בוחרת את המילה הכי שכיחה (זהיר); בטמפרטורה גבוהה ההסתברויות מתשטחות והיא מעזה לבחור מילים מפתיעות. זה בדיוק הכפתור "טמפרטורה" שיש לכם ב-API של כל מודל.

ה"אג'נטיות" נבנית על זה: במקום שהמודל ינבא רק מילים, הוא מנבא גם "פעולות" — מתי לפתוח דפדפן, מתי להריץ פקודה, מתי לבדוק את התוצאה. בעיניי זה הצעד המעניין: לא שהמודל נהיה חכם יותר, אלא שלימדו אותו לעבוד בצעדים במקום בקפיצה אחת. בדיוק כמו ההבדל בין מישהו שזורק תשובה לבין מישהו שעוצר, חושב, ובודק את עצמו.

מה זה אומר למי שבונה — ולמה IPO באוויר

עכשיו לזווית שלי. אם אנחנו בונים אוטומציות, סוכנים, או כל זרימת עבודה שבה מודל רץ לבד — Sonnet 5 הוא בדיוק סוג הכלי שמשנה את החשבון. לא כי הוא הכי חכם בעולם, אלא כי השילוב "זול + עצמאי" הוא בדיוק מה שמאפשר להריץ דברים שעד היום היו יקרים מדי כדי להיות שווים.

תחשבו על זה: לפני כמה חודשים, רמת האוטונומיה הזאת דרשה את המודלים הגדולים והיקרים. עכשיו אותה עבודה רצה על מודל בינוני שעולה שבריר מהמחיר. זה לא קסם — זה התהליך הרגיל בתעשייה הזאת, שבו יכולת שהיתה פרימיום הופכת תוך זמן קצר לברירת מחדל זולה.

ויש כאן רקע עסקי שאי אפשר להתעלם ממנו. אנתרופיק נמצאים במרוץ ל-IPO — הנפקה ראשונית, כלומר הרגע שבו חברה פרטית מציעה מניות לציבור בבורסה לראשונה. בנוסף, הם השיקו מוצר חדש בשם Claude Science. תמחור היכרות אגרסיבי, מודל ברירת מחדל זול, ומוצר חדש בדיוק לפני הנפקה — אלה לא צירופי מקרים. חשוב לי להגיד: זו לא המלצת השקעה ולא ייעוץ פיננסי, אלא תיאור עובדתי של מה שמתרחש.

שורה תחתונה, בעיניי: Sonnet 5 לא מנצח אף אחד בכוח גולמי, ואנתרופיק לא טוענים שכן. הסיפור הוא שהם הורידו את המחיר של "מודל שעובד לבד" לנקודה שבה הרבה יותר אנשים יכולים פתאום לבנות סוכנים אמיתיים. המגבלה ברורה — למשימות הקריטיות ביותר עדיין יש מודלים מדויקים יותר, וכדאי לנו לבדוק בעצמנו איפה הסף שלנו. אז אני שואל אתכם: עם מודל אג'נטי וזול ביד, מה הדבר הראשון שהייתם נותנים לו לרוץ ולעשות לבד?

אמ;לק

5 הדברים שצריך לדעת

ב-30 ביוני 2026, מודל ברירת המחדל ל-Free ו-Pro, מזהה API: claude-sonnet-5.

מתכנן צעדים, מפעיל כלים (דפדפן, טרמינל) ורץ אוטונומית — ברמה שלפני חודשים דרשה מודלים גדולים ויקרים.

עד 31.8.2026: $2 קלט / $10 פלט למיליון טוקנים. אחרי כן: $3 / $15.

ממוצב מול Opus, GPT-5.5 ו-Gemini Pro. Opus 4.8 עדיין מדויק יותר במשימות מסוימות.

אנתרופיק לקראת הנפקה והשיקו גם מוצר בשם Claude Science. לא ייעוץ פיננסי.

פניות תקשורת

לראיונות, שיתופי פעולה והרצאות — נשמח לדבר.

info@yuv.ai