הזעם על Fable 5: המודל חזר, אבל האותיות הקטנות הפתיעו את כולם
אנתרופיק החזירה את Fable 5 לאוויר, אבל בתנאים צרים מהמובטח: עד 50% ממכסה שבועית ואז קרדיטים בתשלום. בדרך נחשפו האותיות הקטנות של תמחור הטוקנים, כולל מה שפקודת /usage באמת אומרת, ולמה fallback ל-Opus עולה כמו Opus.
מאת Yuval Avidaniקריאה בת 4 דק׳
אהבתם? שתפו
אמ;לק
5 הדברים שצריך לדעת
מהתוכנית המקורית של שבועיים גישה מלאה, נשארה גישה עד 50% ממכסה שבועית בלבד, ורק עד 7 ביולי. אחרי זה צריך לטעון קרדיטים בתשלום מראש.
PCWorld (1.7) תיעדה זעם אמיתי ב-r/ClaudeAI: הובטחו 14 יום, בפועל כמה ימים ואז חזרה מוגבלת. אנתרופיק מצידה נעצרה בצו ממשלתי באמצע.
כשמנגנון הבטיחות מסרב לפני פלט, לא משלמים. אבל אם הגדרנו fallback ל-Opus 4.8 והוא ענה, אותו ניסיון מחויב לפי תעריף Opus, לא Fable. אות קטנה חשובה.
בניגוד למה שרבים חושבים, זו לא 'הערכה לפי התנהגות'. לפי התיעוד, זו הערכה שמחושבת מקומית מספירת טוקנים, ועשויה להיות שונה מהחשבון בפועל. אומדן, לא קבלה.
הסיפור חושף כמה מהתמחור של ה-AI חבוי מאיתנו: מתי מחויבים, לפי איזה מודל, ואיזה מספר אמיתי ואיזה אומדן. זו אינה המלצת שימוש או ייעוץ פיננסי.
"השתמשתי ב-3 מתוך 14 הימים שהובטחו לי, ועכשיו נותרו 7 בחצי מהשימוש." המשפט הזה, מתוך r/ClaudeAI, מסכם את הזעם שהתפוצץ סביב Claude Fable 5. אנתרופיק החזירה את המודל הכי חזק שלה לאוויר, אבל בתנאים הרבה יותר צרים ממה שהובטח, ובדרך נחשפו כמה מהאותיות הקטנות של איך אנחנו בכלל משלמים על טוקנים.
בואו נפרק את זה לאט, כי מתחת לדרמה מסתתר שיעור אמיתי על תמחור AI.
מה קרה: ציר הזמן הקצר
נתחיל מהעובדות, כי בלעדיהן זה סתם רכילות. Fable 5 שוחרר ב-9 ביוני 2026, עם תוכנית מקורית לגישה עד ה-23 בחודש, שבועיים מלאים. ואז, ב-12 ביוני, הממשל האמריקאי עצר אותו בצו בקרת יצוא (סיפרנו על זה בהרחבה בעבר). כעבור כשבועיים המודל חזר, אבל לא לאותם תנאים.
גרף · נתונים מאומתים
ימי הגישה ל-Fable 5: מה הובטח מול מה שקרה
הובטח (מלא)14 ימים
בפועל עד ההשבתה3 ימים
אחרי החזרה (50% מכסה)7 ימים
התוכנית המקורית: גישה מלאה 9-23 ביוני (14 יום). בפועל: כמה ימים עד ההשבתה ב-12 ביוני, ואז חזרה עד 50% ממכסה שבועית עד 7 ביולי. נכון ל־3 ביולי 2026.
והנה הפער שהצית את הזעם. בתוכנית המקורית הובטחה גישה מלאה לשבועיים; בפועל, המשתמשים קיבלו רק כמה ימים לפני ההשבתה, ואז חזרה בתנאים חדשים: גישה עד 50 אחוז ממכסת השימוש השבועית, וגם זה רק עד ה-7 ביולי. אחרי זה, כדי להמשיך להשתמש ב-Fable 5, צריך לטעון קרדיטים בתשלום מראש. ב-1 ביולי, PCWorld פרסמה כתבה בכותרת "מנויי Claude זועמים על ההגבלות החדשות של Fable", והזעם היה אמיתי ומתועד.
צעד אחר צעד
ציר הזמן של Fable 5
1
9 ביוני: שחרור
Fable 5 יוצא לאוויר, תוכנית מקורית לגישה עד 23 בחודש (שבועיים).
1 / 4
למה זה נוגע לכולנו: האותיות הקטנות של הטוקנים
עכשיו לחלק שהכי חשוב, כי הוא נכון לכל מי שמשלם על AI, לא רק על Fable. הסיפור הזה חשף שני מנגנונים שרובנו לא מכירים.
הראשון נקרא refusal, סירוב. כשמבקשים מ-Fable 5 משהו שמסווג כרגיש, מנגנון הבטיחות שלו יכול לסרב, ולהחזיר תשובה תקינה (HTTP 200) עם סימון stop_reason: "refusal", לא שגיאה. והנה הפרט המדליק, שגם מרגיע: לפי התיעוד הרשמי, סירוב שמגיע לפני שנוצר פלט כלשהו לא מחייב אותנו בכסף. כלומר, אם המודל עצר אותנו בכניסה, לא שילמנו.
האות הקטנה: refusal מול fallback (תשובת API אמיתית)
// 1) Fable 5 refuses BEFORE any output -> you are NOT billed{"model":"claude-fable-5","stop_reason":"refusal",// normal HTTP 200, not an error"usage":{"output_tokens":0}// no output -> no charge}// 2) With a configured fallback, the request retries on Opus 4.8// and THAT attempt is billed at Opus rates, not Fable rates:{"model":"claude-opus-4-8",// fallback answered"stop_reason":"end_turn","usage":{"input_tokens":1200,"output_tokens":800}// -> charged at Opus $5/$25 per MTok, not Fable}
אבל יש כאן מלכודת עלות אמיתית, וזה המנגנון השני. מפתח יכול להגדיר "מודל גיבוי" (fallback): אם Fable 5 מסרב, הבקשה עוברת אוטומטית למודל אחר, למשל Claude Opus 4.8. וכל ניסיון מחויב בנפרד, לפי התעריף של המודל שבפועל ענה. כלומר, אם הגדרנו גיבוי ל-Opus, אנחנו עלולים לשלם לפי תעריף Opus, לא לפי מה שדמיינו. זה בדיוק סוג ה"אות קטנה" ששווה להכיר לפני שמפעילים fallback בקוד.
בדקו את עצמכם
לפי התיעוד הרשמי, מתי כן משלמים כשמשתמשים ב-Fable 5 עם fallback?
ופה הטעות שגם אני שמעתי: מה פקודת /usage באמת אומרת
הרבה אנשים אומרים ש-הנתון שפקודת /usage מציגה ב-Claude Code הוא "הערכה לפי התנהגות ולא לפי צריכה מדויקת". אז בואו נדייק, כי זה בדיוק המקום שבו קל להטעות. לפי התיעוד הרשמי, הנתון הכספי שמוצג הוא הערכה שמחושבת מקומית מתוך ספירת הטוקנים, והוא עשוי להיות שונה מהחשבון בפועל. כלומר זו לא "הערכה לפי התנהגות" מעורפלת, זו הערכה מבוססת-טוקנים שרצה על המחשב שלנו, ולכן היא לא רואה דברים כמו הנחות ארגוניות או חיוב מדויק בצד השרת.
ההבדל הזה חשוב, כי הוא ההבדל בין "המספר שקרי" (לא נכון) לבין "המספר הוא אומדן מקומי טוב שלא מחליף את החשבונית" (נכון). בעיניי, זו בדיוק השקיפות שמגיעה לנו: לדעת שהמחשבון שאנחנו רואים הוא אינדיקציה, לא קבלה.
למה בכל זאת יש פה כעס מוצדק
אני רוצה להיות הוגן לשני הצדדים. מצד אנתרופיק, יש היגיון: המודל נעצר בצו ממשלתי באמצע, מכסות מוגבלות כדי לא לקרוס תחת ביקוש, וקרדיטים בתשלום זו דרך סבירה לתמחר מודל יקר. מצד המשתמשים, הובטחה חוויה אחת, וסופקה חוויה מצומצמת יותר, בלי הרבה התראה מראש, ותוך כדי שהמנגנון של הקרדיטים והתעריפים נשאר עמום. שני הצדדים צודקים בחלקם, וזה מה שהופך את זה לסיפור.
בעיניי, הלקח הגדול הוא לא על Fable ספציפית. הוא על כמה מהתמחור של ה-AI שאנחנו צורכים חבוי מאיתנו: מתי אנחנו מחויבים ומתי לא, לפי איזה מודל, ואיזה מספר שאנחנו רואים הוא אמיתי ואיזה אומדן. ככל שנבין את המנגנונים האלה, נהיה פחות פראיירים ויותר צרכנים חכמים.
שורה תחתונה, ובעיניי
אז בואו נסכם. Fable 5 חזר לאוויר, אבל בתנאים צרים מהמובטח: עד 50 אחוז ממכסה שבועית עד ה-7 ביולי, ואז קרדיטים בתשלום, וזה מה שהצית זעם ציבורי מתועד. במקביל נחשפו שני מנגנונים ששווה להכיר: סירוב לפני פלט לא מחייב, אבל fallback ל-Opus כן מחייב לפי תעריף Opus. ופקודת /usage היא אומדן מקומי מטוקנים, לא החשבונית.
הערה חשובה: זו אינה המלצת שימוש או ייעוץ פיננסי, רק פירוק של מה שקרה ומה שכתוב בתיעוד הרשמי. חלק מהפרטים על הקרדיטים עדיין עמומים, ואני מסמן את זה במפורש במקום להשלים בניחוש.
אז השאלה שאני משאיר אותנו איתה: אם המחיר האמיתי של מה שאנחנו צורכים חבוי כל כך עמוק באותיות הקטנות, כמה מאיתנו באמת יודעים כמה הבקשה הבאה שלנו הולכת לעלות?