בואו נטוס גבוה. אתם יוצאים מפגישה בת שעה, הראש מלא, וביד יש לכם דף עם שלוש מילים שאי אפשר לפענח. שבוע אחר כך מישהו שואל "מה סיכמנו על הבאג ההוא?" ואין לכם מושג. זה הכאב שבא לפתור היום — איך הופכים שיחה גולמית לסיכום שאפשר לפעול לפיו, בלי לפספס אף החלטה ואף משימה. בואו נפרק את זה לבורג.
הדרכות
לסכם פגישות עם AI: מתמלול לפעולות בלי לפספס כלום
איך הופכים הקלטה לסיכום מובנה עם החלטות, אחראים ותאריכים — כולל הפרומפט המדויק, התמודדות עם עברית וסלנג, ומה מותר ואסור להקליט מבחינה חוקית.

קודם נבין מה זה בכלל "תמלול"
תמלול (Transcription) זה התהליך שבו מערכת לוקחת אודיו — ההקלטה של מי שדיבר בפגישה — והופכת אותו לטקסט כתוב. במקום קובץ קול של 47 דקות, אתם מקבלים מסמך עם כל מילה שנאמרה, שורה אחרי שורה. הסיבה שזה הצעד הראשון והקריטי: מודל שפה (LLM) לא "שומע" אודיו — הוא קורא טקסט. LLM, ראשי תיבות של Large Language Model (מודל שפה גדול), הוא בעצם מנוע שמקבל טקסט ומחזיר טקסט — תוכנה שאומנה על כמויות עצומות של כתוב כדי לנחש את המילה הבאה ולכן יודעת "להבין" ולכתוב; ChatGPT, Claude ו-Gemini הם דוגמאות לכלים כאלה. לכן בלי תמלול אין לבינה המלאכותית במה לנגוס.
יש כלים שמתמללים בעצמם תוך כדי הפגישה (Otter, Fireflies, Zoom AI, Google Meet, Teams — אלו אפליקציות שמצטרפות לשיחת הווידאו ומקליטות אותה), ויש מצב שבו אתם פשוט מקליטים בטלפון ומעלים את הקובץ אחר כך לכלי כמו Whisper (מנוע תמלול חופשי וחינמי של חברת OpenAI שממיר קובץ אודיו לטקסט). הרעיון זהה בשני המקרים: אודיו נכנס, טקסט יוצא.
למה לא פשוט לזרוק את התמלול ל-AI ולבקש "סכם"?
כי תמלול גולמי הוא בלגן. הוא מלא ב"אהה", "כאילו", חזרות, ושלושה אנשים שמדברים אחד על השני. אם תכתבו רק "סכם את זה", המודל ינחש לבד מה חשוב — ולרוב ינחש לא טוב. הוא עלול להחזיר לכם פסקה יפה שמרגישה כמו סיכום, אבל תשכח את המשימה הכי קריטית שנקבעה בדקה ה-50. הסיבה לכך פשוטה: מודל שפה נותן לכם את התשובה הסטטיסטית הסבירה ביותר לבקשה שלכם — כלומר את מה שהכי "מתאים" בממוצע למה שביקשתם, לא בהכרח את מה שחשוב לכם. בקשה מעורפלת ("סכם") מחזירה תוצר מעורפל. בקשה מדויקת מחזירה תוצר מדויק. זו כל התורה.
לכן הסוד הוא לא הכלי — הסוד הוא המבנה שאתם מבקשים. אתם צריכים להגיד למודל בדיוק אילו "מגירות" למלא: החלטות, משימות, מי-אחראי, תאריך-יעד, ושאלות פתוחות. ברגע שאתם נותנים מבנה, המודל מפסיק לנחש מה אתם רוצים ומתחיל פשוט לחלץ את המידע ולשבץ אותו במקומות שהגדרתם.
העיקרון: "פעולה" שונה מ"תקציר"
נעצור על ההבדל הזה כי הוא הלב של הכתבה. תקציר עונה על "מה דיברנו"; פעולה עונה על "מה אני עושה עכשיו". תקציר זה היסטוריה — נחמד לקריאה, חסר ערך לביצוע. פעולה (Action Item, בעברית "פריט פעולה" — משימה שיצאה מהפגישה) זו משימה קונקרטית עם שלושה רכיבים שחייבים להופיע ביחד: מה לעשות, מי אחראי, ועד מתי. "לבדוק את השרת" זו לא פעולה — זה רעיון. "דנה בודקת את לוגי השרת עד יום חמישי" זו פעולה, כי אפשר למדוד אם קרתה או לא. ("לוגים" = קבצי תיעוד שהשרת כותב לעצמו על כל מה שקרה בו, כדי שאפשר יהיה לחקור תקלות.)
הסיבה שאני מתעקש על זה: רוב הסיכומים נכשלים לא כי ה-AI טיפש, אלא כי ביקשו ממנו תקציר כשרצו רשימת פעולות. אם אתם מבקשים מהמודל במפורש "חלץ רק פריטי פעולה, כל אחד עם אחראי ותאריך, ואם לא נאמר אחראי או תאריך — סמן [חסר]", אתם מקבלים כלי עבודה אמיתי במקום חיבור.
הצעד שכולם מדלגים עליו: לתת ל-AI הקשר
הנה הטעות הכי נפוצה. אנשים מדביקים תמלול של פגישה פנימית מלאה בראשי תיבות ושמות פרויקטים — "נעדכן את ה-PRD לפני שה-QA ירוץ על הספרינט של אורון" — ומצפים שהמודל יבין. אבל המודל לא יודע ש-PRD זה Product Requirements Document (מסמך שמגדיר מה המוצר צריך לעשות), לא יודע ש-QA זה Quality Assurance (בדיקות איכות), לא יודע ש"ספרינט" זה פרק עבודה קצר וקצוב של כשבועיים, ובטח לא יודע מי זה אורון. הוא ינחש, ולפעמים ינחש מעולה ולפעמים יהרוס.
הפתרון: תמיד תנו למודל הקשר לפני התמלול — מי המשתתפים, מה הפרויקט, ומה ראשי התיבות שלכם. שתי שורות בתחילת הפרומפט (הפרומפט = ההוראה שאתם כותבים למודל) — למשל "הפגישה היא של צוות הפיתוח שלי. אורון = ראש צוות. PRD = מסמך אפיון מוצר" — משדרגות את הדיוק פלאים, כי עכשיו המודל לא מנחש מי מי ומה ראשי התיבות — הוא יודע.
להתמודד עם הבעיה הגדולה: הזיות
חייבים לדבר על זה בכנות. מודל שפה לפעמים "ממציא" — הוא מוסיף משימה שאף אחד לא אמר, או מייחס אמירה לאדם הלא נכון. בעגה המקצועית קוראים לזה הזיה (Hallucination): המודל מחזיר משהו שנשמע סביר אבל פשוט לא קרה במציאות. זה קורה כי, כמו שהסברנו למעלה, המודל בנוי לנחש את ההמשך הסביר ביותר ולהשלים טקסט בצורה חלקה — לא לבדוק עובדות מול מקור.
איך מגנים על עצמכם? שתי טכניקות מעשיות. ראשונה — בקשו מהמודל ציטוט מקור: "לכל פריט פעולה, צרף את המשפט המדויק מהתמלול שממנו חילצת אותו." אם הוא לא מוצא משפט אמיתי לצטט, הפריט חשוד. שנייה — וזו ה"זהב": תמיד עברו על הסיכום עין מול התמלול לפני ששולחים אותו הלאה. ה-AI חוסך לכם 90% מהעבודה, אבל ה-10% האחרונים — האימות, כלומר ההצלבה הידנית שלכם בין מה שהמודל כתב למה שבאמת נאמר — הם שלכם. סיכום שגוי שנשלח לכל הצוות גרוע מאין סיכום, כי אנשים יפעלו לפי טעות בביטחון מלא.
תרחיש מלא מקצה לקצה
בואו נחבר הכול לדוגמה אחת שאפשר לשחזר. הקלטתם פגישה של 40 דקות בטלפון. אתם מעלים את הקובץ ל-Whisper (או פשוט מבקשים את התמלול מ-Otter שרץ ברקע במהלך הפגישה). מקבלים טקסט גולמי. עכשיו אתם פותחים את Claude או ChatGPT, מדביקים קודם שתי שורות הקשר (מי המשתתפים וראשי התיבות), מתחתיהן מדביקים את התמלול, ומבקשים מבנה ברור: תקציר של חמש שורות, רשימת החלטות, רשימת פעולות עם אחראי+תאריך, ורשימת שאלות פתוחות. תוך 20 שניות יש לכם מסמך. אתם סורקים אותו מול התמלול בעין, מתקנים שם אחד שהמודל בלבל, ושולחים לצוות.
מה שלקח פעם 25 דקות של כתיבה ידנית מתוך זיכרון מתפורר — לוקח עכשיו שלוש דקות, והוא מדויק יותר ממה שהזיכרון שלכם היה מספק.
בדיקת הבנה לפני שטסים
לפני שאתם מיישמים, ודאו שתפסתם את שלושת הבורגים: (1) תמלול הופך אודיו לטקסט כי מודל שפה קורא טקסט ולא שומע אודיו; (2) המבנה שאתם מבקשים — לא הכלי — קובע את איכות הסיכום, כי בקשה מדויקת מחזירה תוצר מדויק; (3) האימות מול המקור הוא חובה כי המודל לפעמים מהזה. תפסתם את אלה? אתם מסכמים פגישות ברמה של מקצוענים. עכשיו לכו תטוסו גבוה.
אמ;לק
5 הדברים שצריך לדעת
AI קורא טקסט, לא שומע אודיו — השתמשו בתמלול המובנה של זום/טימס/מיט או העלו קובץ לכלי מבוסס Whisper. עברית מגיעה לסביבות 90% דיוק, לא 100%.
בקשו מבנה קבוע: תקציר, החלטות, טבלת משימות (משימה/אחראי/תאריך) ושאלות פתוחות. 'לא צוין' עדיף על המצאה.
תנו ל-AI לסמן בעצמו שמות ומונחים שהוא חושד שתומללו שגוי — אתם מאמתים בשתי דקות במקום לגלות טעות מביכה אחר כך.
רשימת משתתפים, ראשי תיבות ופירוש סלנג לפני התמלול הופכים סיכום 'מכונה' לסיכום שנשמע אנושי.
בישראל הקלטת שיחה שאתם צד בה חוקית, הקלטת אחרים אינה; הכריזו על הקלטה, אל תקליטו מי שלא הסכים, ואל תעלו פרטים רגישים לכלי שמאמן על הנתונים.
פניות תקשורת
לראיונות, שיתופי פעולה והרצאות — נשמח לדבר.



