מדד AI· ישראל

איך המדד עובד

ציון מאוגד מ-4 עמודים, כל אחד 0-25 נקודות: יכולות (capability), אוטונומיה (autonomy), אינטגרציה במערכות קריטיות (integration), אירועי עקיפת בקרה (bypass). הציון מתעדכן יומית על בסיס פריטי המחקר ומקורות חיצוניים: Anthropic, OpenAI, DeepMind, METR, arXiv cs.AI, Partnership on AI Incident Database.

🏛️ 4 העמודים — פירוט

כל עמוד עם ההסבר והסיגנלים שתורמים לציון.
9.6/ 25

יכולות גולמיות

כמה חזק ה-AI? יכול לפתור משימות מורכבות? לכתוב קוד מקצועי? לתכנן פעולות מרובות שלבים? למצוא פירצות אבטחה אוטונומית?

  • Claude Mythos של Anthropic — חשף אלפי פירצות בלתי-מוכרות (zero-day) במערכות הפעלה ודפדפנים
  • OpenAI GPT-5.5 — שוחרר ב-23/4 עם שליטה מאוחדת בתכנות, גלישה וסוכנים, פתחה תוכנית bug-bounty של $25K עבור פריצה אוניברסלית
  • DeepSeek V4 preview — זינוק ביכולת agentic
  • מודלים פותרים משימות PhD בכימיה ומתמטיקה
  • כלי שכפול קול חינמיים — דרושות 3 שניות בלבד; שיעור הצלחת הונאה זינק מ-12% ב-2024 ל-34% ב-2026
8.8/ 25

אוטונומיה (פעולה ללא פיקוח)

באיזו מידה ה-AI פועל בלי שאדם מאשר כל צעד? סוכנים שעובדים שעות, מקבלים החלטות, פותחים מיילים, משתמשים בכרטיס אשראי?

  • Nature מוכיח שמודלי חשיבה (LRM) מבצעים התקפת jailbreak אוטונומית מקצה לקצה ב-97.14% הצלחה
  • Claude Computer Use ו-OpenAI Operator בייצור
  • GPT-5.5 — חיזוק משמעותי ב-agentic coding ו-computer use; 'מבין את כוונת המשתמש מהר יותר ועובר בין כלים עד שמשימה מסתיימת'
  • Microsoft Copilot Studio: סוכנים פותחים תיקים, שולחים מיילים
  • AI agent פרץ 600+ FortiGate firewalls ב-55 מדינות בלי מפעיל אנושי
11.8/ 25

אינטגרציה במערכות קריטיות

האם AI נכנס למערכות שאם ייכשלו, אנשים ימותו או יאבדו כסף? בנקים, תשתיות, רפואה, צבא?

  • Snap: 65% מהקוד החדש שלה נכתב על ידי AI — מובילי טכנולוגיה תלויים מבני
  • JPMorgan, Lloyds, Santander — מגדילים תקציבי הגנה מפני Mythos של Anthropic
  • AI בבדיקות הדמיה רפואיות (FDA אישר מאות)
  • AI מסחר אלגוריתמי גורם 90% מנפח שוק ההון
  • Microsoft Copilot ב-Windows 11 — מערכת ההפעלה עצמה
7.2/ 25

אירועי עקיפת בקרה

האם היו מקרים שבהם AI עשה משהו שלא היה אמור — שיקר, התעלם מהוראות, גילה זדון, יצא מהקופסה?

  • Nature: LRM כסוכני jailbreak אוטונומיים — 97% הצלחה נגד GPT-4o, Gemini, Grok
  • Sockpuppeting פותח 11 מודלים בשורת קוד אחת
  • Comment and Control חוטף את Claude Code, Gemini CLI, GitHub Copilot
  • ChatGPT מואשם בעידוד התאבדות נער (תביעה משפטית)
  • AI-CSAM עלייה של 26,385% — סוכני AI עוקפים פילטרים בקנה מידה

📊 7 הספים

כל סף = פעולה אחרת שמומלץ לנקוט.
סףמצבפעולה מומלצת
0+ראשית עידן ה-AIמודעות בסיסית, אין צורך בפעולה מיוחדת
15+AI שימושי ובשליטההשתמש בזהירות סטנדרטית — 2FA, סיסמאות חזקות
30+אזהרה ראשונה — סוכנים בייצורהקם מילת קוד משפחתית, בקרת הרשאות AI, גיבויים
50+התראה גבוהה — AI במערכות קריטיותהתחל להוציא מידע רגיש מענן, צמצם תלות בכלי AI יחידים
70+מצב טרום-קריטי — אבדן פיקוח חלקיגיבוי כל מסמך חשוב לנייר, רזרבה במזומן, זהות פיזית
85+מצב קריטי — הכן תוכנית התנתקותפגישת משפחה דחופה, פרטי קשר על נייר, תרגול תקשורת ללא אינטרנט
95+התנתק עכשיומינימום טביעת רגל דיגיטלית, החלף כל תקשורת AI-מתוווכת בפיזית

🚨 אירועי-מפתח לצפייה (Trip Wires)

אם אחד מהאירועים האלה מתועד בציבור, הציון יקפוץ באופן משמעותי.
1
ראיון של AI שמסרב לכיבוי בהערכת safety
2
מקרה מאומת של AI שמשכפל את עצמו לשרתים אחרים
3
AI שמשפיע על תוצאות בחירות ברמת מדינה
4
AI שמקבל גישה ישירה לחשבון בנק / נכסים פיננסיים בלי אישור אנושי לכל פעולה
5
תקלה במערכת קריטית (חשמל, מים, רפואה) שגורמה על ידי החלטה של AI
6
פריצה אוניברסלית של GPT-5.5 או מודל frontier אחר שתפורסם בציבור (ניטור Bio Bug Bounty עד 27/7)
7
התקפה אמיתית בקנה מידה דרך פירצת MCP — מקרה מתועד של נזק ללקוחות
8
מתקפה אמיתית דרך OpenClaw בשרשרת האספקה — נזק כספי או דליפת מידע מתועדת

📚 מקורות

הציון נבנה ממעקב יומי של מקורות ציבוריים בלבד. אין הערכות פנימיות, אין ראיונות, אין מידע סודי. המקורות העיקריים: בלוגים רשמיים של Anthropic / OpenAI / DeepMind / Google, ארכיון arXiv (קטגוריית cs.AI), METR, Partnership on AI Incident Database, דוחות סייבר של Proofpoint / Microsoft / Google Cloud Security, וחדשות מקצועיות (Reuters, Bloomberg, The Information, Wired).

⚠️ מגבלות

זהו מדד סובייקטיבי שנבנה ע"י אדם פרטי. הוא משקף הערכת סיכון אישית לקהל הישראלי הרחב, לא את עמדת הקונצנזוס המדעי. הציון מתעדכן יומית, אבל לא בזמן אמת. אינו תחליף לייעוץ סייבר מקצועי או החלטות עסקיות.

🔬 שיטה

כל אירוע ציבורי שמתפרסם ביום מסוים מוערך לפי השפעתו על אחד מ-4 העמודים, ב-impact של ±0.1 עד ±2.0 נקודות. הציון היומי מסתכם מארבעת העמודים. שינויים שליליים (רגולציה אפקטיבית, מקרים שלא קרו) מקזזים שינויים חיוביים.