תגית: AI RISKS

A 2026 presentation covering key AI risks: Jailbreaking, Prompt Injection, Adversarial AI, Data Poisoning, Bias, Deepfakes, and Governance essentials.
הסיכונים ב-AI
שלומי עובד

AI Risks – איך מודלי שפה חושפים אותנו לסיכונים חדשים

ה-AI לא ממציא איומים חדשים מאפס, אלא מאיץ ומגביר סיכונים קיימים בקצב חסר תקדים. במאמר הזה תמצאו פירוק עמוק של הסכנות המרכזיות – משיבוש מנגנוני בטיחות ועד הרעלת נתונים, Bias, Deepfakes והשלכות חברתיות ורגולטוריות. הכל מבוסס ישירות על התוכן במצגת שהעלית.

קרא עוד »
"Illustration of a digital 'Jailbreak in LLM' concept. The image shows a prison cell with metal bars, and a cartoon figure attempting to break into a secured AI interface. The background includes icons representing cybersecurity and hacking, placed on purple side panels."
הסיכונים ב-AI
שלומי עובד

Jailbreaking ב-AI: כשהמילים הופכות לנשק נגד הארגון 🔓

ג’יילברייק ל-LLM הוא תהליך שבו גורמים זדוניים מנסים לגרום למודל שפה לענות על פקודות שהוא אמור לחסום – כמו הנחיות לפעולה לא חוקית או חשיפת מידע רגיש.
זה נעשה באמצעות ניסוחים מתוחכמים, תסריטים מדורגים (Few-Shot) או פקודה חכמה אחת (One-Shot).
הסכנה: המודל “נשבר” מבלי להבין שההקשר מזויף- ונותן תשובות שלא נועד לתת.

קרא עוד »
"Visual warning about prompt injection in AI systems. The word 'PROMPT' is spelled out with wooden letter blocks. Above it are icons of a hacker on a laptop, a syringe symbolizing injection, and a caution triangle. The background is blurred with a soft focus. Purple side panels include icons of a hacker and a person typing passwords on a laptop."
הסיכונים ב-AI
שלומי עובד

ניהול חשיפות בהטמעת מודלי שפה – Prompt Injection ⛔

🧠 Prompt Injection היא שיטה שבה האקר שותל הוראות סמויות לבינה מלאכותית – שמבצעת אותן כאילו היו לגיטימיות.

⚠️ הבעיה היא לא במה שהבוט שואל, אלא בזה שמישהו זר שולט בו מאחורי הקלעים.

📦 דמיינו עובד שמבצע פקודות שנמסרו לו בפתק – בלי לדעת ממי.

🧩 המטרה: לשמור על שליטה, ולהבטיח שהבוט מציית רק למה שאתם מאשרים.

קרא עוד »

באתר זה נעשה שימוש ב”קבצי עוגיות” (cookies) וכלים דומים אחרים על מנת לספק לכם חווית גלישה טובה יותר, תוכן מותאם אישית וביצוע ניתוחים סטטיסטיים. למידע נוסף ניתן לעיין במדיניות הפרטיות