חמישה תנאים ללמידת מכונה באבטחת מידע

דרוג:

"למידת מכונה" הפכה למילת באזז שספקים רבים אוהבים להשתמש בה ולפזר אותה כסוג של קסם על פתרונות אבטחת המידע שלהם על מנת למכור יותר. אחת מהמשימות הקשות שצצו לאחרונה, היא לדעת להעריך נכון פתרונות מבוססי למידת מכונה ולסנן את המוץ מן התבן.
 
לא אתאר במאמר זה מהי למידת מכונה או מדוע אנחנו צריכים אותה (בשביל זה יש ויקיפדיה), אבל אציין כי הגישה ללמידת מכונה חייבת תמיד להיות מבוססת על מדע, שקיפות וולידציה. וכדי להפוך את החיים של כולנו למעט יותר קלים, ראו חמישה קריטריונים ברורים שיעזרו לכם לבחון את איכותם של הפתרונות בהקשר זה, ללא קשר לסוג האלגוריתם שנמצא בשימוש: 

1. שיעור זיהוי (Detection Rate) מול תוצאות חיוביות שגויות (false positive) – שעור זיהוי גבוה אינו בהכרח סמן להצלחה. אפשר להגיע לשיעור זיהוי של 100% בקלות רבה, על ידי "שכנוע" האלגוריתם כי כל קובץ שהוא סורק הינו זדוני. לכן, הערך החשוב באמת הוא שיעור התוצאות החיוביות השגויות. תוצאה חיובית שגויה משמעה בפועל מניעת שימוש בקבצים לגיטימיים שבטעות זוהו כזדוניים. המטרה היא כמובן להגיע לשיעור נמוך ככל האפשר של תוצאות חיוביות שגויות. בלמידת מכונה, ניתן לבחון זאת גראפית על ידי עקומת ROC (receiver operating characteristic curve) המתארת את יחס שעור הזיהוי אל מול התוצאות החיוביות השגויות. בקשו מהיצרנים לראות את גרף ה- ROC, ברגע זה ובעבר – יצרן שלא מוכן או לא יכול להראות לכם את הנתונים האלו, לא באמת יוכל להבטיח לכם כמה נוזקות הוא יצליח למנוע מלחדור לארגון.

2. עדכונים – למידת מכונה מאפשרת לפתרונות אבטחת המידע לזהות איומים שלא זוהו בעבר ולחסום אותם. למידת מכונה טובה אינה זקוקה לעדכונים רבים לאורך הדרך, שכן היא אכן לומדת לבד אודות איומים חדשים במשך זמן ארוך. פתרון טוב יראה תוצאות טובות בגרף ה- ROC למשך חודשים ולא רק למשך ימים או שבועות. פתרון שזקוק לעדכונים רבים ופתרון שהדיוק שלו מידרדר בין עדכון לעדכון, לא באמת מספק את הסחורה.

3. החלטות בזמן אמת – אם הסריקה וחיפוש אחר נוזקות ארוך יותר מהזמן שלוקח לנוזקה לעשות את העבודה המלוכלכת שלה, זכינו בפתרון מצוין בזיהוי אבל לא במניעה. אם אנחנו רוצים למנוע נוזקות, האלגוריתם של למידת המכונה צריך לדעת לפעול תוך אלפית השנייה, ולא תוך שניות או דקות. חשוב לבדוק האם האלגוריתם נכנס לפעולה בזמן אמת וכמה זמן לוקח לו לבצע החלטות. בנוסף, בדקו מה קורה לרמת הדיוק שלו כאשר המחשב נמצא במצב לא מקוון - פתרון למידת מכונה עם סט מידע שלא יתאים לנקודות הקצה שלכם, ייאלץ לעבוד עם חיבור ענני ויהיה גם איטי וגם לא אמין.

4. לימוד בעולם האמיתי – הביצועים של האלגוריתם תלויים רבות במידע שעליו התבסס הלימוד שלו. אם המידע אקדמי, ישן ולא רלוונטי, האלגוריתם לא יבצע עבודתו בצורה אמינה בקבצים של העולם האמיתי מחוץ למעבדה. בדקו מהו המידע שעליו מתבסס האלגוריתם, האם הוא ריאלי ומציאותי ומהו נפח המידע.

5. יכולת גידול – לצורך תהליך הלימוד של הפתרון, יש צורך ביכולת לאסוף מידע חדש בהיקפים גדולים, בין היתר קבצים לגיטימיים וקבצי נוזקות. יחד עם זאת, לא די באיסוף כמויות עצומות של מידע - המידע הולך ומתרבה לאורך זמן, ולכן הפתרון צריך להיות מסוגל ללמוד ולבחון מידע החדש שנאסף, בו בזמן שבסיס הנתונים והלימוד גדל באופן משמעותי, וזאת תוך שמירה על מהירות אחידה וגבוהה.
 
לסיכום, למידת מכונה היא ללא ספק "הדבר החם הבא" בעולם אבטחת המידע והמחשוב בכלל. קיימים פתרונות רבים בשוק שמצהירים כי הם מציעים יכולות אלו. לפני שבאים לבחון אותם, אל שכחו לשאול את השאלות הנכונות.
תגיות של המאמר: 

כתבות נוספות בקטגוריה הייטק וטכנולוגיה

ExaGrid נבחרה כמועמדת סופית בפרסי Network Computing Awards לשנת 2026 ExaGrid®, ספקית הגיבוי העצמאית הגדולה בעולם, המספק
פרמייר טק בחרה ב-Anaqua למודרניזציה של ניהול הקניין הרוחני הגלובלי שלה Anaqua, ספקית מובילה של פתרונות ושירותים טכנולוגיי
Mavenir מקבלת את אות הנשיא בטקס פרסי החדשנות המובייל הלווייני של MSUA לשנת 2026 Mavenir, חברת התוכנה שבונה רשתות סלולר מבוססות בינ
Qodo מגייסת 70 מיליון דולר כדי להאיץ את המאבק נגד גלישת תוכנה מ-OpenClaw ו- Claude Code Qodo, פלטפורמת סקירת וריבונות קוד בינה מלאכותית, ש
 CSGהוכרזה כמובילה בדירוג Gartner® Magic Quadrant™‎ לניתוח ותיאום חוויית הלקוח עם הציפיות ההולכות וגדלות של הלקוחות לאינטראקציות
Zoom AI Companion 3.0 מאפשר לעובדים להחזיר את זמנם, מגובה במחקר חדש על הפסקות צהריים אבודות היום, חברת זום Zoom Communications Inc (נאסד"ק: ZM
Denodo מצטרפת ל-Snowflake ולחברות מובילות בתעשייה לקידום יכולת פעולה הדדית של נתונים ובינה מלאכותית באמצעות חילוף סמנטי פתוח Denodo, מובילה גלובלית בניהול נתונים, המעצימה סוכנ
תוכניות ה-MQ-9B של GA-ASI בבריטניה וביפן זכו בפרסי מצוינות מטעם שבוע התעופה General Atomics Aeronautical Systems, Inc (GA-ASI)
Foremay חושפת SSD שמתאימים לשימוש בחלל, מוקשח בפני קרינה Foremay, Inc, מובילה עולמית בתחום של כונני SSD שמת
OMP מדורגת במקום הגבוה ביותר ב-'שלמות החזון' והן ב-'יכולת הביצוע' בדו"ח ריבוע הקסם של גרטנר לשנת 2026 לפתרונות תכנון שרשרת אספקה: תעשיות תהליכים זוהי הפעם ה-11 שהחברה זוכה להכרה כמובילה. OMP מאמי
Artel שוברת את מחסום ה-SDI ל-IP עם FiberLink™ ST2110-TD משנה המשחק שמוצע כיחידות להתקנה קלה חברת Artel Video - מותג של ®Patton ויצרנית מוצרים
Meltwater נבחרה לפרסי התוכנה הטובה ביותר של G2 לשנת 2026 Meltwater, מובילה עולמית בתחומי המדיה, הרשתות החבר
Meltwater נבחרה לפרסי התוכנה הטובה ביותר של G2 לשנת 2026 Meltwater, מובילה עולמית בתחומי המדיה, הרשתות החבר
Refeyn משיקה את המכשיר MyMass לפישוט ההערכה של איכות דגימות עבור ביולוגיה מבנית Refeyn, מפתחת טכנולוגיית פוטומטריית מסה פורצת דרך,
ריסקיפייד משיקה את Dispute Resolve עבור Shopify כדי לסייע לסוחרים באוטומציה של ניהול החזרי תשלומים ולהשיב הכנסות שאבדו Riskified (NYSE: RSKD), חברה מובילה בתחום מודיעין
OXMIQ Labs ו-AM Intelligence Labs חוברות ומתכננות את אחת מפלטפורמות מחשוב הבינה המלאכותית הגדולות בעולם אשר מבוססות על אנרגיה מתחדשת ‏OXMIQ Labs ‏("OXMIQ"), חברה לטכנולוגיית בינה מלאכ
EarthDaily משיגה תאימות לתקן CEOS Analysis Ready Data (CEOS-ARD) EarthDaily הודיעה היום מוצרי הנתונים שלה השיגו את
Smiths Detection מדווחת על מכירת היחידה ה-2000 במספר של סורק הרנטגן התלת ממדי HI-SCAN 6040 CTiX ‏Smiths Detection, חברה גלובלית ומובילה לזיהוי איו
Xsolla מפרסמת דו"ח תעשייה חדש המזהה את ההזדמנויות הגדולות ביותר לעתיד משחקי הווידאו עבור מפתחים Xsolla, חברת מסחר משחקי וידאו גלובלית מובילה, פרסמ
נתניאל בראדלי, מנכ"ל DataVault AI, יעביר הרצאה בכנס Luminary 2026 במהלך סוף השבוע של טקס פרסי האוסקר בלוס אנג'לס Datavault AI Inc (נאסד"ק: DVLT) ("Datavault AI" או
הוסף תגובה 
תגובות  ( תגובות)