חמישה תנאים ללמידת מכונה באבטחת מידע

דרוג:

"למידת מכונה" הפכה למילת באזז שספקים רבים אוהבים להשתמש בה ולפזר אותה כסוג של קסם על פתרונות אבטחת המידע שלהם על מנת למכור יותר. אחת מהמשימות הקשות שצצו לאחרונה, היא לדעת להעריך נכון פתרונות מבוססי למידת מכונה ולסנן את המוץ מן התבן.
 
לא אתאר במאמר זה מהי למידת מכונה או מדוע אנחנו צריכים אותה (בשביל זה יש ויקיפדיה), אבל אציין כי הגישה ללמידת מכונה חייבת תמיד להיות מבוססת על מדע, שקיפות וולידציה. וכדי להפוך את החיים של כולנו למעט יותר קלים, ראו חמישה קריטריונים ברורים שיעזרו לכם לבחון את איכותם של הפתרונות בהקשר זה, ללא קשר לסוג האלגוריתם שנמצא בשימוש: 

1. שיעור זיהוי (Detection Rate) מול תוצאות חיוביות שגויות (false positive) – שעור זיהוי גבוה אינו בהכרח סמן להצלחה. אפשר להגיע לשיעור זיהוי של 100% בקלות רבה, על ידי "שכנוע" האלגוריתם כי כל קובץ שהוא סורק הינו זדוני. לכן, הערך החשוב באמת הוא שיעור התוצאות החיוביות השגויות. תוצאה חיובית שגויה משמעה בפועל מניעת שימוש בקבצים לגיטימיים שבטעות זוהו כזדוניים. המטרה היא כמובן להגיע לשיעור נמוך ככל האפשר של תוצאות חיוביות שגויות. בלמידת מכונה, ניתן לבחון זאת גראפית על ידי עקומת ROC (receiver operating characteristic curve) המתארת את יחס שעור הזיהוי אל מול התוצאות החיוביות השגויות. בקשו מהיצרנים לראות את גרף ה- ROC, ברגע זה ובעבר – יצרן שלא מוכן או לא יכול להראות לכם את הנתונים האלו, לא באמת יוכל להבטיח לכם כמה נוזקות הוא יצליח למנוע מלחדור לארגון.

2. עדכונים – למידת מכונה מאפשרת לפתרונות אבטחת המידע לזהות איומים שלא זוהו בעבר ולחסום אותם. למידת מכונה טובה אינה זקוקה לעדכונים רבים לאורך הדרך, שכן היא אכן לומדת לבד אודות איומים חדשים במשך זמן ארוך. פתרון טוב יראה תוצאות טובות בגרף ה- ROC למשך חודשים ולא רק למשך ימים או שבועות. פתרון שזקוק לעדכונים רבים ופתרון שהדיוק שלו מידרדר בין עדכון לעדכון, לא באמת מספק את הסחורה.

3. החלטות בזמן אמת – אם הסריקה וחיפוש אחר נוזקות ארוך יותר מהזמן שלוקח לנוזקה לעשות את העבודה המלוכלכת שלה, זכינו בפתרון מצוין בזיהוי אבל לא במניעה. אם אנחנו רוצים למנוע נוזקות, האלגוריתם של למידת המכונה צריך לדעת לפעול תוך אלפית השנייה, ולא תוך שניות או דקות. חשוב לבדוק האם האלגוריתם נכנס לפעולה בזמן אמת וכמה זמן לוקח לו לבצע החלטות. בנוסף, בדקו מה קורה לרמת הדיוק שלו כאשר המחשב נמצא במצב לא מקוון - פתרון למידת מכונה עם סט מידע שלא יתאים לנקודות הקצה שלכם, ייאלץ לעבוד עם חיבור ענני ויהיה גם איטי וגם לא אמין.

4. לימוד בעולם האמיתי – הביצועים של האלגוריתם תלויים רבות במידע שעליו התבסס הלימוד שלו. אם המידע אקדמי, ישן ולא רלוונטי, האלגוריתם לא יבצע עבודתו בצורה אמינה בקבצים של העולם האמיתי מחוץ למעבדה. בדקו מהו המידע שעליו מתבסס האלגוריתם, האם הוא ריאלי ומציאותי ומהו נפח המידע.

5. יכולת גידול – לצורך תהליך הלימוד של הפתרון, יש צורך ביכולת לאסוף מידע חדש בהיקפים גדולים, בין היתר קבצים לגיטימיים וקבצי נוזקות. יחד עם זאת, לא די באיסוף כמויות עצומות של מידע - המידע הולך ומתרבה לאורך זמן, ולכן הפתרון צריך להיות מסוגל ללמוד ולבחון מידע החדש שנאסף, בו בזמן שבסיס הנתונים והלימוד גדל באופן משמעותי, וזאת תוך שמירה על מהירות אחידה וגבוהה.
 
לסיכום, למידת מכונה היא ללא ספק "הדבר החם הבא" בעולם אבטחת המידע והמחשוב בכלל. קיימים פתרונות רבים בשוק שמצהירים כי הם מציעים יכולות אלו. לפני שבאים לבחון אותם, אל שכחו לשאול את השאלות הנכונות.
תגיות של המאמר: 

כתבות נוספות בקטגוריה הייטק וטכנולוגיה

VeriSilicon מציגה את CPP2000 - קניין רוחני לשלב שאחרי עיבוד התמונה במצלמות עבור יישומי רובוטיקה משובצת וראייה ניידת VeriSilicon ‏(688521.SH) הודיעה היום על הקניין הרו
Jeppesen ForeFlight חושפת אסטרטגיית בינה מלאכותית סוכנית ומנוע עבור תעשיית התעופה Jeppesen ForeFlight חשפה היום את מנוע הבינה המלאכו
מחקר חדש של KnowBe4 מזהיר: סוכני בינה מלאכותית בלתי מפוקחים ודיפ-פייקים מתוחכמים מהווים איום חמור על ארגונים באיחוד האמירויות הערביות ובערב הסעודית חברת KnowBe4, המובילה העולמית בתחום אבטחת כוח העבו
Autheo מציגה את מערכת ההפעלה של האינטרנט: שכבת תיאום מבוזרת עבור האינטרנט, הבלוקצ'יין והבינה המלאכותית Autheo השיקה את Mainnet של מערכת ההפעלה המבוזרת של
מבניר זכתה בפרס שותפת השנה של דויטשה טלקום לחדשנות הרשת הטובה ביותר Mavenir, חברת התוכנה שבונה רשתות סלולר מבוססות ענן
מיטיגה משיקה את Agentic Runtime Security לתשתיות מודרניות Mitiga, המובילה במניעת פרצות ללא השפעה, הודיעה היו
ExaGrid זכתה ב-4 פרסי תעשייה בטקס פרסי האחסון ®ExaGrid, ספקית אחסון הגיבוי העצמאית הגדולה בעולם,
GA-ASI מתאימה את תחנת הבקרה הקרקעית להטסת MQ-9B General Atomics Aeronautical Systems, Inc (GA-ASI)
Legion Security זמינה כעת ב-Google Cloud Marketplace, ומשלבת בפלטפורמת אבטחת הסייבר שלה את המודלים מתקדמים של גוגל Legion Security, חברה הפועלת בתחום אבטחת המידע ומס
Denodo הוכרה כ-"אחת שכדאי לעקוב אחריה" בדו"ח Modern Marketing Data Stack של Snowflake Denodo, חברת שכבת הנתונים מבוססת הבינה מלאכותית, ה
Datavault AI Inc (נאסד"ק: DVLT) ו-WiSA Technologies מכריזות על מערכות הקולנוע הביתי Goho LS7 2.0 ו-5.1 עם קישוריות אלחוטית של WiSA E Datavault AI Inc. (נאסד"ק: DVLT), באמצעות חטיבת מד
הדפסה יוצרת בעיית 'נתונים אפלים' בארגונים. VasionⓇ חידשה שוב ופיתחה פתרון לבעיה. בכל פעם שעובדים משתמשים באפשרות 'קובץ > הדפסה' כדי
Mavenir משיקה מסגרת אבטחת שירות סוכנית לניטור ותפעול הרשת Mavenir, ספקית תשתית הרשת הפועלת באופן טבעי ענן, ה
זיליז משיקה את Vector Lakebase, ומרחיבה את מסד הנתונים הווקטורי הנפוץ ביותר בעולם לכדי פלטפורמת נתונים אחודה עבור בינה מלאכותית Zilliz, החברה שמאחורי Milvus, מסד הנתונים הווקטורי
Straive רוכשת את NextGen Invent במטרה לחזק את יכולות היישום וההטמעה התפעולית של נתונים ובינה מלאכותית Straive, מובילה עולמית בתחום היישום והתפעול של פתר
תכירו: Agent Architect ו-Agent Performance Suite עבור Zoom Virtual Agent חברת זום Zoom Communications, Inc. (נאסד"ק: ZM) הכ
Mitiga Labs הכריזה על השקת Skillgate, כלי לזיהוי סיכונים במיומנויות ובהגדרות של סוכני בינה מלאכותית ‏Mitiga, המובילה באבטחת זמן ריצה של סוכנים לענן, S
Mavenir מעצימה את ההשקה של My ENet App, ומאחדת סלולר, פס רחב ו-IPTV עבור מנויי ENet בגויאנה Mavenir, חברת התוכנה שבונה רשתות סלולר מבוססות ענן
i2c זכתה להוקרה על מערכת גילוי הונאות מבוססת בינה מלאכותית במסגרת פרסי החדשנות של The Digital Banker לאזור MEA לשנת 2026 i2c Inc.‎, חברת טכנולוגיה פיננסית גלובלית וחדשנית,
מבניר משתפת פעולה עם רד האט כדי להשיק פלטפורמת בינה מלאכותית משולבת שתהפוך מפעילים לספקי שירותי בינה מלאכותית Mavenir הכריזה היום על פלטפורמת בינה מלאכותית משול
הוסף תגובה 
תגובות  ( תגובות)