המכון לחדשנות טכנולוגית מכריז על השקת NOOR, מודל עיבוד השפה הטבעית בערבית הגדול בעולם

דרוג:

 

המכון לחדשנות טכנולוגית מכריז על השקת NOOR, מודל עיבוד השפה הטבעית בערבית הגדול בעולם

*המודל הוא החזק ביותר בשפה הערבית עד כה עם 10 מיליארד משתנים

*כולל יישומים בתחומים כמו תקצור אוטומטי, צ'אטבוטים, שיווק מותאם אישית

 

 

אבו דאבי, איחוד האמירויות, 11 באפריל 2022, (BUSINESS WIRE):

 

המכון לחדשנות טכנולוגית - Technology Innovation Institute (TII), מרכז מחקר עולמי ועמוד תווך בתחום המחקר היישומי של מועצת המחקר הטכנולוגי המתקדם של אבו דאבי (ATRC), הודיע ​​היום על השקת NOOR, מודל עיבוד השפה הטבעית (NLP) בערבית הגדול בעולם עד כה.

 

צוות החוקרים המתקדם ומומחי הבינה המלאכותית (AI) של TII איחד כוחות עם LightOn, חברת טכנולוגיה המשחררת לשימוש בינת מכונות בקנה מידה גדול במיוחד לעסקים, כדי לשנות את מודל עיבוד השפה הטבעית הערבי. למודל NOOR יש את היכולת לבצע משימות מעבר לתחום השפה - ומציע נתונים באיכות גבוהה מקצה לקצה, כולל סריקה, סינון ואצירה בקנה מידה גדול. המודל מאפשר הכשרה והגשה מבוזרת בקנה מידה גדול במיוחד - כדי לספק יישומים המציעים התמחות לטובת להסקת מסקנות ומודלים יעילים.

ד"ר ריי או. ג'ונסון, מנכ"ל, TII ו-ASPIRE, אמר: "עם הפיתוח הזה, אנו נמצאים היטב על המסלול כדי לשפר את יכולות המחקר והאישורים שלנו, כמו גם להעלאת קרנה של אבו דאבי ואיחוד האמירויות כאקו סיסטם מחקרי רציני. צוותי המומחים שלנו הוכיחו שוב שאזור זה יכול להשיג תוצאות מחקר ופיתוח פורצות דרך כדי להשפיע על העולם".

ד"ר אבטסאם אלמאזרואי, מנהל, יחידת AI Cross-Center ב-TII, אמר: "מודלים גדולים של שפה כבשו בסערה את עולם עיבוד השפה הטבעית ואנו גאים להציג מודל חדשני זה עם 10 מיליארד משתנים - מודל NLP הערבי הגדול בעולם. מערך הנתונים הערבי הגדול והייחודי שנאסף כדי להכשיר את המודל הוא תוצאה של חודשים של עבודה קשה שכללה איסוף, גריטה וסינון של מקורות מגוונים. תודה מיוחדת לכל הצוות שעבד על הפרויקט הזה כדי להפוך את NOOR למודל החיפוש בערבית לאקדמאים ועסקים בכל מקום".

פרופ' מרוואן דבה, חוקר ראשי, מרכז המחקר למדע דיגיטלי ויחידת AI Cross-Center, TII, אמר לגבי ההשקה הקרובה: "עם NOOR, TII הרחיב את היקף המודל הסטנדרטי הערבי המודרני על ידי מינוף הידע בתחום מודלי השפה הגדולים לבניית מומחיות חוצת תחומים מתקדמת בדור החדש הזה של מחקר הבינה המלאכותית".

כדי לאצור את ערכות הנתונים הערביות הגדולות בעולם, ערכת הנתונים הייחודית של NOOR, המונה יותר מ-30 מיליארד מילים, משלבת נתוני אינטרנט עם ספרים, שירה, מאמרי חדשות ומידע טכני כדי להרחיב באופן משמעותי את תחולת המודל.

ד"ר אבטסאם אלמאזרואי אמר שמודל NOOR מבוסס על ארכיטקטורת שינוי או לימוד מכונה. מודל הפיענוח בלבד שלו דומה במבנהו ל-GPT-3 והוא מתוכנת להתמודד עם משימות יצירתיות עם ארכיטקטורה משודרגת כדי לשקף את ההתפתחויות האחרונות בעולם למידת המכונה, כולל שיפורים כגון הטמעות מיקום טובות יותר.  

 

 

כדי להבטיח איכות בקנה מידה גדול בערכת הנתונים של  ,NOORצוות TII תכנן צינור סינון אוטומטי המבוסס על טכניקות לימוד מכונה. כלים אלו מזהים מלל הרלוונטי להפניות איכותיות ומגנים על המודל מחשיפה לספאם.

 

NOOR עבר אימון באמצעות מחשוב בעל ביצועים גבוהים עם 128 מעבדים גרפיים מסוג A100, והוא ממנף גישת מקבילית תלת-ממדית מתקדמת כדי לאפשר הפצת חישובים תוך הבטחת שימוש יעיל במשאבי החומרה הזמינים.

 

מנהל היחידה לבינה מלאכותית הבין-מרכזית ציין כי זהו רק הצעד הראשון במאמצי היחידה לתרום לאסטרטגיה הרחבה יותר של איחוד האמירויות לבינה מלאכותית.

 

המודל נקרא על שם המילה הערבית "אור", כדי לבסס את המתאם של מודל השפה הערבית להארת המוח.

 

אודות Technology Innovation Institute (TII)

למידע נוסף, בקרו בכתובת www.tii.ae

*מקור: AETOSWire

תמונות / גלריית מולטימדיה זמינים: https://www.businesswire.com/news/home/52671760/en

 

*מקור: AETOSWire

 

קשרי מדיה

 

Technology Innovation Institute

Sneha Sivanand, [email protected]

 

 

כיתוב תמונה מצורפת: נור, מודל עיבוד השפה הטבעית (NLP) בערבית הגדול בעולם - צוות יחידת AI, המכון לחדשנות טכנולוגית (צילום: AETOSWire)

מקור: Technology Innovation Institute

תוכן הודעה זו בשפת המקור, מהווה את הגרסה הרשמית והמהימנה היחידה של מסמך זה. תרגומים מסופקים למטרות נוחות בלבד ויש להצליבם מול המסמך בשפת המקור, המהווה את הגרסה היחידה של טקסט זה שהינה בעלת תוקף משפטי.

 

*** הידיעה מופצת בעולם על ידי חברת התקשורת הבינלאומית BUSINESS WIRE

 

לפרטים נוספים: נוי תקשורת 03-6026026 זהר 052-2641769


כתבות נוספות בקטגוריה הייטק וטכנולוגיה

Digi Power X חתמה על הסכם קולוקציה לבינה מלאכותית עם חברת מחשוב בינה מלאכותית מובילה עבור מרכז נתונים בנפח 40 מגה-וואט בקולומביאנה, אלבמה Digi Power X Inc (נאסד"ק: DGXX) (Cboe Canada:DGX)
EarthDaily מקדמת מדידה יומית עולמית של שינויים פלנטריים עם שיגור של שישה לוויינים EarthDaily Analytics (EarthDaily) הודיעה היום על ש
neurocare group AG מודיעה על אישור MDMA למכשירי TMS בערב הסעודית neurocare group AG ("neurocare ", "החברה"), פלטפור
OPAQUE רוכשת טכנולוגיית בינה מלאכותית קריפטוגרפית מבית TII, שפותחה באבו דאבי, ומרחיבה את תחום הבינה המלאכותית הסודית לאורך כל מחזור החיים עם הגנה פוסט-קוונטית OPAQUE, חברת בינה מלאכותית סודית שמרכזה בסן פרנסיס
זום מזהה את עלייתם של עסקים של יחידים המונעים בידי בינה מלאכותית עם ההרצה הראשונית של Solopreneur 50 Zoom (נאסד"ק: ZM) הכריזה על ההרצה הראשונה של תוכני
Datavault AI ו-CyberCatch מודיעות על חתימה על מכתב כוונות מחייב לפיו Datavault AI תרכוש את CyberCatch כדי להאיץ פתרונות להקטנת סיכוני סייבר מבוססי בינה מלאכותית ועמידים בפני מחשוב קוונטי Datavault AI Inc. ("Datavault AI" או "החברה") (נאס
OMP דורגה בין שתי האפשרויות הגבוהות ביותר בכל ארבעת מקרי השימוש בדו"ח היכולות הקריטיות של גרטנר לשנת 2026 לפתרונות תכנון שרשרת אספקה: תעשיות תהליכים. OMP, חברה מובילה בתכנון שרשרת אספקה ​​
PU Prime מגשרת על הפער בין ידע להצלחה עם השקת פלטפורמת PU Community האינטראקטיבית PU Prime, ברוקרית מקוונת גלובלית בעלת רישיונות מרו
doola משיקה את Agentic LLC Formation: הקמת חברה אמריקאית תוך דקות מבלי לעזוב את Claude או את Replit doola, ה-AI Business-in-a-Box™ ליזמים גלובליים, הפ
מבניר משיקה את Cloud-Native Packet Core Foundation עם Rakuten Mobile ביפן Mavenir, חברת התוכנה שבונה רשתות סלולר מבוססות בינ
אנאקווה רוכשת את פטריקס כדי להרחיב את מנהיגותה בניהול קניין רוחני Anaqua, ספקית מובילה של פתרונות ושירותים טכנולוגיי
Meta חתמה על הסכם עם AWS להפעלת בינה מלאכותית אוטונומית על גבי שבבי AWS Graviton Meta חתמה על הסכם לפריסת מעבדי AWS Graviton בהיקף
JBL חוגגת 80 שנה להעצמת קולות JBL, מותג השמע האייקוני מבית HARMAN, חוגג את יום ה
ExaGrid נבחרה כפיינליסטית בפרסי האחסון 2026 ExaGrid®, ספקית אחסון הגיבוי העצמאית הגדולה בעולם
בודור לייזר דורגה במקום הראשון בנפח המכירות הגלובלי במשך שבע שנים רצופות, והדגימה את חוזק המותג באמצעות מנהיגות מתמשכת. חברת Bodor Laser דורגה במקום הראשון בעולם במכירות
Meltwater מרחיבה את השילוב עם יוטיוב כדי לשפר את החלטות היוצרים ואת ביצועי הקמפיינים Meltwater, מובילה עולמית בתחומי המדיה, הרשתות החבר
MOVA AtomForm מציגה לראשונה את Palette 300 ב-Rapid + TCT Boston 2026, ומציגה טכנולוגיית החלפה אוטומטית של 12 חרירי הדפסה MOVA AtomForm, חברת מותג בתחום ההדפסה התלת-ממדית ב
Saildrone מציגה את Spectre, סוג חדש של כלי שיט בלתי מאויש מהיר לפעולות ימיות Saildrone, החברה המובילה בעולם והמפעילה המנוסה ביו
אנאקווה קובעת סטנדרט חדש להגנה מודרנית על מותגים עם פתרונות מבוססי בינה מלאכותית Anaqua (אנאקווה), ספקית מובילה של פתרונות ושירותים
Graid Technology משיקה את פורטפוליו של אחסון מבוסס בינה מלאכותית סוכנית כדי לחסל צווארי בקבוק ב-KV Cache Graid Technology, חלוצה בתחום אחסון ה-NVMe המואץ ב
הוסף תגובה 
תגובות  ( תגובות)