סינון הספאם של Gmail עובר כעת שינויים דרמטיים.
זיהוי מהיר, יעיל ומדויק של תוכן מזיק ופוגעני כגון מתקפות פישינג, ניסיונות הונאה וספאם, או הערות פוגעניות בתגובות או בפוסטים, הוא נדבך חשוב וכעת גוגל משיקה מודול יעיל וחדשני כדי לשפר זיהוי מתקפות אלה והיא הטמיעה אותו גם ב-Gmail.
משתמשים מתוחכמים וזדוניים, משתמשים בשיטות שונות שמאוד מקשות על מודלים לזהות בצורה מדויקת ויעילה כגון על ידי שימוש בהומוגליפים (החלפת תווים דומים), תוויות בלתי נראים, ומילות מפתח מרובות כדי לנסות לרמות את מנגנוני ההגנה מבוססי למידת מכונה (ML).
המודל החדש שנקרא RETVec שהן ראשי תיבות של Resilient & Efficient Text Vectorizer ולדברי גוגל הוא מהפכני גם בדיוקו וגם ביעילותו – יעיל ב-83% מבחינת כוח העיבוד הנדרש (נמדד ביחידות TPU – Tensor Processing Units) ובא לידי ביטוי ביעילות אנרגטית, חיסכון בזמן עיבוד יקר וניהול זיכרון משופרים.
מודל RETVec הוא מודל קל משקל לעומת מודלים אחרים (כ-200 אלף פרמטרים), רב לשוני, ורמת הדיוק שלו יוצאת דופן לעומת מודלים אחרים שהם יישמו עד עתה.
המודל תומך בכל השפות ומוצע כ-open source ובשל יעילותו הרבה הוא יוכל לרוץ ביישומים שרצים על מכשירי קצה כולל ניידים (on-device). ניתן להשתמש בו ליישומים שונים לניתוח וסיווג טקסט.
לדברי גוגל, בהכרזתה מ-29/11/2023 היא בחנה את מודל RETVec בג’ימייל בשנים האחרונות וכעת הוא הופך למבצעי.
Gmail חוסמת בכל יום כ-15 מיליארד הודעות אימייל לא רצויות ולדבריה היא מצליחה לזהות כ-99.9% מהפישינג, הספאם והתוכנות הזדוניות שמגיעות אל מנויי Gmail ומצליחה למנוע את חדירתם אל תיבות המייל של המנויים שלה.