Gmail משפרת סינון ספאם טקסטואלי ומציבה דרישות חדשות למדוורים | crm.buzz

Gmail משפרת סינון ספאם טקסטואלי ומציבה דרישות חדשות למדוורים

Gmail Retvec text vectorizer text classification and security

Gmail משפרת את סינון הספאם שלה ומציבה דרישות נוספות ממדוורים

תוכן עניינים

האזנה לפודקאסט

סינון הספאם של Gmail עובר כעת שינויים דרמטיים.

זיהוי מהיר, יעיל ומדויק של תוכן מזיק ופוגעני כגון מתקפות פישינג, ניסיונות הונאה וספאם, או הערות פוגעניות בתגובות או בפוסטים, הוא נדבך חשוב וכעת גוגל משיקה מודול יעיל וחדשני כדי לשפר זיהוי מתקפות אלה והיא הטמיעה אותו גם ב-Gmail.

משתמשים מתוחכמים וזדוניים, משתמשים בשיטות שונות שמאוד מקשות על מודלים לזהות בצורה מדויקת ויעילה כגון על ידי שימוש בהומוגליפים (החלפת תווים דומים), תוויות בלתי נראים, ומילות מפתח מרובות כדי לנסות לרמות את מנגנוני ההגנה מבוססי למידת מכונה (ML).

המודל החדש שנקרא RETVec  שהן ראשי תיבות של Resilient & Efficient Text Vectorizer ולדברי גוגל הוא מהפכני גם בדיוקו וגם ביעילותו – יעיל ב-83% מבחינת כוח העיבוד הנדרש (נמדד ביחידות TPU – Tensor Processing Units) ובא לידי ביטוי ביעילות אנרגטית, חיסכון בזמן עיבוד יקר וניהול זיכרון משופרים.

מודל RETVec הוא מודל קל משקל לעומת מודלים אחרים (כ-200 אלף פרמטרים), רב לשוני, ורמת הדיוק שלו יוצאת דופן לעומת מודלים אחרים שהם יישמו עד עתה.

המודל תומך בכל השפות ומוצע כ-open source ובשל יעילותו הרבה הוא יוכל לרוץ ביישומים שרצים על מכשירי קצה כולל ניידים (on-device). ניתן להשתמש בו ליישומים שונים לניתוח וסיווג טקסט. 

לדברי גוגל, בהכרזתה מ-29/11/2023 היא בחנה את מודל RETVec בג'ימייל בשנים האחרונות וכעת הוא הופך למבצעי. 

Gmail חוסמת בכל יום כ-15 מיליארד הודעות אימייל לא רצויות ולדבריה היא מצליחה לזהות כ-99.9% מהפישינג, הספאם והתוכנות הזדוניות שמגיעות אל מנויי Gmail ומצליחה למנוע את חדירתם אל תיבות המייל של המנויים שלה.

שינוי דרמטי ביעילות סינון הספאם ב-Gmail

מודול RETVec משפר את זיהוי הודעות הספאם ב-38% ולא פחות חשוב שיפר את רמת הדיוק של זיהוי שווא (שיפור בזיהוי False Positives של 19.4% ושיפור בזיהוי False Negative של 17.71%).

Gamil RetVec text vectorizer
מקור: ההכרזה של גוגל

החשיבות של טקסט חופשי באימייל

מילים ספאמיות נחשבות לדור ישן של סינון ספאם שעבר מן העולם וכבר שנים רבות אין להן משמעות בדיוור מילים לאנשים פרטיים (B2C), אך מיקרוסופט וספקיות אימייל נוספות משתמשות עדיין במנגנוני סינון מבוססי Bayes המביא בחשבון "מילים רעות" ו"מילים טובות" כדי לשקלל בסינון ספאם מבוסס תוכן מה רמת הספאמיות של האימיילים.

Gmail משתמשת מעתה במנגנון RETVec החדש וזה מדגיש את חשיבות השימוש בטקסט חי בגוף המייל. אימיילים המורכבים מתמונה בלבד אולי קלים יותר להפקה, אך הם אינם נגישים (Accessibility), לא כוללים CTA נפרד עבור כל קישור (הקלקה אחת על התמונה), לא מאפשרים חיפוש בתיבת המייל. זה מהווה חסרון.

מילים שבעבר נחשבו ספאמיות כגון חינם, עשויות אף להגביר את ה-engagement של נמענים עם הדיוור.

ראו הרחבה במאמר נפרד על מילים ספאמיות

ראו הרחבה במאמר על אימיילים נגישים 

Gmail מקשיחה את דרישות הסף ממדורים

Gmail משלימה פער נוסף ומקשיחה את הדרישות שלה ממדוורים החל מפברואר 2024.

Gmail רוצה למנוע ממדוורים לשלוח אימיילים ממערכות הדיוור תוך שימוש בכתובת המייל הפרטית שלהם בדומיין gmail, outlook, yahoo וכדומה.

הדרישה הזו תיטיב עם מדוורים ועם לקוחות Gmail ותחייב מדוורים לקחת אחריות ולהשתמש בתבונה בדומיין האישי שלהם.

מעתה Gmail תפעיל DMARC Policy במצב quarantine על הדומיינים שלה gmail ו- googlemail מה שלמעשה לא יאפשר עוד לדור מכתובות ג'ימייל פרטיות ממערכות דיוור.

הדרישות החדשות של Gmail ממדוורים רלוונטיות למי שמדוור מעל 5,000 אימיילים ביום מכל המערכות המדוורות אל הדומיין gmail.com.

אלו הדרישות החדשות של Gmail ממדוורים החל מפברואר 2024:

אימות דומיין

דרישת הסף הינה לאמת את הדומיין השולח באמצעות SPF או DKIM. אימות  SPF בלבד אמנם מספק כדי לעמוד בדרישה זו של Gmail, אבל בסיטואציה של דיוור מכתובות IP שיתופיות (סיטואציה בה נמצאים רוב המדוורים בארץ) אין יכולת לשייך את כתובות ה-IP שה-SPF מאשר לדומיין ספציפי. לפעמים מדובר במאות או אלפי כתובות. לכן חשוב לאמת את הדומיין גם עם DKIM כי ה-reputation של דומיין נקשר ל- DKIM ספציפי.

ראו הרחבה במאמר נפרדים על אימות דומיין במערכת דיוור.

האזנה לפודקאסט

אפשרות הסרה נוחה

לאפשר למנויים להסיר את עצמם מהרשימה באמצעות ביטול מנוי קל (Easy Unsubscription – קוד שבאחריות מערכת הדיוור לצרף ל-header של ההודעה). הנחיה זו מפורסמת ב- RFC 8058.

easy unsubscribe
easy unsubscribe

אפס סובלנות לספאם

מדוורים ידרשו לעמוד ברמה נמוכה מאוד של דיווחים על ספאם ממשתמשים. הטווח המותר לפי Gmail הוא בין 0.1% ל-0.3%. את רמת הדיווחים על ספאם מ-Gmail לא ניתן לראות במערכות הדיוור אלא רק ב-Google postmasters Tools.

user reported spam google postmaster tools
דיווחים על ספאם מ-Gmail לא מופיעים במערכת הדיוור! הקליקו להסבר

פרסום רשומת DMARC

מדוורים נדרשים מעתה לפרסם רשומת DMARC גם הרשומה עצמה ב-policy של p=none.

ההמלצה שלי היא להגדיר לנטר DMARC Policy עם כלי חיצוני ולא להשתמש בהגדרות שמסופקות על ידי מערכות הדיוור השונות.

ראו הרחבה במאמר נפרד על פרוטוקול DMARC ואיך להטמיע אותו.

ראיונות בפודקאסט עם מומחי אימייל מרקטינג בינלאומיים

האזנה לפודקאסט
רוצה להתייעץ איתי לגבי שיפור האימייל מרקטינג או עבירוּת המיילים שלך? אני מזמין אותך לפגישת ייעוץ ראשונית של 1/2 שעה, ללא עלות. book a 1/2 email deliverability discovery call.

לקריאה נוספת

ההכרזה של גוגל לגבי מודול RETVec

 

אודות הכותב

sella
סלע יֹפֶה

מלווה חברות, עסקים, סטרטאפים ומערכות דיוור בארץ ובעולם בנושא עבירוּת אימיילים (email deliverability) ואסטרטגיית אימייל מרקטינג כדי שאימיילים שעסקים שולחים יגיעו ל-Inbox ולא אל ה-Spam.

יוצר הבלוג והפודקאסט crm.buzz

רוצה להתמקצע

באימייל מרקטינג?

הי אני סלע יפה. יוצר הבלוג והפודקאסט המובילים בעברית על אימייל מרקטינג.

בכל יום שישי אני שולח ניוזלטר עם כל מה שמעניין וחשוב לדעת על אימייל מרקטינג.

אני מזמין אותך להצטרף ולקבל גישה לתכנים בלעדיים למנויי הניוזלטר

הרשמה לניוזלטר פופ
דילוג לתוכן