הקול יהיה הכול: הקול עושה קאמבק ובזכות בינה מלאכותית ולמידת מכונה הקול הוא הדבר הגדול הבא. סייעניות קוליות, רמקולים חכמים ואזניות שתמיד מוכנות לפקודה ישנו (וכבר משנות) את את האופן בו נשתמש בסמארטפון, ברכב ובבית החכם. הן ישנו את האופן בו נתקשר עם עסקים ואת האופן בו נחפש ונצרוך תוכן. מה נשמע?
תוכן עניינים
האזנה לפודקאסט
השמעת בכורה עולמית
הקלטת הקול הראשונה מיוחסת בטעות לתומס אדיסון. אך האמת היא שהקלטת הקול הראשונה בוצעה על ידי הצרפתי אדוארד ליאון סקוט דה-מרטינוויל (Édouard-Léon Scott de Martinville) שהמציא מכשיר הקלטה שהוא קרא לו פונו-אוטוגראף (phonautograph) שרשם את ויברציות הקול על גבי נייר. ההקלטה הראשונה שביצע אדיסון התרחשה 17 שנה מאוחר יותר.
עד לפני כמה שנים ההקלטות הראשונות שביצע סקוט נותרו “שקטות” ולא ניתן היה לשמוע אותן, כי לא ניתן היה לשחזר אותן. בפרויקט שאפתני הצליח צוות חוקרים לשחזר (audio restoration) כמה מההקלטות הללו וכך גם שיכתב את ההיסטוריה לגבי הממציא הראשון שהקליט את הקול.
ימי הרדיו
כל מי שהתבגר בשנות השמונים, זוכר את “התור” להשאיל מחבר תקליט חדש שזה עתה יצא, כדי להקליט אותו על קסטה (קלטת), את המפגשים בבית של חבר כדי לשמוע תקליט חדש, את הקלטות (קסטות) שהיינו מכינים כדי לעשות רושם על הבנות עם אוסף שירים שבחרנו במיוחד.
הטעם המוסיקלי שלנו הושפע מעורכי המוזיקה בתחנות הרדיו, שהיו המקור היחיד ממנו ינקנו מוזיקה ודרכו נחשפנו למוסיקה חדשה (זוכרים “השמעת בכורה עולמית”?).
למרות שניסוי בשידורים סטריאופוניים נערכו בישראל עוד בשנת 1969 עד להקמת רשת “קול המוסיקה” ב- 1983 שידורי הרדיו היו במונו (גם ב- AM וגם ב- FM). אני זוכר את “שידור הרדיו הסטראופוני הראשון” בארץ, בתחילת שנות השמונים. על מנת להדגים את המעבר שתוכנן להתרחש לשידור סטראופוני ולעודד את הציבור להצטייד במקלטי רדיו שתומכים קליטה סטריאופונית. נדמה לי שזה היה השיר Urgent של להקת foreigner. זה היה שידור מיוחד טרום תחילת שידורי ה- FM Stereo שתואם מראש עם המאזינים, שנתבקשו להצטייד בשני מקלטי רדיו ולכוון אחד מהם לרשת ב’ ואת השני לרשת ג’. כל תחנה שידרה ערוץ אחר (אחת את ערוץ ימין והאחרת את ערוץ שמאל).
בהמשך עברו שאר התחנות לשידור סטריאופוני, אך הקליטה עד היום רחוקה מלהיות טובה. באירופה וארה”ב התחיל מעבר לשידורים קרקעיים דיגיטליים (כמו “עידן פלוס” רק לרדיו) שיתרונם הוא בפחות מתחרים על אותו תדר דבר המאפשר להציע הרבה יותר תחנות שידור, איכות שידור מצוינת, רציפות שמע, מידע דיגיטלי ועוד. גם ישראל אימצה עוד ב-2004 את התקן המוביל בתחום ואף ערכה מכרז… אליו לא ניגש אף מציע.
רשת ג’ היתה התחנה העיקרית ששידרה מוסיקה. תחנות רדיו אזוריות עוד לא היו. גלגל”צ עוד לא נולדה. היינו שומעים (בתלות בעונות השנה שהשפיעו על הקליטה), מוסיקת פופ מ”רדיו מונטה קרלו” ששידר מלבנון, מרדיו ירדן ששידר מוזיקת פופ טובה וכמובן מ”קול השלום” ששידר מהאוניה של אייבי נתן מ- somewhere in the mediterranean, מול חופי תל אביב. זה היה הרדיו הכי הכי מגניב לאוהבי המוזיקה דאז, שהביא איתו טעם של חו”ל, שידר 24 שעות ביממה בניגוד לתחנות הישראלית שהפסיקו לשדר בחצות. כדי לקלוט את שידוריה, בניתי אנטנה כיוונית מיוחדת על גג בית הורי בצפון הארץ כדי לקלוט (איכשהו) את שידורי התחנה בתדר ה-FM שלה 100Mhz (כיום תחנת הרדיו האזורי “רדיוס” משדרת בתדר זה).
בתחילת שנות התשעים פעלו בארץ במשך כמה שנים (תוך עצימת עין מסוימת מצד הממסד), כמה תחנות רדיו פיראטיות שפעלו במתכונת מסחרית לכל דבר ביניהן רדיו תל אביב, רדיו חיפה ואחרות שבהמשך התמודדו וזכו במכרזים של הרדיו האזורי. גלגל”צ קמה ב-1993.
עצמת הקול
ספינת קול השלום שקועה כבר שנים במצולות, קול ישראל החליף את שמו ל-“כאן”. גם הסאונד השתנה ולמעשה השימוש באודיו עושה קאמבק והוא הולך לתפוש חלק הרבה יותר משמעותי בחיי היום יום שלנו.
אנו עטופים בשטף בלתי פוסק של אודיו הבוקע מאוזניות, רמקולים חכמים, מערכות סאונד, מכשירי רדיו וסמארטפונים. שפע של אפשרויות סטרימינג עומדות לרשותנו. מבחר של עשרות מיליוני שירים באיכות סאונד מצוינת במחיר של מנוי חודשי. האינטרנט החליף את המתווכים של פעם. את שומרי הסף ואת השולטים בערוצי ההפצה. האינטרנט הוא גלי האתר, ניידת השידור, ערוץ הלווין.
במאמר קודם כתבתי על דעיכת שיחות הטלפון ועליית השימוש הקולי בהודעות בסגנון ווקי-טוקי ובאפליקציות דיבור מבוססות VoIP. חלקן מציגות יכולות תרגום בזמן אמת של שפות זרות ומאפשרות שיחה קולחת בין אנשים שלא יודעים לדבר את אותה שפה.
התשמע קולי? גוגלי שלי?
פן נוסף של עלייתו של הקול הוא יכולות חיפוש קולי מתקדמות. זיהוי דיבור אמנם הומצא בשנות החמישים, אך כיום הודות למעבדים המהירים בשילוב טכנולוגיות AI ענניות והקישוריות המהירה לאינטרנט, דיבור ושיחה עם מחשבים ומערכות אחרות יהיה ממשק המשתמש הכי טבעי לפעולות יומיומיות שאנחנו עושים, כגון חיפוש ברשת, כשההערכה היא כי ב-2020 כ-50% מהחיפושים ברשת יהיו קוליים, כאשר כ- 30% מהחיפושים יבוצעו ממכשירים ללא מסך, כלומר בעיקר מרמקולים חכמים.
ב- 2022 קצת יותר מ-40% מהחיפושים ברשת הם קוליים (בארה”ב). בעתיד הלא רחוק יפוזרו ברחבי הבתים של כמעט כולנו רמקולים חכמים שישמיעו לנו מוסיקה, פודקאסטים וספרים וגם יקבלו מאיתנו פקודות להפעלת התקנים חכמים בבית כגון תאורה, הצללה והפעלה של מכשירים אחרים. אחד המקומות הכי מעניינים בו אנשים אוהבים למקם רמקול חכם הוא בחדר האמבטיה. כידוע הרעיונות הכי טובים באים כשאנחנו לא יכולים לרשום. כמה נחמד שיש רמקול חכם באמבטיה שאפשר לבקש ממנו לזכור את הרעיון שבדיוק צץ תוך כדי חפיפת ראש.
יכולת זיהוי הדיבור הקיימת במכשיר הטלפון שלנו כבר כמה שנים טובות ומשתפרת כל העת, כולל בעברית, מאפשרת לנו להכתיב תוכן (כמו המאמר הזה) באמצעות דיבור. כולל מתן פקודות לשים סימני פיסוק, לרדת שורה וכדומה. זה יותר מהיר ומדויק מאשר להקליד את הטקסט.
זה קוּל!
חיפוש קולי עומד לשנות את כל עולם קידום האתרים (SEO) מאחר שחיפוש קולי נעשה בשפה טבעית ותוך שימוש במילים רבות יותר מאשר בחיפוש המבוצע בכתב (שמקלידים אותו).
כבר היום כ-50% משתמשים בחיפוש קולי ולמעלה מ-60% התנסו בשנה האחרונה בעוזרת קולית. אנחנו מבקשים מהעוזרת הקולית לנגן את המוזיקה שלנו, שואלים אותה איזה שיר זה? (שזאם ואחרים עושים למעשה זיהוי קולי) ומבקשים ממנה לחייג עבורנו כדי לא להתעסק עם הטלפון בנהיגה. בעתי הלא רחוק אפשר יהיה לבקש מהעוזרת האישית הקולית שלכם לבצע עבורנו משימות יומיומיות. לחפש מסמך, לרכז נתונים ממקורות שונים ולהציג אותם בטבלה עם גרף, להזמין תור אצל הספר, לצלצל לקבל שירות מחברה שהיום, גם מבזבז לנו זמן יקר בהמתנה לקבל שירות ובהרבה מקרים גם מעצבן אותנו. או אולי לנהל מו”מ עם כמה חברות ולמצוא עבורכם את ההצעה הכי טובה, או לבקש מהעוזרת האישית לרשום את הילד לחוג.
העתיד הוא כזה שהעוזרת האישית תדאג לעזור לנו גם בלי שנבקש ממנה עזרה. עבור עוזרות אישיות דוגמת אלקסה (שאולי עוד שנה-שנתיים תדע גם עברית) מפותחות אפליקציות קוליות שנקראות Alexa skills לביצוע פעולות יומיומיות שונות במגוון שלם של נושאים.
מנכ"ל גוגל מדגים את עתיד העוזרת האישית ב- 2018
שמושים עסקיים קוליים
פעולות רבות שמבוצעות כיום מול עסקים בטלפון, באפליקציות ובאתרי אינטרנט, כגון פעולות מול הבנק ושירותי הבריאות יוכלו להתבצע באמצעות בקשה קולית שלנו ויפתחו תהליכים אוטומטיים בצד של נותן השירות כדי לספק לנו חווית לקוח טובה ופרסונלית יותר.
משימות מסוימות העוזרת האישית שלנו תוכל לבצע עבורנו מקצה לקצה. הקול שלנו הוא גם אמצעי זיהוי ביומטרי ברמה גבוה (עד שיוכח אחרת). עוזרות קוליות עסקיות יחליפו את רוב המוקדנים בפעולות שילכו ויהיו מורכבות. שיחה עם מוקד תהיה משימה שעוזרת אישית קולית תוכל לבצע במקומנו. אפליקציות ייחודיות יפותחו לצרכים ספציפיים ולשימושים פנים ארגוניים. כשהחזון הוא שהעוזרת האישית שלי תדבר ישירות עם הבינה המלאכותית של הארגון איתו אני רוצה לתקשר.
חברת המחקר גרטנר טוענת כי העתיד הוא שרכיבים או רשתות של רכיבים יהיו עצמאיים ויוכלו לקבל החלטות קניה עצמאיות עבורנו.
שימושים מיוחדים לכבדי שמיעה
גוגל עובדת על פרוייקט נוסף שנקרא Live Transcribe להנגשת שיחה בין אנשים הסובלים מקושי בשמיעה ובדיבור. ראו קישור למטה.
דאטה חדשה
חיפוש קולי ייצר הרבה מאוד דאטה חדשה שאפשר יהיה לקבל ממנה תובנות לגבי הלקוח והצרכים שלו. לדוגמא: זיהוי מבטא, סגנון דיבור, אוצר מילים, מין, גיל (מבוגר, צעיר), תרבות וכמובן מידע מועשר לגבי החיפושים שלקוחות עושים כי הם יבוטאו בשפה טבעית ולא במילות מפתח קצרות.
האתגרים שחיפוש קולי מביא איתו קשורים במישרין באיכות הדאטה הארגונית על מנת לספק ללקוחות תשובות נכונות, מדויקות ומלאות. מידע שגוי במערכת הארגונית יציף תשובה לא נכונה ללקוח.
על מנת להיות זמינות לקבל מאיתנו פקודות קוליות, הרמקולים החכמים הפזורים בבית והעוזרות האישיות בסמארטפונים חייבות “להאזין” כל הזמן, זה יוצר חששות ואתגרי פרטיות.
אתגרים נוספים
תופעה מעניינת נוספת היא שככל שהעוזרות האישיות יהיו אנושיות יותר כך מטשטש הגבול בין אנושי ללא אנושי. בסרט הקולנוע Her מ-2013 גיבור הסיפור מתאהב בעוזרת האישית שלו. פרופסור ורד אהרונסון, חוקרת רובוטיקה ומייסדת המרכז לעיבוד שפה במכללת אפקה, אומרת כי זה תרחיש אפשרי ולאו דווקא רע.
מה העתיד של העוזרות האישיות? כנראה עתיד שלא נצטרך להגיד להן מה אנחנו רוצים. הן יוכלו לקרוא את המחשבות שלנו. טוני סטארק האמיתי, אילון מאסק כבר עובד על הדבר הבא וזה לחבר את המוח שלנו ישירות למכשירים הדיגיטאלים.
בינתיים “נסתפק” בשילוב של עוזרת אישית עם ChatGPT.
לקריאה נוספת
קרדיט תמונה ראשית: Francis Barraud. שימש כלוגו של RCA, VICTOR, JVC
סטטיסטיקה עדכנית על השימושים הדיגיטליים ב-voice
פרויקט First Sounds לשחזור ההקלטות הראשונות
הסבר וסרטון על חלוצי ההקלטות הראשונות: סקוט, ברלינר ואדיסון
ההיסטוריה של זיהוי דיבור
טרנדים בעולם החיפוש הקולי
ראיון עם פרופ’ ורד אהרונסון, גלובס
היוזמה של אילון מסק לחבר את המוח למחשבים
כתבה בכלכליסט על פרויקט הדיגיטציה של ארכיון רשות השידור
כתבה ב-YNET על פרויקט Live Transcribe
שיתוף
Sella Yoffe
Email Deliverability & Email Marketing Expert
working with global email senders, startups, and ESPs to improve their deliverability and email authentication
Podcast host & Blogger @ CRM.BUZZ & EmailGeeks.Show