חברת גוגל השיקה את הדור השלישי של Lyria, פתרון מבוסס בינה מלאכותית ליצירת מוזיקה, זוהי הפעם הראשונה שדגם מסדרת Lyria הופך לזמין לקהל הרחב ישירות בתוך ממשק ה-Gemini.
הדורות הקודמים השתמשו, בין היתר, בטכנולוגיית "Speech to Song" ביוטיוב, אך הם היו מוגבלים יותר או זמינים רק לקבוצות נסיינים קטנות (במסגרת ה-Music AI Sandbox). עבור עורכי וידאו ויוצרי תוכן, מדובר בבשורה משמעותית המאפשרת יצירת קטעי מוזיקה מורכבים ומותאמים אישית בתוך שניות.

בניגוד למחוללים פשוטים, Lyria 3 מציעה רמת פירוט מרשימה:

  • יצירת מילים: המודל מסוגל לכתוב מילים לשירים על פי הנחיות טקסטואליות ולבצע אותן בקולות אנושיים להפליא כולל בעברית.
  • שליטה בסגנון ובכלים: המשתמשים יכולים להגדיר במדויק את הז'אנר, הקצב, והכלים הדומיננטיים בטרק. רוצים ג'אז רגוע עם פסנתר או טראנס אנרגטי לסרטון אקסטרים? Lyria 3 אמורה לספק את הסחורה.
  • איכות שמע משופרת: גוגל טוענת כי המודל החדש מייצר צליל "עשיר וטבעי" יותר מקודמיו, עם דגש על המרקם המוזיקלי והמעברים בין חלקי השיר.

אחד האתגרים הגדולים ביותר במוזיקה מבוססת AI הוא נושא זכויות היוצרים והזיהוי של תוכן סינתטי. כאן נכנסת לתמונה טכנולוגיית SynthID של גוגל. מדובר ב"סימן מים" דיגיטלי שמוטמע ישירות בתוך גלי הקול של המוזיקה. הסימן אינו נשמע לאוזן האנושית ואינו פוגע באיכות ההאזנה, אך הוא מאפשר למערכות זיהוי לדעת בוודאות שהקטע נוצר על ידי בינה מלאכותית. זהו צעד קריטי של גוגל בניסיון להרגיע את תעשיית המוזיקה ולמנוע הפצת פייק ניוז קולי.

הודעה לעיתונות באנגלית