מרוץ הטכנולוגיה של הבינה המלאכותית בשיא כוחו. בחודשים האחרונים, נראה כי גם סטארט-אפים וגם שחקנים מבוססים הפנו את תשומת לבם למחוללי וידאו, שכן ההכרזות בתחום זה ממשיכות לזרום. החדשות האחרונות על השקת Sora של OpenAI עשויות להיות פשוט פורצות דרך, שכן מודל הלמידה העמוק שלה מראה רמה חסרת תקדים של ריאליזם. הכלי עדיין לא זמין לציבור, אבל המקרים שפורסמו זעזעו יוצרים בכל העולם.

לאחר התחרות הממושכת במחוללי טקסט לתמונה, הטכנולוגיה סוף סוף התקדמה מספיק כדי לדמות תנועה וליצור קטעי וידאו קצרים אך ורק מטקסט (מה שנקרא הנחיות). אז, עכשיו מחוללי וידאו הם ה-דבר. רק השנה, Sora מציינת את ההשקה השלישית הדומה ממפתחי הבינה המלאכותית המובילה, בעקבות חדשות מ-Midjourney והכנסת גוגל lumiere.

אז מה כל כך מיוחד בSora? ראשית, בניגוד למתחרים, מודל הטקסט לווידאו הזה יכול לכאורה ליצור סרטונים של עד 60 שניות. כפי שהוסבר והוצג בהכרזה, קליפים שנוצרו כוללים "סצנות מפורטות מאוד, תנועת מצלמה מורכבת ומספר דמויות עם רגשות תוססים." אומרים שהמודל מבין לא רק מה המשתמש מבקש בהנחיה, אלא גם כיצד דברים קיימים ועובדים בעולם הפיזי.

כמובן, זה רחוק מלהיות מושלם, אבל זו גם הפעם הראשונה שאנו עדים לדגם המסוגל לסדר תמונות שונות בתוך קליפ והגדרה אחת.

י

משחקי אור וצל

תר על כן, ככל הנראה, התוכנה יכולה לפרש הנחיות ארוכות, שכן כמה דוגמאות שפורסמו כוללות הנחיות טקסט מפורטות מאוד עם יותר מ-100 מילים. הודות להכשרה המקיפה של Dall-E (שהתוכנה שואלת ממנו מספר טכניקות). כמעט כל הסרטונים שנוצרו על ידי החברה נראים מציאותיים להפליא. כולל תנועה, השתקפויות אור ועוד.

המפתחים לא הזכירו מתי Sora יהיה זמין לקהל הרחב, אך הם ציינו שהם ינקטו תחילה כמה אמצעי בטיחות חשובים. זה כולל עבודה עם מומחי דומיינים בתחומים כמו "מידע מוטעה, תוכן שנאה והטיה" כדי למנוע מאנשים להשתמש לרעה בטכנולוגיה החדשה. כמו כן, ההודעה הבטיחה להעניק גישה לכמה אמנים חזותיים, מעצבים ויוצרי קולנוע. המטרה היא לקבל משוב כיצד לקדם את המודל כך שיוכל להועיל ביותר לאנשי מקצוע יצירתיים.

קישור להכרזה