גוגל ממשיכה לקדם את תחום היצירה הוויזואלית עם שני כלים חדשים: Whisk ו-Veo 2. שני הפיתוחים מבוססים על מודל הבינה המלאכותית המתקדם Imagen 3 ומאפשרים יצירת תמונות וסרטונים ברמת דיוק גבוהה, ללא מאמץ וללא צורך בכתיבת תיאורים מסובכים.
Whisk: תמונות בלחיצת כפתור
Whisk, הניסוי החדש של Google Labs, מביא איתו גישה מרעננת: במקום להשתמש בפרומפטים טקסטואליים ארוכים, מעלים תמונות שמשמשות כהשראה ליצירה. רוצים דימוי כמו בסצנה אהובה או בסגנון מסוים? כל מה שצריך זה לשלב כמה תמונות ולתת למערכת לעבוד. למי שמעדיף להפתיע את עצמו, אפשר גם ליצור תכנים בצורה רנדומלית בלחיצת כפתור.
למי שמחפש תוצאות מדויקות יותר, יש אפשרות להוסיף הוראות ותיאורים כדי לחדד את התוצאה. Imagen 3, שעומד מאחורי הכלי, מביא לשיפור משמעותי בתחום: קומפוזיציות מדויקות יותר, צבעים נאמנים למציאות ויכולת טובה לעקוב אחר ההנחיות. הכלי מתאים למגוון רחב של סגנונות - מאיורים מופשטים ועד תמונות ריאליסטיות לחלוטין.
Veo 2: וידאו באיכות מתקדמת
במקביל ל-Whisk, גוגל השיקה את Veo 2, כלי די עוצמתי ליצירת סרטונים שמתחרה מול SORA של OpenAI ששוחרר לפני כמה ימים. הכלי החדש מאפשר להפיק סרטוני וידאו ברזולוציית 4K ובאורך של דקות, עם יכולת דיוק גבוהה בתנועות אנושיות והבנת הפיזיקה שלהן.
Veo 2 שם דגש על שליטה קולנועית. אפשר לבחור זוויות מצלמה, עומק שדה ואפקטים, בדיוק כמו בהפקות מקצועיות. לדוגמה, המשתמש יכול להגדיר "צילום עם עדשת 18 מ"מ" או לבקש "שדה עומק רדוד" כדי להוסיף מראה רך וממוקד לסרטון.
בנוסף, גוגל מטפלת בבעיות נפוצות המוכרות ממודלים מתחרים, כמו תופעות "הזיה" - יצירת אובייקטים לא רלוונטיים או פרטים שגויים. גוגל מיישמת בכלי את טכנולוגיית SynthID, שמספקת סימון בלתי נראה המזהה את התוכן ככזה שנוצר על ידי בינה מלאכותית – מה שמסייע במניעת הפצת מידע שגוי.
והזמינות?
Whisk זמין באופן ניסיוני בארה"ב דרך Google Labs. כלי הווידאו Veo 2 נפתח בהדרגה למשתמשים בפלטפורמת VideoFX של גוגל. בהמשך השנה, צפויה הרחבה גם ל-YouTube Shorts ולפלטפורמות נוספות.
למרות השיפורים הטכנולוגיים, גוגל מבהירה כי הכלים עדיין בשלבי פיתוח מוקדמים. האתגרים קיימים, במיוחד בכל הנוגע לתוצרים מורכבים, אך הפוטנציאל אדיר.
הכתבה פורסמה לראשונה באתר The Verifier
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו