אמזון עוקפת מימין: הכירו את Nova, ה-AI החדש שלה

פרומפט - ותוצאה. צילום: מתוך ערוץ היוטיוב Amazon Web Services

אמזון נחושה להציב את עצמה בחזית ה-AI: חטיבת המחשוב בענן של החברה (AWS) הכריזה אתמול (שלישי) בכנס re:Invent בלאס וגאס על משפחה חדשה של מודלים של בינה מלאכותית בשם Nova. המשפחה כוללת ארבעה מודלים לעיבוד טקסט - Micro, Lite, Pro ו-Premier, כאשר השלושה הראשונים זמינים כבר עכשיו ללקוחות AWS, והאחרון צפוי להגיע בתחילת 2025.

"המשכנו לעבוד על המודלים המתקדמים שלנו", אמר מנכ"ל אמזון אנדי ג'אסי במהלך הכנס. "המודלים האלה עשו התקדמות עצומה במהלך ארבעה עד חמישה חודשים האחרונים. וחשבנו שאם אנחנו מוצאים בהם ערך, כנראה שגם אתם תמצאו".

ניתוח של 225 אלף מילים

המודלים החדשים, המותאמים ל-15 שפות (אך בעיקר באנגלית), מציעים יכולות שונות: המודל Micro מיועד לעיבוד טקסט בלבד, אך מציע את המהירות הגבוהה ביותר בסדרה. הוא מסוגל לעבד עד כ-100 אלף מילים ברצף. המודלים המתקדמים יותר - Lite ו-Pro - יכולים לנתח עד 225 אלף מילים, 15 אלף שורות קוד או 30 דקות של סרטון וידאו. על פי הודעת החברה, בתחילת 2025 יורחבו היכולות של חלק מהמודלים כך שיוכלו לעבד למעלה משני מיליון טוקנים.

המודל Premier מיועד למשימות מורכבות במיוחד, ולדברי החברה הוא מתאים במיוחד ליצירת מודלים מותאמים אישית. המודלים Pro ו-Premier, כמו גם Lite, מסוגלים לנתח טקסט, תמונות ווידאו, ומתאימים למשימות כמו עיבוד מסמכים וסיכום תרשימים, פגישות ודיאגרמות.

סרטונים באורך שש שניות

לצד המודלים לעיבוד טקסט, השיקה אמזון גם את Nova Canvas ליצירת תמונות ו-Nova Reel ליצירת סרטוני וידאו. Nova Canvas מאפשר ליצור ולערוך תמונות באמצעות הנחיות טקסטואליות, כולל הסרת רקעים ושליטה בסכמות צבעים ומבנה התמונה.

Nova Reel מסוגל ליצור סרטונים באורך של עד שש שניות על פי הנחיות טקסטואליות או תמונות לדוגמה, עם אפשרות לשליטה בתנועות המצלמה, כולל צילומי פנורמה, סיבובים ב-360 מעלות וזום. יצירת סרטון בן שש שניות אורכת כשלוש דקות, ולדברי החברה, בקרוב תושק גרסה שתאפשר יצירת סרטונים ארוכים יותר - באורך של עד שתי דקות.

מאבק בפייק

המודלים החדשים זמינים בפלטפורמת AWS Bedrock, שם יכולים לקוחות החברה לבצע אימון נוסף שלהם על טקסט, תמונות ווידאו. לדברי ג'אסי, המודלים הם מהמהירים והזולים ביותר להפעלה בקטגוריה שלהם. החברה התחייבה להגן משפטית על לקוחותיה במקרה שהמודלים ייצרו תוכן שיתברר כהעתק מדויק של יצירה המוגנת בזכויות יוצרים.

בהיבט האבטחה, המודלים החדשים כוללים אמצעי בטיחות מובנים, כולל סימני מים ובקרת תוכן, במטרה למנוע יצירת תוכן מזיק. "אנחנו מנסים להגביל את היצירה של תוכן מזיק", הדגיש ג'אסי. החברה הוסיפה כי Nova מרחיבה את אמצעי הבטיחות שלה כדי להילחם בהפצת מידע כוזב ותכנים מסוכנים אחרים.

ומה הלאה?

אמזון כבר מתכננת את הדור הבא: החברה צפויה להשיק ברבעון הראשון של 2025 מודל להמרת דיבור לדיבור, שיוכל לזהות ולהבין רמזים מילוליים ולא מילוליים, כמו טון ומקצב, ולהפיק קולות טבעיים ו"דמויי אדם". באמצע 2025 מתוכנן להגיע מודל מתקדם עוד יותר, שיוכל להמיר כל סוג קלט (טקסט, דיבור, תמונות או וידאו) לכל סוג פלט.

"תוכלו להזין טקסט, דיבור, תמונות או וידאו ולקבל פלט בצורת טקסט, דיבור, תמונות או וידאו", הסביר ג'אסי. "זה העתיד של האופן שבו מודלים מתקדמים ייבנו ויצרכו".

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו