למה זה טוב? גילינו את העולם המוזר והמעוות של הבינה המלאכותית

חששות לגבי איכות התוכן שמתרגם בין היתר ChatGPT. אילוסטרציה. צילום: GettyImages

חברת התוכנה השנייה בגודלה בעולם והמקדמת הבולטת של שימוש בבינה מלאכותית בחודשים האחרונים, מיקרוסופט, התחילה את השבוע הנוכחי בהודעה על פתיחת כלי הבינה המלאכותית שלה לכולם לאחר חודשים של רשימת המתנה, ועל הדרך הציעה גם שדרוג משמעותי שלהם. אבל אילו כלים היא מציעה ומה אפשר לעשות איתם?

שני שירותים, הרבה אפליקציות

למיקרוסופט יש שני שירותי בינה מלאכותית נפרדים: אחד שמיועד להתכתבות, עונה על שאלות ומבוסס על מודל השפה המתקדם GPT-4, והשני מיועד ליצירת תמונות ומבוסס על Dall-E 2 – שניהם, כמובן, של חברת OpenAI, שבה השקיעה מיקרוסופט בשנתיים האחרונות "מיליארדים רבים" של דולרים - אם כי החברות לא חושפות כמה בדיוק.

שני השירותים אמנם מופעלים ומוצעים על ידי אותם אנשים, אך אין ביניהם שום קשר. שירות יצירת התמונות זמין בשתי דרכים: אתר בשם Bing Image Creator שמיועד לציבור הרחב ויוצר תמונות בודדות, ואתר Microsoft Designer המיועד בעיקר לגרפיקאים ויוצר עיצובים עבור מצגות ואתרים – כלומר כאלו המשלבים תמונות אמיתיות וטקסט במסגרות צבעוניות. שירות הצ'אט, לעומת זאת, זמין במגוון דרכים – בתוך אתר בינג בדפדפן אדג' של מיקרוסופט למחשבים וסמארטפונים, באפליקציית בינג לסמארטפונים, ואפילו מתוך המקלדת של מיקרוסופט לסמארטפונים, SwiftKey.

לפחות תן תשובות נכונות. צ'אט בינה מלאכותית, אילוסטרציה, צילום: GettyImages

רוצים תשובות? תנו מידע!

נתחיל משירות הצ'אט, שזמין לכאורה כמעט בכל דרך שניתן להעלות על הדעת. כתבנו "לכאורה" מכיוון שמיקרוסופט בחרה לנצל את הבינה המלאכותית להתנהלות אנטי-תחרותית לחלוטין, וכך, למרות שהשירות הוא חלק ממנוע החיפוש של החברה, שזמין מכל דפדפן – רק מי שנכנס אליו מהאפליקציות שלה יכול לגשת אליו. מי שמשתמש בכרום, פיירפוקס או דפדפנים אחרים המבוססים על השניים הללו, ייאלץ לעבור קודם לדפדפן אדג' של מיקרוסופט, או לחלופין לאפליקציות בינג או סוויפטקי בסמארטפון. אמנם קיימים תוספים עבור דפדפנים אחרים למחשב שמנסים לעקוף את המגבלה, אך הם אינם מומלצים לשימוש.

בנוסף, השירות אינו עובד במצב הגלישה הפרטית, כך שמשתמשים חייבים לאפשר למיקרוסופט לאגור את כל המידע שלהם כדי לקבל אליו גישה.

מהלך מובן יותר הוא המגבלה על אורך השיחות: עד 5 שאילתות לשיחה שאינה מתבצעת בחיבור לחשבון מיקרוסופט, בעוד שחיבור לחשבון כזה מאריך את השיחה עד 20 שאילתות. כמובן שבכל רגע נתון אפשר להתחיל שיחה חדשה ולאפס את המגבלה – אך מי שרוצה לשאול שאלות המשך על נושא מסוים יעדיף כמובן את האפשרות השנייה.

שאלות ותשובות לשאלות אחרות

גם אם כבר ויתרתם על המידע שלכם לטובת מיקרוסופט, מהניסיונות שלנו עם השירות נראה שהתמורה רחוקה מלהיות שווה את ההקרבה: אמנם, הבינה המלאכותית של בינג מסוגלת כעת לענות על שאילתות בכל השפות המדוברות, כולל עברית – אך היכולת שלה להבין את השאלות בכל השפות לוקה בחסר – וזהו ניסוח עדין מאוד.

כששאלנו אותה מה השעה בקליפורניה, קיבלנו כל כמה שניות תשובה שונה לחלוטין – לפעמים היא ענתה נכון, לפעמים היא נתנה שעה לפי יחס המרה לא נכון (למשל, 3 שעות אחרי שעון ישראל במקום 10) וכמה פעמים היא נתנה תשובות לא קשורות בכלל – למשל, 10:41 כששאלנו את השאלה בשעה 17:58 לפי שעוננו – כלומר, לא רק שיחס ההמרה היה לא נכון, אלא שהתשובה כלל לא היתה שעה עדכנית בשום מקום בעולם באותו רגע.

אחד היתרונות של בינג על פני שימוש ישיר ב-ChatGPT שמפעילה OpenAI עצמה, מלבד אלגוריתם מתקדם יותר, אמור להיות גישה למידע עדכני, בניגוד ל-ChatGPT שמאגר המידע שלו מסתיים בספטמבר 2021, מה שלא קורה בפועל. הסיבה היא, ככל הנראה, שבינג לא מפרש את השאלות כשאלות, אלא "מתרגם" אותן קודם לחיפושים רגילים. כששאלנו "מה השעה בקליפורניה?", הוא הריץ חיפוש על המלים "שעה נוכחית בקליפורניה" והוציא טקסט מתוך התוצאות. כלומר: המנוע לא ניסה לחשב בעצמו את השעה לפי מידע המרת זמנים ביחס למיקומנו, אלא חיפש בארכיון שלו אתרים שבהם יש טקסט שמכיל את מילות השאלה, ואז הציג את התשובה שהיתה באותם אתרים בזמן שבינג סרק אותם – ולא חשוב אם זה היה הרגע, לפני שעה או לפני שנה.

חלום מוזר או אמת של בינה מלאכותית?

דוגמא אחרת ומדהימה עוד יותר היתה כששאלנו את הבינה המלאכותית של מיקרוסופט שאלות שמיועדות לסייע בהחלטות השקעה. "תראה לי את השינויים בשער ביטקוין ב-12 החודשים האחרונים", ביקשנו, בעברית ובאנגלית. בשני המקרים, התשובות שהוצגו לא היו קשורות לשאלה בשום צורה, אלא התבססו על חיפוש המלים "שער ביטקוין 12 חודשים", והכילו טקסטים נוסח "שער הביטקוין השתנה רבות בשנה האחרונה, והגיע לשיאו בספטמבר 2021". מי שטוב בחישובים ישים לב שהנתון הספציפי היחיד כאן הוא מלפני שנה וחצי – הרבה מחוץ לטווח המבוקש, פשוט מכיוון שזה טקסט שחוזר בכתבות רבות שמכילות מידע על השינויים בביטקוין. בינג לא הבין את השאלה, אלא חיפש תשובה נפוצה לחיפוש דומה. אפילו כשביקשנו שער עדכני – שאלה פשוטה מאין כמוה – קיבלנו תוצאות בנות שלושה וארבעה ימים.

לשאלה על הערים המאוכלסות בישראל ענה בינג בתקציר של כתבה מאתר מתחרה, שמלבד העובדה שאינה עדכנית, בינג גם לקח ממנה נתונים שאינם עונים על השאלה הספציפית ששאלנו – רשימה של 16 ערים גדולות שמהוות יחדיו 44% מאוכלוסיית המדינה, במקום מספרי התושבים בהן כפי שציפינו לקבל.

ניסינו גם לקבל מבינג עזרה בקניות, וביקשנו ממנו למצוא עבורנו מחשב נייד עם מעבד מסדרת Ryzen 6000 במחיר של פחות מ-5,000 שקל. התוצאות הוכיחו שוב שבינג לא מבין את השאלות, אלא פשוט מחפש טקסט דומה: שתי התוצאות העליונות היו מאתר שאין בו כלל מחירים, אלא רק מפרטים של דגמים שחברת דל מייבאת לישראל; ושתי התוצאות האחרות שלחו אותנו לאתר אייבורי לחפש מחשבים עם מעבדי Ryzen 5 5600 – דגם שונה לחלוטין מזה שחיפשנו.

ההצדקה האפשרית היחידה להשתמש בכל זאת בבינה המלאכותית של מיקרוסופט היא שבניגוד לשירותים מתחרים רבים, בינג מציג מקורות, כך שאפשר להיכנס אליהם ולבדוק אם הטקסט שהוא ניסח לפיהם נכון או עדכני. מצד שני, את אותו דבר אפשר לעשות בחיפוש רגיל – בשביל זה לא צריך בינה מלאכותית.

העולם המוזר של הבינה המלאכותית

צייר לי עולם בלי היגיון

ואם הבינה המלאכותית הטקסטואלית של מיקרוסופט עובדת באופן מוזר, זו שמיועדת ליצור תמונות גרועה אף יותר.

ראשית, היא דורשת, בנוסף לשימוש בדפדפן אדג' של מיקרוסופט, גם חשבון בשירותי החברה. היא מעניקה לכל משתמש 100 קרדיטים לעיבוד תמונות "מהיר" ואחרי ניצול שלהן צריך לבחור בין הסתפקות בקצב איטי יותר לתשלום על קרדיטים נוספים.

כדי להבטיח שלא תשתמשו בה לרעה (ושלא תרצו להשתמש בה בכלל), הגבילה מיקרוסופט את האפשרויות באופן בלתי פרופורציונלי: לא רק שהשירות חסם אותנו מליצור אפילו קריקטורות (!) של אנשים מפורסמים כמו אילון מאסק או בנימין נתניהו, הוא גם לא היה מסוגל לצייר עצמים עם קווי מתאר ברורים למדי: כשביקשנו ממנו לצייר את צומת עזריאלי בתל אביב חסומה על ידי קורקינטים חשמליים, הוא לא הצליח לצייר את מגדלי עזריאלי המאוד ייחודיים בנוף, צייר ברוב הניסיונות קטנועים במקום קורקינטים, כשברובם הם מחוברים אחד לשני עם משטחי רגליים באורך של כ-20 ס"מ בלבד. ניסינו תיאור בסיסי אף יותר – "פנקייקים עם חריטה של מגן דוד" – וקיבלנו בעיקר תמונות של פנקייקים עם מגן שלמה (זה עם חמשת הקודקודים).

פנקייקים עם מגן דוד (שלמה) לפי הבינה המלאכותית

סיכום – המשחק לא נגמר, וספק אם בכלל התחיל

כל זה מלמד אותנו שלמרות הבאזז האדיר סביב בינה מלאכותית, המצב שלה כרגע לא רק שלא בשל, אלא אפילו לא בוסר. מדובר בעובר שעדיין לא קיבל צורה של יצור חי, עם ידיים, רגליים וראש. לכאורה אפשר לשאול את המנועים הללו שאלות ולקבל תשובות - אבל רמת האמינות שלהם קרובה לאפס, וחיפוש רגיל של אותם דברים נותן תשובות ברורות ואמינות הרבה יותר.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר

המירוץ לאולימפיאדה: מהמיונים להישגים

המאמץ, ההתמודדות וההצלחה: הדרך של נבחרות ישראל במדעים לאולימפיאדות הבינלאומיות

בשיתוף מרכז מדעני העתיד