"עדיף לבקש סליחה ולא רשות": כך תכננה מטא להשתמש בתכנים מוגנים לאימון AI

מסמכים פנימיים שהוגשו לבית המשפט מראים כיצד עובדי החברה דנו בשימוש בתכנים מוגנים בזכויות יוצרים לאימון מודלים של בינה מלאכותית • בכירים בחברה ראו באתר שהורשע בהפרת זכויות יוצרים מקור חיוני להשגת תוצאות מובילות

צוות ה-AI תכנת את המודלים להימנע מלענות על בקשות לשחזר קטעים מספרים מוכרים. צילום: רויטרס

חברת מטא, בעלת פייסבוק ואינסטגרם, דנה במשך שנים בשימוש ביצירות המוגנות בזכויות יוצרים לצורך אימון מודלים של בינה מלאכותית – כך, לפי פרסום באתר TechCrunch, עולה ממסמכי בית משפט שנחשפו ביום חמישי. המסמכים הוגשו במסגרת תביעה שהגישו הקומיקאית שרה סילברמן, הסופר טא-נהסי קואטס ואחרים, בטענה שהחברה משתמשת ביצירותיהם ללא אישור לאימון מודלים של בינה מלאכותית. מטא טוענת מצדה כי השימוש ביצירות המוגנות בזכויות יוצרים, במיוחד ספרים, נחשב ל"שימוש הוגן" על פי החוק.

בשיחת צ'אט פנימית מפברואר 2023, דנו עובדי מטא באימון מודלים על יצירות שידעו כי הן עלולות להיות בעייתיות מבחינה משפטית. מהנדס מחקר בחברה כתב כי יש "לנסות להשיג את הספרים" ולהעביר את ההחלטה למנהלים הבכירים, תוך שהוא מציין כי עדיף "לבקש סליחה ולא רשות". הוא אף העלה רעיון לרכוש ספרים אלקטרוניים במחירי קמעונאות במקום לחתום על הסכמי רישוי עם מו"לים.

מארק צוקרברג, מייסד ומנכ"ל חברת מטא, צילום: אי.אף.פי

מרוץ ה-AI דוחף לשימוש במקורות בעייתיים

המסמכים חושפים כי בכירים במטא דנו באפשרות להשתמש באתר Libgen - אתר המספק גישה לא חוקית למיליוני ספרים וחומרים אקדמיים מוגנים בזכויות יוצרים - כמקור לאימון מודל ה-Llama של החברה. האתר נתבע מספר פעמים בעבר, נדרש להפסיק את פעילותו ואף נקנס בעשרות מיליוני דולרים על הפרת זכויות יוצרים. למרות זאת, לפי המסמכים, בכירים בחברה ראו באתר זה מקור חיוני להשגת תוצאות מובילות בתחום הבינה המלאכותית.

צוות הבינה המלאכותית של מטא אף תכנת את המודלים להימנע מלענות על שאלות שעלולות לחשוף את מקורות האימון שלהם, כמו בקשות לשחזר קטעים מספרים מוכרים או לחשוף על אילו ספרים אומנו.

במרץ 2024, לפי המסמכים, שקלה הנהלת מטא לעקוף החלטות קודמות ולהשתמש בתכנים נוספים לאימון המודלים שלה, לאחר שהתברר כי מאגרי המידע הפנימיים של החברה - הכוללים פוסטים מפייסבוק ואינסטגרם וטקסטים נוספים מפלטפורמות החברה - אינם מספיקים.

התביעה טוענת כי מטא ערכה השוואה בין ספרים שהושגו באופן לא חוקי לבין אותם ספרים כשהם מוצעים ברישיון חוקי על ידי המו"לים, במטרה להחליט האם כדאי לה כלכלית לרכוש את הרישיונות החוקיים.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר