كشفت دعوى قضائية كبرى تتعلق بحقوق الطبع والنشر ضد شركة Meta عن مجموعة كبيرة من الاتصالات الداخلية حول خطط الشركة لتطوير نماذج الذكاء الاصطناعي مفتوحة المصدر، Llama، والتي تتضمن مناقشات حول تجنب “التغطية الإعلامية التي تشير إلى أننا استخدمنا مجموعة بيانات نعلم أنها مقرصنة”.
تشير الرسائل، التي كانت جزءًا من سلسلة من المعروضات التي كشفت عنها محكمة في كاليفورنيا، إلى أن شركة Meta استخدمت بيانات محمية بحقوق الطبع والنشر عند تدريب أنظمة الذكاء الاصطناعي الخاصة بها وعملت على إخفائها – بينما كانت تسابق للتغلب على المنافسين مثل OpenAI وMistral. تم الكشف عن أجزاء من الرسائل لأول مرة الأسبوع الماضي.
في رسالة بريد إلكتروني في أكتوبر 2023 إلى باحث Meta AI هوغو توفرون، كتب أحمد الدحل، نائب رئيس Meta للذكاء الاصطناعي التوليدي، أن هدف الشركة “يجب أن يكون GPT4″، في إشارة إلى نموذج اللغة الكبير OpenAI الذي تم الإعلان عنه في مارس 2023. وأضاف الدهلي أنه كان عليه “أن يتعلم كيفية بناء الحدود والفوز بهذا السباق”. ويبدو أن هذه الخطط تضمنت موقع Library Genesis (LibGen) لقرصنة الكتب لتدريب أنظمة الذكاء الاصطناعي الخاصة به.
المصدر