ناشرون يقاضون Meta لانتهاك حقوق ملكية كتب لتدريب الذكاء الاصطناعي
- الدعوى تتهم "ميتا" بجمع محتوى من مصادر رقمية مشبوهة، ومعالجة البيانات لإخفاء معلومات حقوق النشر، مما يضر بالملكية الفكرية ويطالب بتعويضات مالية.
- "ميتا" تدافع عن ممارساتها بالاستناد إلى مفهوم "الاستخدام العادل"، وسط نزاع قانوني أوسع يشمل شركات تقنية أخرى مثل OpenAI وAnthropic.
رفعت خمس دور نشر كبرى في الولايات المتحدة، إلى جانب الروائي الأميركي سكوت تورو، دعوى قضائية يوم أمس الثلاثاء أمام المحكمة الفدرالية في مانهاتن، على شركة منصات "ميتا"، تتهمها باستخدام محتوى محمي بحقوق النشر على نطاق واسع في تدريب نماذج الذكاء الاصطناعي الخاصة بها، وعلى رأسها نموذج "لاما".
تضم قائمة المدعين كلّاً من "هاشيت" و"ماكميلان" Macmillan و"ماكغرو هيل" McGraw Hill و"سينجيدج" Cengage و"إلسيفير" Elsevier، وهي مؤسسات تنشط في مجالات النشر الأكاديمي والتعليمي والإنتاج المعرفي. وتستند الدعوى إلى معطياتٍ تفيد بأن الشركة اعتمدت في تدريب نماذجها اللغوية على ملايين النصوص، تشمل كتباً دراسية وأبحاثاً علمية وروايات أدبية، من بينها أعمال معروفة مثل "الفصل الخامس" للكاتبة إن كيه جيميسين و"الروبوت البري" للكاتب بيتر براون.
وتشير وثائق القضية إلى أن عملية التدريب اعتمدت على محتوى جُمع من مصادر رقمية يشتبه في عدم حصولها على تراخيص قانونية، بما في ذلك مواقع يعتقد أنها أتاحت مواد مقرصنة. كذلك تفيد المعطيات بأن النصوص استُخدِمَت في شكلها الكامل أو شبه الكامل داخل أنظمة التدريب، بما سمح للنموذج باستخلاص بنيتها اللغوية والمعرفية وإعادة توظيفها في إنتاج استجاباتٍ نصيةٍ جديدة.
البيانات المستخدمة خضعت لعمليات معالجة تقنيةٍ أزالت أو أخفت معلومات حقوق النشر
وتضيف الدعوى أن البيانات المستخدمة خضعت لعمليات معالجةٍ تقنيةٍ أزالت أو أخفت معلومات حقوق النشر، وهو ما يعتبره المدعون عنصراً محورياً في آلية إدماج المحتوى داخل النظام دون نسبه إلى مصادره الأصلية أو الحصول على تراخيص مسبقة.
وتصنّف القضية ضمن دعوى جماعيةٍ مقترحة، يسعى من خلالها المدعون لتمثيل فئةٍ أوسع من أصحاب الحقوق، مع المطالبة بتعويضات مالية غير محددة القيمة، إلى جانب الاعتراف القانوني بحجم الأضرار التي لحقت بالملكية الفكرية نتيجة هذا الاستخدام.
وتنظر المحكمة الفدرالية في مانهاتن في هذه الدعوى بصفتها إحدى قضايا المنطقة الجنوبية من ولاية نيويورك، ضمن اختصاصها في النزاعات المتعلقة بالملكية الفكرية بين المؤسسات الإعلامية وشركات التكنولوجيا.
وفي المقابل، تؤكد شركة ميتا أن تدريب نماذج الذكاء الاصطناعي على بيانات متاحة يمكن أن يندرج ضمن مفهوم "الاستخدام العادل"، وهو مبدأ قانونيٌ يسمح باستخدام محدود لمواد محمية في سياقاتٍ معينة. وتشير الشركة إلى استعدادها للدفاع عن ممارساتها أمام القضاء.
وتأتي هذه القضية في سياق نزاعٍ قانوني أوسع تشهده صناعة الذكاء الاصطناعي، حيث تواجه شركات تقنية كبرى مثل OpenAI وAnthropic "أوبن إيه آي" و"أنثروبيك"، إلى جانب Meta دعاوى متعددة من ناشرين ومؤلفين وفنانين بشأن استخدام المحتوى المحمي في تدريب النماذج اللغوية، في ظل جدلٍ متصاعد حول حدود الاستخدام القانوني لهذه البيانات داخل أنظمة التعلم الآلي.