اسناد جدید دادگاهی در یک پرونده کپیرایت علیه متا تأیید بیشتری به گزارشهای قبلی میدهد که نشان میداد این شرکت مذاکرات با ناشران کتاب برای توافقهای مجوزدهی به منظور تأمین دادههای آموزشی برای مدلهای هوش مصنوعی تولیدی خود را متوقف کرده است.
این پرونده با عنوان Kadrey v. Meta Platforms یکی از بسیاری از پروندههایی است که در سیستم قضایی ایالات متحده مطرح شده و شرکتهای هوش مصنوعی را در مقابل نویسندگان و سایر صاحبان حقوق مالکیت معنوی قرار داده است. در بیشتر این پروندهها، متهمان که شرکتهای هوش مصنوعی هستند، ادعا میکنند که آموزش مدلها با محتوای دارای کپیرایت نوعی «استفاده منصفانه» است، در حالی که شاکیان، صاحبان حقوق کپیرایت، به شدت مخالف این دیدگاه هستند.
اسناد جدید ارائهشده به دادگاه در روز جمعه، که شامل بخشی از متن شهادت کارکنان متا است که توسط وکلای شاکیان در پرونده گرفته شده، نشان میدهد که برخی از کارکنان متا احساس میکردند که مذاکره بر سر مجوزهای دادههای آموزشی برای کتابها ممکن است مقیاسپذیر نباشد.
طبق یکی از متنها، سای چودوری، که مسئول ابتکارات مشارکتی هوش مصنوعی در متا است، اظهار داشت که تماسهای متا با ناشران مختلف با استقبال و علاقهای بسیار کند روبرو شده است.
او گفت: «تمام لیست را به خاطر ندارم، اما به یاد دارم که ما از ابتدا با جستجو در اینترنت یک لیست بلند از ناشران برتر و غیره تهیه کرده بودیم، و بسیاری از تماسهای سرد ما برای برقراری ارتباط پاسخی دریافت نکردند.»
چودوری افزود: «چند مورد بودند که تعامل داشتند، اما تعدادشان زیاد نبود.»
بر اساس متن شهادت، متا در اوایل آوریل ۲۰۲۳ برخی از تلاشهای مربوط به مجوزدهی مرتبط با کتابهای هوش مصنوعی را به دلیل «زمانبندی» و سایر موانع لجستیکی متوقف کرد. چودوری بیان کرد که برخی از ناشران، بهویژه ناشران کتابهای داستانی، در واقع حقوق لازم برای محتوایی که متا در نظر داشت مجوز آن را دریافت کند، نداشتند.
او گفت: «میخواهم اشاره کنم که در دسته کتابهای داستانی، به سرعت از تیم توسعه کسبوکار یاد گرفتیم که بیشتر ناشرانی که با آنها صحبت میکردیم، خودشان نمایندگی میکردند که حقوق لازم برای صدور مجوز دادهها را ندارند. و این امر تعامل با تمام نویسندگان آنها را زمانبر میکرد.»
چودوری در شهادت خود همچنین اشاره کرد که متا حداقل در یک مورد دیگر نیز تلاشهای مربوط به مجوزدهی برای توسعه هوش مصنوعی را متوقف کرده است. او گفت: «من از تلاشهای مجوزدهی دیگری مانند تلاش برای دریافت مجوز از جهانهای سهبعدی از تولیدکنندگان بازی و موتورهای بازی برای تیم تحقیقاتی هوش مصنوعیمان مطلع هستم. و به همان روشی که اینجا برای دادههای داستانی و کتابهای درسی توصیف کردم، ما تعامل بسیار کمی برای حتی شروع مکالمه دریافت کردیم […] در آن مورد، تصمیم گرفتیم یک راهحل خودمان بسازیم.»
وکلای شاکیان، که شامل نویسندگان مشهوری مانند سارا سیلورمن و تانهیسی کوتس میشوند، از زمان طرح این پرونده در دادگاه منطقهای ایالات متحده برای منطقه شمالی کالیفرنیا، بخش سانفرانسیسکو در سال ۲۰۲۳، چندین بار شکایت خود را اصلاح کردهاند. در آخرین شکایت اصلاحشده، وکلای شاکیان ادعا کردهاند که متا، در کنار سایر تخلفات، کتابهای دزدیدهشده را با کتابهای دارای کپیرایت قابل صدور مجوز مقایسه کرده تا تصمیم بگیرد که آیا دنبال توافق مجوز با یک ناشر برود یا خیر.
این شکایت همچنین متا را متهم میکند که از «کتابخانههای سایه» شامل کتابهای الکترونیکی دزدیدهشده برای آموزش چندین مدل هوش مصنوعی شرکت، از جمله مدلهای محبوب Llama، استفاده کرده است. طبق این شکایت، متا ممکن است برخی از این کتابخانهها را از طریق تورنت به دست آورده باشد. تورنت، روشی برای توزیع فایلها در اینترنت، مستلزم آن است که کاربران تورنت فایلهایی که میخواهند دریافت کنند را همزمان آپلود (seed) کنند، که شاکیان ادعا میکنند این عمل نوعی نقض کپیرایت است.
منبع: تککرانچ