هوش مصنوعی
تحقیقات درباره هوش مصنوعی

استفاده بی‌اجازه از دویست‌هزار کتاب برای آموزش هوش مصنوعی

سرفصل‌های مقاله

تقریبا از 200.000 جلد کتاب توسط کمپانی‌های بزرگ هوش مصنوعی استفاده شده تا آن‌ها از طریق این کتاب‌ها به آموزش هوش مصنوعی بپردازند. اما مشکل چیست؟ این‌که نویسندگان هیچ‌کدام از این کتاب‌ها در جریان این موضوع نبوده‌اند و از آن‌ها اجازه گرفته نشده است!

این سیستم Book3 نام دارد و مجموعه داده‌هایش را از هزاران کتاب الکترونیکی دزدیده‌شده در تمام ژانرها استخراج کرده است، از کتاب‌های اروتیک گرفته تا کتب شعر و داستان‌های کلاسیک.

Books از طریق این داده‌های سرقت‌شده به سیستم‌های هوش مصنوعی مولد در یادگیری نحوه برقراری ارتباط و تبادل اطلاعات کمک می‌کند.

برخی از متن‌های آموزشی هوش مصنوعی را می‌توان از مقالاتی که در اینترنت ارسال می‌شوند استخراج کرد، اما هوش مصنوعی با کیفیت بالا، به متنی با کیفیت بالا مانند کتاب‌ نیاز دارد تا زبان خود را از آن جذب کند. سیستم Book3 همین حالا هم موضوع چندین شکایت قانونی علیه شرکت‌ «متا» و سایر شرکت‌هایی است که از این سیستم برای آموزش هوش مصنوعی استفاده می‌کنند.

حالا به لطف پایگاه داده‌ای که از Book3 استخراج و هفته گذشته توسط The Atlantic منتشر شد، نویسندگان می‌توانند ببینند که آیا کتاب‌های آن‌ها به طور خاص برای آموزش این سیستم‌های هوش مصنوعی استفاده می‌شود یا خیر. و بسیاری از نویسندگان اکنون خوشحال نیستند.

آموزش هوش مصنوعی بدون اجازه

آموزش
آموزش هوش مصنوعی

«ماری چوی» نویسنده‌ای که به‌تازگی فهمیده بود از کار او بدون اجازه برای آموزش هوش مصنوعی استفاده شده، در شبکه‌های اجتماعی خود نوشت: «کاملا دلخور و کله‌خرابم. عصبانی‌ام و در عین حال احساس درماندگی می‌کنم. خشمگینم، می‌خواهم برای حقم بجنگم، اما خسته هم هستم.»

«چوی» که اولین رمانش با نام «تماس اضطراری» در پایگاه داده Book3 ظاهر شده، احساسات خود را در ایمیلی بیشتر توضیح داد. این کتاب که در مورد یک زن جوان کره‌ای-آمریکایی در حال جستجوی یک رابطه جدید است، «عمقیا شخصی» بود و در ابتدا به چوی گفته شد که داستان او «بیش از حد ساکت و آرام» است. اما این کتاب بعدا تبدیل به یکی از پرفروش‌ترین‌های نیویورک‌تایمز شد و مخاطبانی را در سراسر جهان پیدا کرد.

چوی اعتقاد دارد تبدیل کردن تمام احساسات عمیق و پیچیده یک کتاب به تعدادی داده صفرویکی برای آموزش هوش مصنوعی، تمام ارزش‌های کتاب را از بین می‌برد و در عین حال اجحاف بزرگی در حق نویسنده، ناشر و حتی خوانندگان کتاب است.

«مین جین لی» نویسنده رمان‌های «پاچینکو» و «غذای رایگان برای میلیونرها» نیز افکار مشابهی را در شبکه‌های اجتماعی بیان کرد و صراحتا استفاده از کتاب‌هایش توسط هوش مصنوعی را «دزدی» خواند.

او گفت: «من سه دهه از عمرم را صرف نوشتن کتاب‌هایم کردم. شرکت‌های بزرگ کار، زمان و خلاقیت من را دزدیدند. داستان‌های مرا دزدیدند. بخشی از وجودم را دزدیدند.»

به گزارش آتلانتیک، «نورا رابرتز» رمان‌نویس پرکار، دارای 206 کتاب است که از تمام آن‌ها در پایگاه داده Book3 استفاده شده است! این عدد بالاترین تعداد کتاب توسط هر نویسنده زنده و پس از ویلیام شکسپیر، دوم است. او پایگاه داده و استفاده از آن توسط شرکت‌های فناوری را «از صفر تا صد اشتباه» نامید.

رابرتز در ادامه می‌گوید:

«ما انسانیم، نویسنده‌ایم و توسط افرادی که می‌خواهند دوباره بدون اجازه یا پرداخت غرامت از کار ما برای نوشتن کتاب، فیلمنامه، مقاله استفاده کنند مورد استثمار قرار می‌گیریم، زیرا این سرقت ارزان و آسان است». 

«نیک شارما» نویسنده کتاب موفق آشپزی «ادویه» از این ماجرا تعجب نکرده است.

او می‌گوید: «من وحشت‌زده‌ام، اما از این‌که مورد سوءاستفاده قرار گرفته‌ام، غافل‌گیر نشدم. بدیهی است که برای استفاده از کارم برای آموزش هوش مصنوعی از من اجازه خواسته نشده است و هیچ غرامتی دریافت نکرده‌ام.»

شارما بعدا در یک ایمیل خطاب به سی‌ان‌ان گفت که هوش مصنوعی اجتناب‌ناپذیر است؛ از این رو غافل‌گیر نشده است. او گفت آن‌چه که ماجرا را ناخوشایند کرد، این است که با کسی در مورد استفاده یا پرداخت تماس گرفته نشد. 

او همچنین افزود: «از این گذشته، تحصیل در ایالات متحده رایگان نیست. معلمان حقوق می‌گیرند و حتی کتاب‌های درسی هم خریداری می‌شود.»

شرکت متا که از Book3 به‌طور گسترده‌ای برای آموزش هوش مصنوعی خود استفاده کرده، تاکنون جوابیه یا بیانیه‌ای در مورد این موضوع نداده است.

سخن‌گوی «بلومبرگ» در بیانیه‌ای خاطرنشان کرد که این شرکت از «تعدادی منابع داده مختلف» از جمله Book3 برای آموزش مدل اولیه BloomberGPT (یک مدل هوش مصنوعی در صنعت مالی) استفاده کرده است. اما او اضافه کرده که بلومبرگ در آینده از Book3 برای آموزش هوش مصنوعی خود استفاده نخواهد کرد.

در عین حال تمام نویسنده‌ها از این‌که کارشان توسط هوش مصنوعی استفاده می‌شود ناراحت نیستند. «جیمز شپل» که از کتاب آکادمیک او در مورد کلیسای کاتولیک مدرن در پایگاه داده استفاده شده است، در رسانه‌های اجتماعی گفت که به این موضوع اهمیتی نمی‌دهد.

شپل نوشت: «من دوست دارم کتابم به هرشکلی خوانده شود. من دوست دارم از کتابم برای آموزش دیگران استفاده شود.»

هوش مصنوعی که در دست شرکت‌های بزرگ است، برای بسیاری از نویسندگان به یک دغدغه مهم تبدیل شده. انجمن نویسندگان آمریکا تابستان امسال اعتصاب کرد که استفاده از هوش مصنوعی در نوشتن فیلم‌ها و برنامه‌های تلویزیونی، محدود شود. 

در طول شش ماه گذشته از ChatGPT برای همه چیز از نوشتن تکالیف مدرسه تا نوشتن گزارش‌های حقوقی استفاده شده است.

نویسندگان در مورد نگرانی‌های خود تنها نیستند. با محبوبیت سیستم‌های هوش مصنوعی متن به تصویر، هنرمندان تجسمی سال گذشته در وضعیت مشابهی قرار گرفتند و متوجه شدند که از آثار آن‌ها برای آموزش هوش مصنوعی بدون اجازه استفاده می‌شود. 

هر دوی این موارد با هم، نگرانی‌ها را در مورد افزایش دسترسی هوش مصنوعی به تمام اشکال هنری برجسته می‌کنند، جایی که حاصل کار گاهی اوقات ممکن است به شدت شخصی یا صمیمی باشد.

بحث‌های مطرح‌شده پیرامون Book3 درست زمانی انجام می‌شود که «جو بایدن» رئیس‌جمهور ایالات متحده، برنامه‌های خود را برای ارائه یک فرمان اجرایی در مورد هوش مصنوعی در پاییز امسال اعلام کرد و گفت که این کشور “راه به سوی نوآوری مسئولانه هوش مصنوعی” را پیش خواهد برد.

با این حال برای نویسندگان، نبردهای دائمی پیرامون هوش مصنوعی و کار آن‌ها می‌تواند فرسوده‌کننده باشد. برای «ماری چوی»، کشف استفاده از کتابش در بحبوحه اعتصاب WGA که در آن هوش مصنوعی موضوعی داغ بود، به موضوعی «سوررئال» تبدیل شد.

او از طریق ایمیل به سی‌ان‌ان گفت: «دلم گرفته بود. واقعا احساس می‌شد که هر دستاورد یا کششی که باید در یک عرصه به دست آید، می‌تواند به راحتی در عرصه‌ی دیگر از بین برود.»

با این حال چوی گفت که می‌داند کتابش در میان هزاران کتاب دیگر، علی‌رغم اهمیتی که برای او دارد، «به‌طور توهین‌آمیزی بی‌اهمیت است».

او اعتقاد دارد بزرگ‌ترین ترس این است که علی‌رغم تمام تلاش‌ها و نگرانی‌ها، سوء‌استفاده از کتاب‌ها توسط هوش مصنوعی موضوعی اجتناب‌ناپذیر به‌نظر می‌رسد.

چوی در این طرز فکر تنها نیست، «رابرتز» هم خواستار اتحاد بین نویسندگان و مخاطبان برای مبارزه با این مسائل شده است.

او می‌گوید: « ما که داستان می‌سازیم باید برای مبارزه با سوءاستفاده از استعداد و کار سخت‌مان متحد شویم. ما باید برای کار خود و کار یکدیگر بایستیم. امیدوارم خوانندگان و مخاطبان در مورد این موضوع حیاتی در کنار ما باشند.»

مهران
مهران