مهندسان OpenAI ظاهراً به اشتباه شواهد مهمی که توسط نیویورکتایمز و نشریات دیگر در مورد دادههای آموزش هوش مصنوعی آن جمعآوری شده را حذف کردهاند.
براساس گزارش ورج، تیم حقوقی این نشریات بیش از 150 ساعت از زمان خود را صرف جستجو دادههای آموزشی هوش مصنوعی OpenAI کردهاند. آنها با انجام این کار تلاش داشتند تا دادههایی را پیدا کنند که در آن از مقالات خبری نیویورکتایمز استفاده شده است. بااینحال، دادههای جمعآوری شده به شیوه نامشخصی حذف شدهاند و حتی مشخص نیست که این دادهها دقیقاً چه چیزهایی را شامل میشدند.
در پروندهای که توسط نیویورکتایمز به ثبت رسیده گفته شده که OpenAI به اشتباه خود اعتراف کرده و سپس تلاش داشته تا دادها را بازیابی کند، اما دادههای بازیابی شده «ناقص و غیرقابل اعتماد» بودهاند.
درحالی که وکلای OpenAI پاکشدن دادهها را یک «اشکال» میدانند، اما وکلای نیویورکتایمز خاطرنشان کردهاند که «هیچ دلیل برای باور» حذف عمدی آنها وجود ندارد.
نبرد بین نیویورکتایمز و OpenAI از دسامبر سال گذشته آغاز شد، زمانی که این نشریه ادعا کرد که سازنده ChatGPT و شریک آن، مایکروسافت، برای ساخت ابزارهای هوش مصنوعی خود «از میلیونها مقاله این نشریه» استفاده کردهاند و حالا بهطور مستقیم با محتوای آن در رقابت است.
نیویورکتایمز از OpenAI میخواهد بهخاطر کپیکردن محتوای آن، مسئولیت «میلیاردها دلار خسارت قانونی و واقعی» را بپذیر.
این نشریه ظاهراً تاکنون بیش از 1 میلیون دلار برای مبارزه با OpenAI هزینه کرده است، هزینهای که ناشران کمی میتوانند آن را پرداخت کنند. از سویی دیگر، OpenAI با رسانههای بزرگی از جمله Axel Springer و Vox Media (مالک ورج) قراردادهایی را منعقد کرده است که نشان میدهد بسیاری از ناشران ترجیح میدهند شریک آن باشند تا با OpenAI مبارزه کنند.