استودیو پست مدرن / شاتر استوک
بر اساس تجزیه و تحلیل بیش از 2 میلیارد پست و نظر در پلت فرم جمع آوری اخبار اجتماعی، بیش از یک نفر از هر هشت کاربر Reddit محتوای سمی ارسال می کنند.
سخنگوی Reddit گفت دانشمند جدید: “مطالعه مورد بحث تحقیقات و بینش خود ما را تایید می کند: اینکه اکثریت قریب به اتفاق محتوا در Reddit سالم است و کاربران تمایل دارند رفتار خود را به طور مثبت مطابق با هنجارهای جامعه تنظیم کنند.” آنها افزودند که برخی از داده ها به 20 سالگی نزدیک می شوند و بنابراین خلاصه نمی کنند که چگونه سیاست های Reddit در مورد گفتار تغییر کرده است.
پست های Reddit برای محتوای سمی اسکن شدند
هند آلمرخی در دانشگاه حمد بن خلیفه در قطر و همکارانش مجموعه دادهای از پستهای ردیت و نظرات آنها را بین سالهای 2005 تا 2020 جمعآوری کردند. آنها به هر کاربر Reddit که در هر یک از 100 محبوبترین سابردیت پست – مشابه انجمنهای موجود در سایت – پست میکرد، نگاه کردند. به عنوان یک منبع فرعی دیگر این فیلتر منجر به در مجموع 2.2 میلیارد پست و نظر از 1.2 میلیون کاربر در بیش از 100000 Subreddit شد.
به طور کلی، حدود 16٪ از افراد در مجموعه داده مسئول پست های سمی و 13٪ برای نظرات سمی بودند. با این حال، این رفتار بسته به جامعه می توانست تغییر کند و تغییر کرد. از هر پنج نفر، چهار نفر، بسته به subredditی که در آن پست میکردند، تغییراتی را در میزان متوسط سمیت در پستهای خود نشان دادند.
برای قضاوت در مورد سمی بودن نظرات، محققان افراد را از طریق یک پلتفرم جمع سپاری استخدام کردند تا سطح سمیت نمونه ای از 10000 پست و نظر را به صورت دستی برچسب گذاری کنند. آلمرخی میگوید که تیم معیارهای بسیار واضحی را در مورد «آنچه که ما آن را بسیار سمی، خفیف سمی و غیرسمی میدانیم» به آنها ارائه کرد. هر نظر حداقل توسط سه کارگر ارزیابی شد.
مرجع مجله: محاسبات PeerJ، DOI: 10.7717/peerj-cs.1059
این الگوریتم 2 درصد از پست ها و 6 درصد از نظرات را بسیار سمی نشان داد. علاوه بر این، 7٪ از پست ها و 11.5٪ از نظرات به طور خفیف سمی بودند و بقیه پست ها و نظرات به عنوان غیر سمی طبقه بندی شدند. پستهای بسیار سمی شامل توهین مستقیم و توهین، پستهای خفیف سمی شامل توهینهای خفیفتر (مانند “محرمانه”) بود، در حالی که پستهای غیرسمی هیچ کدام را نداشتند.
درباره این موضوعات بیشتر بدانید: