ネットサービス
ByJohann Dreo
ネット上の世界で相手を罵倒したり嫌がらせをする迷惑行為は世界中で行われているという実態があり、インターネット百科事典のWikipediaの中でも個人に対するハラスメント行為があとを絶ちません。状況を問題視しているウィキメディア財団は調査チームを組織し、Alphabet傘下のインキュベーター(起業支援事業者)である﹁Jigsaw﹂と協力して実態の調査に乗り出しました。
Algorithms and insults: Scaling up our understanding of harassment on Wikipedia ? Wikimedia Blog
https://blog.wikimedia.org/2017/02/07/scaling-understanding-of-harassment/
オンライン辞典のWikipediaでは、誰もが中身を編集できる﹁編集者﹂になって内容を更新することが可能です。それぞれの記事の中には他の編集者と議論を行うページが用意されており、中身に関する意見を交換することができます。しかし、このページは必ずしも良心によって書き込まれているとは限らず、中には個人に対する中傷や嫌がらせとしか思えない内容が多く見受けられるとのこと。
Wikipedia上の﹁会話﹂ページ内で、30日間に行われた投稿や編集のうち、攻撃性のない用語(黒いドット)は16万4102語だったのに対し、攻撃的な用語(赤)は573語、攻撃的であったものの取り消し・消去された用語(グレー)は519語で、合計1092語だったとのこと。しかし、実際のハラスメント行為の実情はもっと根深いものがあるとされています。
ByHoshi Ludwig
ウィキメディア財団は2016年初頭から、Jigsawと協力してWikipedia上におけるハラスメント行為の実態についての調査を進めてきたとのこと。両者は、コンピューターアルゴリズムを開発することで、会話ページにおける書き込み内容を自動で分析することを目指してきました。
開発にあたっては、機械学習技術を用いることで認識精度の向上を図ってきたとのこと。10万件のコメントをアルゴリズムに学習させると同時に、4000人のクラウドワーカーに100万件の注釈コメントについてそれがハラスメントにあたるか否かの判定を行わせ、その結果をアルゴリズムの学習に反映させるというプロセスを行ったそうです。
﹁Wikipedia上での嫌がらせ﹂をアルゴリズムを使って調査、その結果わかったこととは?
![](https://i.gzn.jp/img/2017/02/13/harassment-wikipedia/00.jpg)
![](https://i.gzn.jp/img/2017/02/13/harassment-wikipedia/01_m.png)
ちなみに、この時に用いられたデータセットは以下のとおりfigshareで公開されているので、自由にダウンロードして活用することが可能です。 Wikipedia Talk
![](https://i.gzn.jp/img/2017/02/13/harassment-wikipedia/snap8695.png)
![](https://i.gzn.jp/img/2017/02/13/harassment-wikipedia/02_m.png)
この記事のタイトルとURLをコピーする
・関連記事
Wikipediaは15年にもわたる編集合戦の末に記述内容が次第に中立になりつつあることが研究で判明 - GIGAZINE
Wikipediaがイギリスで最も古いタブロイド紙「Daily Mail」を「信頼できない情報源」にする - GIGAZINE
Wikipediaの舞台裏「Wikipediaの管理者」とは? - GIGAZINE
Wikipediaはいかに改竄・ねつ造など荒らし行為を駆逐し続けてきたのか? - GIGAZINE
Wikipediaを悩ませる「なりすまし投稿」とその黒幕ステマ会社「Wiki-PR」社とは? - GIGAZINE
Wikipediaで編集合戦が行われている記事主要言語別トップ10 - GIGAZINE
・関連コンテンツ