7-65 盗用検出ソフトの裏をかく方法

2020年11月9日掲載

白楽の意図:盗用検出ソフトですべての盗用を一網打尽に検出できると信じている人が多いが、盗用検出ソフトを妄信してはいけない。「2020年10月のUCAECHO.NET」論文を紹介するが、著者不記載なので内容を妄信してはいけない(ウン?)。

ーーーーーーー
目次(クリックすると内部リンク先に飛びます)
1.論文概要
2.書誌情報と著者
3.日本語の予備解説
4.論文内容
5.関連情報
6.白楽の感想
8.コメント
ーーーーーーー

【注意】「論文を読んで」は、全文翻訳ではありません。ポイントのみの紹介で、白楽の色に染め直してあります。

●1.【論文概要】

白楽注:本論文は学術論文ではなくウェブ記事である。本ブログでは統一的な名称にするため論文と書いた。

論文に概要がないので、省略。

●2.【書誌情報と著者】

★書誌情報

★著者

不記載

UCAの人々(People of UCA)。出典

●3.【日本語の予備解説】

★2020年10月24日確認:Turnitin Japan社のサイト

出典 → ココ、(保存版

誠実性を備えた教育

Turnitinは独自の技術と世界有数の学術出版社とのパートナーシップにより信頼性の高い剽窃防止ソリューションが提供できます。

学術・研究不正行為を未然に防ぐために

自らの頭で考えることなく、既存の文章を正しく流用せずにレポートや論文を作成する行為を防ぎ、誠実に課題に取り組むためのの(白楽注:原文のママ)指導は大切です。 システム上にアップロードされた論文をインターネット、学術雑誌、学生のレポートを含む、世界最大の学術フルテキストデータベースと照合し、その類似率によって学術・研究論文における不正行為の疑いが見られるコンテンツを管理します。

知的財産の保護

書かれた作品、プログラミングコード、研究論文、学生のレポートおけるオリジナリティをチェックするツールでり(白楽注:原文のママ)、教育機関の信用を保護します。Turnitinは、アカデミック・インテグリティー(学術的な誠実さ)の文化を促進するために常に革新を行っています。

●4.【論文内容】

本論文は学術論文ではなくウェブ記事である。本ブログでは統一的な名称にするため論文と書いた。

方法論の記述はなく、いきなり、本文から入る。

ーーー論文の本文は以下から開始

《1》序論 

教授が好んで、学生が恐れているツールはナ~ンダ?

正解! そう、ターンイットイン (Turnitin)。

ターンイットインは、学生が提出したレポートや論文の文章の盗用を検出する盗用検出ソフトなので、教授はターンイットインが大好きです。

同じ理由で、学生は盗用が発覚すると、単位取消は勿論、停学や退学などの処罰を受ける可能性があるため、学生はターンイットインを恐れる。

ターンイットイン販売会社はすべての盗用を一網打尽に検出しようと日夜、研究開発している。

そして、学生たちは「ターンイットインは無敵」だと信じてきた。

が、ここだけの話、実のところ、ターンイットイン・アルゴリズムの裏をかく方法はある。何年にもわたって、アルゴリズムを打ち負かす方法を考えてきた学生らがいた。そんなヒマとチエがあるなら、本業の勉強を励んだ方がズッといいと思うが、これも、人間のサガである。

「なぜ、裏をかくのか。そこに、ターンイットインがあるからだ」(ジョージ・マロリー?)

《2》ターンイットインの機能 

ターンイットインは盗用検出ソフトで、当初は学術ツールとしてスタートした。現在は商用利用が可能で、プロフィールを作成すれば誰でも利用できる。その結果、学生はサービスに簡単にアクセスできる。

「彼を知らずして、己を知れば、一たび勝ちて、一たび負く。彼を知らず、己を知らざれば戦うごとに必ず敗る」(孫子)とあるように、ターンイットインに勝つには、ターンイットインを知ることが大事である。それで、まず、このサービスにアクセスする。

ターンイットインはあなたが提出したレポート・論文を、利用可能なすべてのインターネットページ、書籍・学術誌のオンライン抜粋、他学生の古い学術論文、と比較する。教授は、ターンイットインを使ってレポートや論文を確認するよう学生に指示することもある。

ターンイットインは、提出したレポート・論文中のオリジナルな文章の割合と他人の文章に類似した文章の割合を分析し提示する。この時、他人の文章に類似した文章の出典、つまり、被盗用文献も示す。

ただし、他人の文章に類似していても、盗用ではなく、偶然、いくつかの単語が同じになった場合もある。この場合、無実である。しかし、どう証明するか、・・・。

《3》ターンイットインの裏をかく方法 

ターンイットインをダマすことは可能か?

はい、可能です。

ターンイットインは賢いソフトだが、あなたがもっと賢ければ、ダマせる。学生たちは、ターンイットインをダマすためのいろいろ方法を考えた。その方法には、実際にダマせるのもあれば、ダマせないのもある。

【ダマせない方法】

1.シソーラス(類語辞典)の使用

シソーラス(類語辞典)を使って、単語を別の同義語に置き換えるのは、考えとしては賢明だが、実際にはダマせない。

ターンイットインは、同義語を検出できるの点がセールスポイントになっている。だから、文章中の単語を別の同義語に置き換えても、盗用が検出されて、あなたは処罰される。 Copyscapeのような盗用検出ソフトにはこの機能はない。

2.キャラクター・スワッピング

これは、学生がソフトを打ち負かそうとして使うトリックの1つで、文章中の単語を、外国語の似た単語(英語をドイツ語など)に置き換える方法だ。

残念ながら、同義語と同じように、ターンイットインは外国語の類義語集も開発している。英語の単語を外国語の似た単語をに置き換えても、ターンイットインは、一致する単語を見つけてしまう。そして、あなたは処罰される。

3.ホワイト・テキストの追加

学生は、既定の単語数に達するように空白文字(white characters)を加えることを考えた。文章の増量ですね。

空白文字とは何か? 空白なので示しにくいが、カッコ内に空白文字を示した。 → 「ㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤ」。

ターンイットインは空白文字は単語の長さとして異常なため、このトリックを検出する。フラグを付け注意を喚起する。そして、やはり、あなたは処罰されるでしょう。

【ダマせる方法】

1.言い換え(Paraphrase)

シソーラス(類語辞典)を使って、単語を別の同義語に置き換える程度では盗用が発覚してしまう。言い換えは、元の資料の数文節を何度も読んで、元の資料中の単語とは別の単語を使ってもう一度書くことだ。ターンイットインは、言い換えられた文章を認識できない。

この場合、元の資料として質の高いエッセイや論文を選び、それを注意深く何度も読むことが必須である。その後、注意深く、その内容を自分の言葉で書く。あなたが注意深ければ、盗用検出ソフトは言い換えられた文章を識別できない。

ただ、これは「言い換え盗用(paraphrase plagiarism、paraphrasing plagiarism)」に該当するので、発覚すれば、あなたは処罰される。 → 2‐2 盗用のすべて | 白楽の研究者倫理

2.フォーマットの変更

ターンイットインはPDFファイルを読み取れない。

それで、PDFファイルにしたレポートを教授に提出する。教授はあなたのレポートを問題なく読める。ただし、このトリックは、教授がWord形式でレポートを提出するよう指示したら使えない。

ターンイットインは画像も読み取れない。

あなたが書いたオリジナルの文章に盗用した画像を加える方法だ。ただし、ターンイットインは空のドキュメントを読み取ることができないので、レポート全体を画像に変換してはいけない。もちろん、盗用が発覚すれば、あなたは処罰されるでしょう。 → 2‐2 盗用のすべて | 白楽の研究者倫理

3.代行業者に依頼

ターンイットインの裏をかく方法を探すのに疲れたら、専門の論文代行業者(Academic Writing Service)に依頼する方法がある。これらの論文代行業者にお金を払って、レポート・論文の執筆に多くの経験と技術を持つ専門家に作成してもらう方法だ。

論文代行業者は、あなたのレポート・論文を書き、盗用検出ソフトを使って盗用検出ソフトにひっかからないようチェックし、あなたの提出期限に間に合うように完成品を送ってくる。

この論文代行の助けを借りて、あなたはオリジナルで質の高いレポート・論文を提出し、あなたの教授を感動させることができる。

論文代行社の執筆者たちは、ターンイットインを使い、あなたが盗用に巻き込まれることなく安全で確実に、優れたレポート・論文をあなたに提供する。

ただ、もちろん、論文代行に依頼したレポート・論文ということがバレれば、あなたは処罰されるでしょう。

●5.【関連情報】

省略。

●6.【白楽の感想】

《1》多くの人は盗用を知らなさすぎる 

本論文の盗用は基本的に「逐語盗用」を対象にしている。盗用検出ソフトのアルゴリズムがその方針だからだ。

しかし、盗用には13種類以上もあることを、多くの人は知らない。「逐語盗用」は13種類のうちの1つでしかない。 → 2‐2 盗用のすべて | 白楽の研究者倫理

「逐語盗用」「全文盗用」以外は盗用検出ソフトで検出できない(盗用状況に依存するが・・・)。

ヴロニプラーク・ウィキ(VroniPlag Wiki)を含め、プロの盗用ハンターは盗用検出ソフトを補助的にしか使っていない。 → ヴロニプラーク・ウィキ(VroniPlag Wiki) | 白楽の研究者倫理

《2》イタチゴッコ 

盗用検出ツールの裏をかく方法の記事は結構多い。当たりまえだが、どれも似たり寄ったりの内容である。

しかし、本記事程度のことも知らない教員・学生が結構いる。盗用検出ツールを使う人は盗用検出ツールの限界を知っておきべきでしょう。

なお、盗用検出ツールを開発すれば、抜け道を探す人が出てくる。世の中イタチゴッコです。でもお蔭で、ツールの質が向上してきた。同時に、悪知恵の質も向上してきた。七転び七起。

一般論として、ほぼ全ての規則・方法は、原始の昔からイタチゴッコで改善してきた。そして、今の人間社会がある。今の社会の欠陥を改善した先に、未來の人間社会がある。

常にツールを過信しないことと、常にアップデートすること。

ネカト規則やネカト対策の欠陥も改善して未來の人間社会につなげて欲しいですね。

ーーーーーー
日本がスポーツ、観光、娯楽を過度に追及する現状は日本の衰退を早め、ギリシャ化を促進する。日本は、40年後に現人口の22%が減少し、今後、飛躍的な経済の発展はない。科学技術と教育を基幹にした堅実・健全で成熟した人間社会をめざすべきだ。科学技術と教育の基本は信頼である。信頼の条件は公正・誠実(integrity)である。人はズルをする。人は過ちを犯す。人は間違える。その前提で、公正・誠実(integrity)を高め維持すべきだ。
ーーーーーー
ブログランキング参加しています。
1日1回、押してネ。↓

ーーーーーー
★記事中の画像は、出典を記載していない場合も白楽の作品ではありません。

●8.【コメント】

注意:お名前は記載されたまま表示されます。誹謗中傷的なコメントは削除します

Subscribe
更新通知を受け取る »
guest
0 コメント
Inline Feedbacks
View all comments