7-137 論文工場の真実

2024年1月3日掲載

白楽の意図:白楽は論文工場の実態と問題を深く知りたいと思い、論文を探した。論文タイトルが魅力的だった画像データ公正アナリストのヤナ・クリストファー(Jana Christopher)の「2021年6月のFEBS Lett」論文を読んだ。紹介しよう。

ーーーーーーー
目次(クリックすると内部リンク先に飛びます)
2.クリストファーの「2021年6月のFEBS Lett」論文
7.白楽の感想
8.同じ著者の論文;
9.コメント
ーーーーーーー

【注意】

学術論文ではなくウェブ記事なども、本ブログでは統一的な名称にするために、「論文」と書いている。

「論文を読んで」は、全文翻訳ではありません。

記事では、「論文」のポイントのみを紹介し、白楽の色に染め直し、さらに、理解しやすいように白楽が写真・解説を加えるなど、色々と加工している。

研究者レベルの人が本記事に興味を持ち、研究論文で引用するなら、元論文を読んで元論文を引用した方が良いと思います。ただ、白楽が加えた部分を引用するなら、本記事を引用するしかないですね。

●2.【クリストファーの「2021年6月のFEBS Lett」論文】

★読んだ論文

●【論文内容】

★要約

本論文では、論文工場が作る原稿の「生データ」について議論する。

論文工場が作った原稿の場合、生データに問題があることが多い。実際のデータがないので、生データをねつ造するからである。

論文工場は詐欺論文を効率よくたくさん作る必要があるので、「ひな形 (ひな型)」(テンプレート)を使って生データを作っている。

それで、学術誌は、出版前の段階で、著者に生データの提出を求めることを推奨する。

送られてきたグラフや図表などの生データがテンプレートで作られたかどうかを判定する。この判定に細心の注意を払うことで、論文工場(paper mill)製の詐欺論文出版を防ぐことができる。

★はじめに

フェブス出版社(FEBS Press、画像出典同)は、非営利団体の欧州生化学連合 (Federation of European Biochemical Societies)が所有する以下の4つの学術誌を出版している。

フェブス出版社(FEBS Press)は、画像が不正に操作されていないか、2015年から、出版前の論文を定期的にチェックしている。

当初、これらのチェックで著者のミスや間違いが多数見つかった。そして、ごくまれにネカトが見つかった。

そして、3年前の2018年、憂慮すべき詐欺論文が見つかった。

組織的にねつ造されたデータを使った詐欺論文(生物医学論文)が初めて見つかったのである。

論文工場(paper mill)製の投稿論文だと指摘された最初だった。

論文工場は、詐欺論文の原稿を作り販売する非公式でほぼ違法な組織である。

研究公正の研究者、科学者、編集者、ジャーナリストからなる国際コミュニティはこの脅威に迅速に反応し、広範囲にわたる重大な問題を明らかにしている。

論文工場は、論文原稿の作成だけでなく、データねつ造、著者在順の販売、査読偽装、引用詐欺など研究不正の百貨店である。

論文工場製の原稿は複数の点でよく似ている。査読はスムーズに通過し(査読偽装)、出版された論文はよく引用される(引用詐欺)。

現在、論文工場が学術文献体系と学術研究に広範囲で深刻は悪影響を与えていると思われるが、実態は不明である。

但し、既に、生命科学分野では、論文工場製の論文が大量に撤回されている。

最近では学術誌「Royal Society of Chemistry」の68論文が撤回された。そのすべては中国の研究者の論文だった。68論文の撤回は少ない数字で、論文工場製の論文はまだ何千本もあると考えられ、その多くはまだ特定されていない。

中国政府は、研究者が論文工場を利用する動機を取り除き、研究不正行為を取り締まろうとしている。しかし、フェブス出版社(FEBS Press)の4つの学術誌に、論文工場製の論文が、中国からコンスタントに投稿されている。

私たちは、2018年に、論文工場製の論文を見つけたが、論文工場の問題は何年も前から指摘されていた。但し、多くの学術誌で現実的な問題となり始めたのは最近である。

論文工場は中国だけでなく、イラン、インド、ロシアなどの国でも操業していると報告されている。

生命科学分野だけでなく、人文科学や社会科学、コンピューターサイエンス、工学などの分野もターゲットになっている。

論文工場がどのように運営されているか、ほとんどわかっていないが、出版社は出版社なりの対策をし始めた。

まず、論文工場製の論文を特定・撤回する努力をしている。

また、学術出版界と学術研究者の意識を高めること、論文工場の技術と手口を明らかにすることなどの対策が進行中である。

本論文では、論文工場製の原稿に繰り返し現れる特徴、特に論文工場が利用している「生データ」に関する情報を取り上げて、対策の役に立ちたいと考えた。

本論文のポイントを把握・実行することで、論文工場製の原稿を出版前に特定、出版後の論文撤回、が容易になり、加速されると期待したい。

★テンプレートとデータのリサイクル

論文工場は「ひな形 (ひな型)」(テンプレート)を使っているので、論文の内容と無関係に、テキスト、表、図の全体的なレイアウトとデザインはよく似ている。

つまり、画像やデータのストックを何度も繰り返し使っている。ストックは、ウェスタンブロット画像、顕微鏡写真などの画像だけでなく、図や棒グラフなど、さらには数値データやデータセットまである。

図1は、異なる所属の異なる著者の無関係な論文なのに、画像データと数値データが同じだった例である。両論文は2020年7月に撤回された。

図1の説明:2018年10月に同じ学術誌「Royal Society Open Biology」に掲載された2つの無関係な論文の画像(A)と表(B)。それぞれ青枠と紫枠で囲った2つの数値データ列は、異なる実験なのに同じだった。

★引用カルテル

論文工場製の論文は、お互いを引用し合う引用カルテル(引用詐欺)を形成することで、論文の被引用数が多くなり、その利点を「売り」として、論文販売に成功している。

最近「FEBS Letters」に投稿された「miRNA、その標的、および特定の疾患におけるそれらの役割」の論文では、参考文献にリストされたいくつかの論文は、miRNA、標的、疾患のどれとも全く関係がなかった。

これら被引用論文は、被引用を目的に参考文献リストに加えられた論文と思われる。つまり、引用カルテルが動いていたことを示している。

被引用の4論文には、投稿原稿が記述していたのと同じ値を示す棒グラフが使われていた。ただし、異なるラベルが付けられ、デザインと色は変更されていた(図2)。4つの被引用論文の著者は、中国の異なる病院の異なる著者グループだった。

図2

★生データ

図や表の生データに関する規則が、論文工場製の原稿を検出する際に重要である。

フェブス出版社(FEBS Press)が見つけた論文工場製の原稿には、癌遺伝子の発現を調節する非コードRNAの論文が多かった。

論文工場の関与の兆候がある場合、投稿受付時に著者に生データを要求する。

多くの場合、要求した生データが提供されることはほとんどなく、著者が何も返答してこないこともある。

原稿が受理されている場合、生データを提供してくる割合は高くなるが、提供してきた「生データの画像」の信憑性に疑問を抱くことが多い。

ウェスタンブロットやDNAゲルは、コントロールや分子量マーカーがなく、ラベルはデジタルに追加されているなど、図が加工されていることがよくある。

また、ウェスタンブロットの生データが頻繁に操作されているか、完全にねつ造されているように見えることもある。

人工知能に基づく画像合成技術の敵対的生成ネットワーク(Generative Adversarial Nets)を使えば、非常にリアルなウェスタンブロット画像をコンピュータで作れることは知られている。

フェブス出版社(FEBS Press)は、グラフィック編集ソフトウェアを用いてウェスタンブロットの形態学的特徴を分析し、操作した画像を検出している。

また、本物のウェスタンブロットでは同じバックグラウンド・ノイズになることはない。操作した画像を検出する場合、バックグラウンド・ノイズをチェックすることが重要である。

図 3は、フェブス出版社(FEBS Press)社とは別の学術誌でクリストファー(本論文の著者)が協力した調査で、最近撤回された論文の「生データ」を示している。

図3
図3の説明:(A) 要求に応じて著者から提供された 2つの異なる実験の生データ。(B) 同じファイルを開いて Photoshop で処理し、背景の形態学的特徴を明らかにした。バンドを含むレイヤー 1 をオフにすると(赤い矢印)、背景のみが表示された (C)。バンドを含むレイヤーは、必要に応じて置き換えることができる。

「図3の説明 」で示したように、Photoshopで画像データのファイルを開くと、各画像はウェスタンブロットのバンドとバックグラウンドが別のレイヤーで重ね合わされていた。

このケースでは、2つのレイヤーが結合されていなかったので、分析可能だった

2018年、フェブス出版社(FEBS Press)は2つの学術誌に、論文工場製と思われる12本の投稿原稿をまとめて受け取った。原稿は数週間という短期間に2~3回に分けて投稿された。

上記したように、さまざまなバンドの列を同じバックグラウンドと組み合わせ、数10個の異なるウェスタンブロット画像を作成できる。

12本の投稿原稿のウェスタンブロットのバックグラウンド・ノイズを分析すると、バックグラウンド・ノイズが同じだったので、フェブス出版社(FEBS Press) は論文工場製と判定し、編集部の判断で不採択にした。

ところが、その後、不採択になった12本の原稿はすべて、他の学術誌に掲載された。なんということだろう。

なお、このケースは、ビック(Elisabeth Bik)が論文工場の記事で指摘した。 → 2020年2月21日記事:The Tadpole Paper Mill – Science Integrity Digest

[途中省略]

★特徴

まとめに入る。

論文工場製の原稿や論文の場合、生データが入手できないか、生データとして提供されたデータが本物ではないことが多い。

以下が特徴である。

  1. 他の論文/原稿とテキストまたは構成が類似している。
  2. 図表は、他の論文/原稿の図の構成、注釈のスタイル、グラフと表のフォーマットが類似している。
  3. タイトルの構造が類似している。
  4. 同じコンピュータから異なる著者の複数の原稿が投稿される。これは、学術誌側の原稿受付システムが問題原稿と識別するようにソフトを導入する。
  5. 著者は非学術的機関の商業的な電子メール・アドレスを使用している。
  6. 著者のORCID IDが欠落している。
  7. 無関係な論文を引用し、参考文献欄にリストしている(引用詐欺)。
  8. 著者が推薦する査読者に査読を依頼すると、査読日数が異常に短く、肯定的な評価が得られる(査読偽装)。

原稿中の図は、綿密に検査しても操作またはねつ造されたようには見えないかもしれないが、生データ、特にウェスタンブロット画像の基礎となる元データを要求するのが適切である。

これらの生データ・元データを入手できないか、入手できても、偽物の可能性が高いので、入手した生データ・元データを注意深く検査し、原稿の図と照合する必要がある。

学術誌は、出版した論文に記載された研究が誠実に実施され、研究公正基準に準拠していることを保証する倫理的義務がある。

オリジナルの研究を出版するすべての学術誌は、画像データのスクリーニングを作業工程に組み込む必要がある。グラフ、図表、などの画像データに細心の注意を払うことは、誤った情報やねつ造された情報の公開を防ぐのに明らかに役立つ。

しかし、現在、学術誌が生データを扱うガイドラインがない。共通で強制力のあるガイドラインを緊急に制定する必要である。

ある学術誌がねつ造原稿を検出し、掲載を拒否したのに、別の学術誌が同じ原稿を掲載している現状は、リソースの無駄遣いだけでなく、誤った知的情報を蓄積し、学術文献体系の健全さを脅かしている。

効果的な出版前検査には、論文工場で使用している技術を明らかにすること、論文工場製の原稿を検出するための新しい情報、有用なツール、関連スキルを学術出版界と学術研究界が開発し共有し続ける必要がある。

●7.【白楽の感想】

《1》日本の無知・無感心 

日本は国際的に高い評価を受けている学術誌がない(ほとんどない)。

それで、学術論文が直面している論文売買、論文工場、引用詐欺への関心がとても低い。

しかし、日本の研究者は外国の学術誌に論文を投稿するし、場合によると、論文を購入したり、著者在順を購入している(ココは推察)。

日本の学術界はもっと、この問題を知り、関心をもつべきである。

ヤナ・クリストファー(Jana Christopher)、画像データ公正アナリスト:Jana Christopher – Image Integrity Analyst – UK Research Integrity Office

ーーーーーーー
日本の人口は、移民を受け入れなければ、試算では、2100年に現在の7~8割減の3000万人になるとの話だ。国・社会を動かす人間も7~8割減る。現状の日本は、科学技術が衰退し、かつ人間の質が劣化している。スポーツ、観光、娯楽を過度に追及する日本の現状は衰退を早め、ギリシャ化を促進する。今、科学技術と教育を基幹にし、人口減少に見合う堅実・健全で成熟した良質の人間社会を再構築するよう転換すべきだ。公正・誠実(integrity)・透明・説明責任も徹底する。そういう人物を昇進させ、社会のリーダーに据える。また、人類福祉の観点から、人口過多の発展途上国から、適度な人数の移民を受け入れる。
ーーーーーーー
ブログランキング参加しています。
1日1回、押してネ。↓

ーーーーーー

●8.【同じ著者の論文】

① 2018年の論文:Systematic fabrication of scientific images revealed – Christopher – 2018 – FEBS Letters – Wiley Online Library
② 2020年の同じ著者の論文:Digital magic, or the dark arts of the 21st century—how can journals and peer reviewers detect manuscripts and publications from paper mills? – Byrne – 2020 – FEBS Letters – Wiley Online Library

★記事中の画像は、出典を記載していない場合も白楽の作品ではありません。

●9.【コメント】

注意:お名前は記載されたまま表示されます。誹謗中傷的なコメントは削除します

Subscribe
更新通知を受け取る »
guest
0 コメント
Inline Feedbacks
View all comments