7-161 不正画像対処の米国の20年

2024年12月20日掲載 【長文注意

白楽の意図:マイク・ロスナー(Mike Rossner)は、画像不正操作の問題に警鐘を鳴らしてきた学術出版側のパイオニアで、「2004年7月のJ Cell Biol.」論文で最初に不正画像の基準を発表してから20年が経過した。この20年間の米国の不正画像対処の流れを詳しく解説したロスナーの「2024年8月のRetraction Watch」論文を読んだので、紹介しよう。名著である。

ーーーーーーー
目次(クリックすると内部リンク先に飛びます)
2.ロスナーの「2024年8月のRetraction Watch」論文
7.白楽の感想
ーーーーーーー

【注意】

学術論文ではなくウェブ記事なども、本ブログでは統一的な名称にするために、「論文」と書いている。

「論文を読んで」は、全文翻訳ではありません。

記事では、「論文」のポイントのみを紹介し、白楽の色に染め直し、さらに、理解しやすいように白楽が写真・解説を加えるなど、色々と加工している。

研究者レベルの人が本記事に興味を持ち、研究論文で引用するなら、元論文を読んで元論文を引用した方が良いと思います。ただ、白楽が加えた部分を引用するなら、本記事を引用するしかないですね。

●2.【ロスナーの「2024年8月のRetraction Watch」論文】

★読んだ論文

●【論文内容】

★はじめに

マイク・ロスナー(Mike Rossner)と細胞生物学者のケネス・ヤマダ(Yamada KM)は、「2004年7月のJ Cell Biol.」論文で画像不正操作の具体例を示した。

今年(2024年)はその20周年目に当たる。

それで、ロスナーは画像不正操作の20年の歴史を書いた。

この20年で、多くの変化があった。

まず、画像の不正操作に対する認識が格段と高くなったことだ。

この20年、論文出版関係者は不正画像の対処に多大な努力をしてきた。それでも、いまだに、多数の論文に多数の不正画像が見つかる状況は続いている。

なお、本論文で「画像操作」という用語は、画像操作(コピー/ペースト、削除、切り貼りなど)と画像複製の両方を指す一般的な用語として使用する。[ここの原文:“image manipulation” throughout this piece as a generic term to refer to both image manipulation (e.g., copy/paste, erasure, splicing, etc.) and image duplication.]

論文の流れから(白楽が)話を少しそらするが、「2004年7月のJ Cell Biol.」論文中の画像を数枚、白楽は講演や講義で何度も使わせていただいた。

例えば、以下の図である(出典:原著)。

――――電気泳動のバンドーーーー

左側が元画像、右側はそれを不正に加工した画像。
上段はレーン3にあったバンドを削除するという加工をした。
下段はレーン3にバンドを加えるという加工をした。

――――細胞の蛍光顕微鏡像ーーーー

上図は細胞の蛍光顕微鏡の写真だが、既に不正に加工した画像である。下図はコントラストを調整してその画像の背景をさぐった。すると、上図の画像は切り貼りされていたことがわかる。

――――――――――――――――――――

そして、論文から、話はもっとズレるが、2人の著者の内の1人であるケネス・ヤマダ(Yamada KM、ケン・ヤマダ、写真出典)は40年前、白楽がNIH・国立がん研究所・分子生物学部に研究留学した時のボスである。

白楽はケンと呼んでいるので、ケンと呼ばせてもらうが、ケンは現在もNIHで研究している現役の研究者である。 → Kenneth Yamada, MD, PhD | Principal Investigators | NIH Intramural Research Program

もっと話をズラすけど、いいよね。

白楽はそれから40年間、当時、ケンの研究室のポスドクだったスティーブ(男性、NIH・現役研究者)、そして、テクニシャンだったダティ(女性、退職)と、今も、交流し続けている。

と言っても、他のポスドクたち、米国のフィリス(女性、ボストンの大学教授になった)、オランダから来たトム(男性、オランダの大学教授になったと思う)は連絡が途絶えた。

フランスから来たブルーノ(男性、フランスの民間研究所の研究員になったと思う)は姓を思い出せない。遠い昔だ。

話を戻す。

★2002年:端緒

2002年、私(マイク・ロスナー、Mike Rossner、写真出典)は学術誌「The Journal of Cell Biology」(略してJ Cell Biol.、または JCB)の編集事務長(managing editor)を務めていました。

丁度その頃、理系の学術誌は、紙に打ち出した原稿を郵便で投稿する方式からオンライン投稿(電子的に投稿する方式)に移行していました。

私たち「J Cell Biol.」の編集部は、オンライン方式を始めたばかりで、著者が図のファイルを間違ったファイル形式で送ってくることがよくありました。

ある日、いくつかの図ファイルを再フォーマットしていた時、ウェスタンブロット画像の1つに、バンドの周りに鋭い線があるのに気がつきました。

これは、バンドを切り取って1つの画像に貼り合わせたか、バンドのコントラストを異常に変えたためだと思われました。

その時、「ああ、なんてこった、これは後で問題になるな」と思ったことを、今でも鮮明に覚えています。画像不正操作の可能性が頭をよぎったからです。

その事がきっかけで、不正画像のチェックをした方がいいなと強く思いました。

それで、編集長だったアイラ・メルマン(Ira Mellman)の賛意を受けて、私はすぐに、受理したすべての論文原稿のすべての図ファイルを、画像不正操作の証拠がないか、論文出版前に検査するという作業を導入しました。

当時の同僚であるロブ・オドネル(Rob O’Donnell)、エリン・グレイディ(Erinn Grady)、ローラ・スミス(Laura Smith)の3人と一緒に、画像不正操作を検出する簡単な手法を開発し、使い始めました。

この方法は、写真編集ソフトのフォトショップ(Photoshop)で画像の明るさとコントラストを調整し、画像の背景を強調し、目視で検査する、というものでした。

この方法で、切り貼りなどの不正操作の手がかり(均一な背景であるべきなのにそうではないなど) や、画像重複の手がかり(別の画像なのに背景のゴミの形が一致したなど)が明らかになる場合があります。

すべての学術誌が画像不正操作に対処すべき問題なのは、この時点で明らかでした。

人件費はかかりましたが、科学的な記録の正確さを守るためには、その費用に見合う価値があると私は思いました。

私の知る限り、学術誌「J Cell Biol.」は体系的な画像スクリーニングを実施した最初の学術誌です。

それ以前にも、画像不正操作の問題を懸念する人はいました。
 → ① Christopher Andersonの「1994年1月のScience」論文:Easy-to-Alter Digital Images Raise Fears of Tampering | Science、② 「2000年のJ Biocommun」論文:Digital manipulation in scientific images: some ethical considerations – PubMed、③ 2002年3月出版の著書: Envisioning Science: The Design and Craft of the Science Image: 9780262062251: Felice Frankel: Books

しかし、2002年時点で、それを体系的に検出し、不正画像が学術誌に掲載されるのを防ぐ取り組みは、私たち以外、まだ誰も行なっていませんでした。

★「2004年7月のJ Cell Biol.」論文

2002年9月、私、マイク・ロスナー(Mike Rossner)は、学術誌「J Cell Biol.」の巻頭言で不正画像の検査を始めると発表しました。 → Figure manipulation | Journal of Cell Biology

その巻頭言では、画像不正操作を防ぐ別の手段として、学術誌に論文を投稿する前に、原稿の画像データを研究室で綿密に調べるよう、主任研究者に初めて呼びかけました。

2003年7月、私たちはデジタル画像の取り扱いに関する最初の学術誌ガイドラインを発表しました。 → JCB — Instructions to authors

2003年12月、学術誌「J Cell Biol.」の編集者会議で、「J Cell Biol.」の編集者だったNIHのケネス・ヤマダ(NIH倫理委員会のメンバー)と、画像スクリーニングの実践と方針などについて話し合いました。

それが契機となって、NIHの「倫理と教育」部門のアシスタント・ディレクターだったジョーン・シュワルツ(Joan Schwartz)に、NIHの所内出版物である「NIH Catalyst」に記事を書くよう依頼され、2004年5月に「写真に写っているもの」という記事を書きました。 → The NIH catalyst : 2004 May-June

その記事は、2か月後、そのまま転載され、「★はじめに」で示した以下の「2004年7月のJ Cell Biol.」論文になりました。

「NIH Catalyst」の私の記事が出版されて間もなく、私は研究公正局(Office of Research Integrity:ORI)が主催する会議で、研究公正に関する話題を提供する機会を得ました。

その時の会議で、論文の不正画像の多さから、研究不正行為が蔓延していることを発表しました。

ミシガン大学のネカト研究者であるステネック教授(Nicholas H. Steneck)は、アンケート調査などで、研究者100人~10万人当たり1人、つまり、1~0.001%の研究者が何らかの形で研究上の不正行為をしていることを、2000年11月に示していました。 → 2000年11月のステネック教授 の論文:Assessing the Integrity of Publicly Funded Research

学術誌「J Cell Biol.」で体系的に画像を検査した私たちの結果では、受理した100本の原稿のうちの1本に画像不正操作の証拠が見つかりました。

つまり、ステネック教授 が示した研究不正行為発生率の上限である1%に一致しました。

研究公正局での会議がきっかけで、2005年1月に研究公正局の調査監督部門(Division of Investigative Oversight)で話すよう依頼されました。

2005年1月の研究公正局の会議では、画像操作が深刻な問題であり、発表論文に不正なデータが入るのを防ぐために、すべての生物医学の学術誌が対処しなければならない、と締めくくりました。

会議の最後に、「他の学術誌にも対処してもらうにはどうしたらよいか?」と、研究公正局のクリス・パスカル局長(Chris Pascal、写真出典)が質問しました。

その時の答えは、他の学術誌に注目してもらうためには、知名度の高い学術誌で深刻な画像操作事件が起こるのはどうだろう、と冗談にもつかない話をしました。

ところが、「冗談から駒が出て」、まもなく、ファン事件が勃発しました。

2004年と2005年、ファン・ウソク(Woo Suk Hwang、黄禹錫、写真出典)は、ヒト胚性幹細胞の産生について「Science」誌に2つの論文を発表しました。

  1. Evidence of a pluripotent human embryonic stem cell line derived from a cloned blastocyst.
    Hwang WS, Ryu YJ, Park JH, Park ES, Lee EG, Koo JM, Jeon HY, Lee BC, Kang SK, Kim SJ, Ahn C, Hwang JH, Park KY, Cibelli JB, Moon SY.
    Science. 2004 Mar 12;303(5664):1669-74. doi: 10.1126/science.1094515. Epub 2004 Feb 12.
    Retraction in: Science. 2006 Jan 20;311(5759):335. doi: 10.1126/science.1124926.
  2. Patient-specific embryonic stem cells derived from human SCNT blastocysts.
    Hwang WS, Roh SI, Lee BC, Kang SK, Kwon DK, Kim S, Kim SJ, Park SW, Kwon HS, Lee CK, Lee JB, Kim JM, Ahn C, Paek SH, Chang SS, Koo JJ, Yoon HS, Hwang JH, Hwang YY, Park YS, Oh SK, Kim HS, Park JH, Moon SY, Schatten G.
    Science. 2005 Jun 17;308(5729):1777-83. doi: 10.1126/science.1112286. Epub 2005 May 19.
    Retraction in: Science. 2006 Jan 20;311(5759):335. doi: 10.1126/science.1124926.

ところが、内部告発者が韓国のメディアに、この論文には、画像不正によるデータ改ざんがあると通報したのです。

ファン・ウソクが所属していたソウル大学(Seoul National University)がネカト調査し、ネカトが見つかり、両論文は2006年1月に撤回されました。

ファン・ウソク事件は、研究界と出版界を震撼させました。

私は、ファン・ウソクのネカトは、出版前に私たちの方法で画像をスクリーニングしていれば、改ざん箇所を見つけられたと思いました。 → 2007年1月8日、マイク・ロスナー(Mike Rossner):Hwang case review committee misses the mark | Journal of Cell Biology | Rockefeller University Press

そうです、ファン事件は学術誌「J Cell Biol.」の画像スクリーニングの宣伝につながりました。

その後の数年間、学術誌「J Cell Biol.」を出版するロックフェラー大学出版局の同僚と私は、約25社の出版社に視覚スクリーニング技術のトレーニングを行ないました。

その結果、「Science」誌を含む約25 社の出版社は、論文出版前に体系的な画像スクリーニングを始めました。

しかし、学術出版に関与する他の関係者(研究者、資金提供者、大学、他の大多数の出版社)は、画像操作問題について誰も何も発言しませんでした。

彼らは、画像不正操作を重要な問題と考えず、このタイプの不正行為に対して無邪気というか大甘というか、取るに足らない小さな問題だとみなしてそのまま放置していました。

★2010年:クレア・フランシス(Clare Francis)

2010年、学術誌の編集者は、「クレア・フランシス(Clare Francis)」という仮名の人物から告発メールを受け取り始めました。

クレア・フランシスは、出版された論文中の画像不正操作を見つけ、学術誌にどんどん通報し始めたのです。

クレア・フランシスの初期の通報には間違いが時々ありました。

また、一般論として、論文に不正があると通報する人の中には、まともな通報ではないこともありました。

それで、学術誌・編集者と大学は仮名・匿名の告発者からの通報を無視するようになりました。

本当のところ、編集者と大学が仮名・匿名の告発者からの電子メールを無視するのは、間違っていると思います。

編集者と大学は告発者からの通報に対応し、ネカト調査という作業をしたくないというのが本当の理由だと思います。つまり、単に、怠慢を肯定する言い訳のように思えます。 → 2011年12月9日記事:Why editors should stop ignoring anonymous whistleblowers: Our latest LabTimes column – Retraction Watch

誰が見つけようと、誰がどのように通報してこようと、論文の不正に対処する責任は、編集者と大学にあります。

学術誌「J Cell Biol.」はクレア・フランシスの通報を真剣に受け止め、いくつもの論文を撤回しました。 → 2013年1月22日記事:Clare Francis scores a bullseye: Journal of Cell Biology paper retracted for image manipulation – Retraction Watch

★2012年:ポール・ブルックス(Paul Brookes)

2012年7月、米国のロチェスター大学(University of Rochester)のポール・ブルックス(Paul Brookes、写真出典)は、「サイエンス・フラウド(Science Fraud)」というブログを始めました。 → 1‐5‐11 サイエンス・フラウド(Science Fraud) | 白楽の研究者倫理

彼は「Fraudster」という仮名で、彼と一部の協力者が見つけた不正画像の実例を「Science Fraud」に掲載しました。

しかし、サイト開始の6か月後、2012年12月、疑惑論文の著者だった研究者の弁護士にポール・ブルックスという実名を特定され、名誉棄損で裁判に訴えると脅され、「サイエンス・フラウド(Science Fraud)」のサイトを閉鎖しました。 → 2014年3月11日記事:So what happened after Paul Brookes was forced to shut down Science-Fraud.org? – Retraction Watch

★2012年:パブピア(PubPeer)とネカトハンター

2012年10月、「サイエンス・フラウド(Science Fraud)」が稼働していた頃、フランスの神経科学者であるブランドン・ステル(Brandon Stell、写真出典)たちは、出版後査読の公開フォーラムであるウェブサイト・「パブピア(PubPeer)」を立ち上げました。 → 1‐5‐6 パブピア(PubPeer) | 白楽の研究者倫理

パブピア(PubPeer)は、出版論文に対して一般の人々が匿名でコメントできるという点でユニークでした。

その匿名性を維持するコメンテイターの権利は、その後、米国の法廷で認められました。 → 2016年12月7日記事:PubPeer wins appeal of court ruling to unmask commenters – Retraction Watch

パブピア(PubPeer)は発足から12年が経過していますが、かなり繁栄し、2024年現在も活発に活動しています。そして、コメントのかなりの割合が、生物医学論文の画像不正操作に対する告発です。

パブピア(PubPeer)で最も著名で多作なコメンテイターの1人は匿名ではありません。

ネカトハンターのエリザベス・ビック(Elisabeth Bik、写真出典)です。

エリザベス・ビックは、数千件(8、904件以上)の不正画像を「パブピア(PubPeer)」で、匿名ではなく実名で、告発しています。 → 7-114 ビックのネカトハンター人生 | 白楽の研究者倫理

また、「2016 年6月の mBio」論文で、生物医学論文の膨大な不正画像を指摘し注目を集めました。

この論文は、ナント、20,000件の論文の画像を分析しています。そして、調べた論文の2%に不正な画像操作があったと述べています。

この「2%」は、学術誌「J Cell Biol.」で私たちが得た数値「1%」とほぼ一致しています。

ビックは、画像操作を探し出すネカトハンター達(下の2023年の写真はその面々)を元気づけました。 → 1‐5‐1 ネカトハンターとネカトウオッチャー | 白楽の研究者倫理

写真と英語キャプションの出典:In 2023, a group of data wonks gathered in Prague to discuss a disturbing issue: manipulated images and fabricated data in scientific publishing. Part of that group is pictured here, from left to right: David Bimler, Charles Piller (a journalist who attended a portion of the meeting), Nick Brown, Sholto David, Patrick Starke, Leonid Schneider, Markus Zlabinger, Elisabeth Bik, and Kevin Patrick. Visual: Courtesy of Elisabeth Bik

ネカトハンター達は無償ボランティアで、膨大な数のネカトを指摘しています。

その膨大さは、ネカト問題の大きさと深刻さを浮き彫りにしています。

論文の不正疑惑が公開で指摘され、指摘された研究者・大学・学術誌は自分たちの評判へのダメージを懸念するようになりました。

それで、徐々に対処するようになってきました。

なお、ネカトハンターが論文を精査する時、ターゲットとする論文をどのように選ぶのかは不明です。

その不明さのために、すべての研究者・大学・学術誌は、次に自分がターゲットになるかもしれないという緊張があります。

ネカトハンターが古い論文を精査するにつれ、私、マイク・ロスナー(Mike Rossner)が2002年に画像不正に気づく何年も前から、画像の不正操作が行なわれていたことがわかってきました。

1つ例を挙げると、2023年にスタンフォード大学がマーク・テシア=ラヴィーン学長(Marc Tessier-Lavigne)のネカト調査をしました。その調査の結果、「1999年のCell」論文と「2001年のScience」論文に不正画像が見つかり、そのことで論文は撤回されました。 → マーク・テシア=ラヴィーン(Marc Tessier-Lavigne)(米) | 白楽の研究者倫理

★2015年:イメージ・データ・インテグリティ社(mage Data Integrity)

私、マイク・ロスナー(Mike Rossner)は、学術誌「J Cell Biol.」の編集事務長を2007年に辞めて、ロックフェラー大学出版局の取締役(Executive Director)になり、それを2013年5月まで務めていました。

2015年8月、サンフランシスコにイメージ・データ・インテグリティ社(mage Data Integrity)を設立し、生物医学の画像操作に関するコンサルティング業を始めました。 → イメージ・データ・インテグリティ社(Image Data Integrity – Home

私は主に、「パブピア(PubPeer)」の告発に対して大学・研究所が行なうネカト調査に協力しています。

調査対象のほとんどは電気泳動の画像です。顕微鏡写真、写真、散布図などの画像を調査するケースも時々あります。

複製画像を指摘すると、著者から同じ回答が返ってきます。

電気泳動の複製画像で最も一般的な回答は「ああ、それはただのローディング・コントロールです」というものです。

生物医学界は、この回答を断固拒否する時が来ています。

有効なローディング・コントロールがなければ、電気泳動の実験結果を適切に解釈することはできないし、タンパク質の適切な比較もできません。従って、著者らが導き出した結論は信頼できません。

★不正画像論文数の急増

過去20年間の主な変化は、画像の不正操作が疑われる(questioned for image manipulation)論文数が劇的に増加したことです。

[白楽が、Retraction Watch Databaseで調べた。「Reason(s) for Retraction:」で「Duplication of Image」を検索すると「複製画像」が4,424論文、「Manipulation of Images」を検索すると「画像操作」が1,274論文、ヒットした。2024年10月21日調べ。2024年12月14日現在は「Reason(s) for Retraction:」の項目が削除されたので、撤回理由を簡単に調べられない]

この増加にはいくつかの要因があります。

第1に、年間に発表される論文数、特に低品質の論文が劇的に増加しているためです。

20年以上前、学術誌「BioMed Central」論文は、無料で論文を読めるが、論文を出版する際、著者に掲載料を求めるというオープンアクセス(pay-to-publish open access)・モデルを開拓した。 → 2002年1月7日記事:BioMed Central Begins Charging Authors and Their Institutions for Article Publishing

このオープンアクセス・モデルが低品質な論文の急増をもたらした。

低品質な論文の急増は非倫理的な出版社(捕食出版社)の出現によるもので、オープンアクセス・モデルは非倫理的な出版社の出現を意図していなかったと思われる。しかし、予想はできたはずです。

非倫理的な出版社は、利益を最大化するために、査読なし(またはザツな査読)の論文を莫大な量、出版しています。

第2に、中国が生物医学論文を発表する世界的な国として台頭してきたためです。

中国の台頭により、生物医学系の論文は毎年何十万報も増加しています。 → 2024年4月18日記事:Guest Post – Making Sense of Retractions and Tackling Research Misconduct – The Scholarly Kitchen

中国が膨大な数の論文を出版するのは、世界ランキングで中国のランクを上げるという国家主導の施策によるものです。 → 2024年2月22日記事:Why fake research is rampant in China

第3に、匿名でコメントすることが普及し、論文の画像不正操作を告発するネカトハンターの数が増加したためです。

ネカトハンターの指摘の精度は上っています。クレア・フランシスの初期の頃よりも、現在は、ずっと信頼度が高いので、かなりの大学と学術誌は真剣に受け止めるようになりました。

また、画像不正操作を検出するアルゴリズムがオンラインになったことで、体系的に画像スクリーニングをすることができるようになりました。このことで、科学研究の経験がない人を含め、いろいろな人がネカトハンター活動に参入しやすくなりました。

★不正画像の防止

不正画像を含む論文の割合が増加または減少したかどうかは不明です。

不正画像率は、私が学術誌「J Cell Biol.」の画像スクリーニングに携わった12年間、驚くほど一貫していました。最近の研究でも似た数値が得られています。 → 2015年6月12日記事:The image detective who roots out manuscript flaws | Nature
 → 2018年7月26日記事:Systematic fabrication of scientific images revealed – Christopher – 2018 – FEBS Letters – Wiley Online Library

しかし、不正画像率は一定でも、不正画像を用いた論文の絶対数は増加していて、その結果生じる問題があります。

この増加、および、「撤回監視(Retraction Watch)」や、「New York Times」のような米国の主要メディアによる報道によって、学術出版の関係者だけでなく、一般の人々の間で、論文の画像不正操作に対する問題意識を高まってきています。

画像不正操作論文の出版を防ぐという目標に異論を唱える人はいません。

しかし、誰が不正検出スクリーニングの責任者となり、研究のどの段階でスクリーニングを行なうべきかについては、かなりの議論があります。

私の意見では、①助成金申請時(助成金提供者)、②論文投稿前(研究者および大学・研究所)、③原稿査読中(出版社)、の各段階(関係者)で、データをスクリーニングし、データの異常をチェックする必要があります。

これは、コロナ・パンデミック時に慣れ親しんだ「スイスチーズ・予防モデル(Swiss cheese model of prevention)」と同じです。各段階でのチェックに少しの見落としがあっても、段階を増やせば、見落としを防げる可能性は高くなります。

出典:The Swiss Cheese Model of Pandemic Defense – The New York Times

偽造画像を用いた論文発表を防ぐという目標は、それ自体が目的であるべきです。

その目標は、関係者にとって、画像操作の告発が減ることで対処の時間が減り、評判が良くなり、財政的利点が得られるメリットもあります。

アルゴリズムが利用できるようになったことで、より多くの出版社が出版前に画像を体系的にチェックするようになりました。

これまでスクリーニングを全く行っていなかった人にとっては、これは改善です。

全体としては、論文発表前の不正画像の検出という目標を達成する方向です。

ただし、一部の出版社は、視覚的スクリーニングからアルゴリズム・スクリーニングに格下げしています。

そうではなく、視覚的スクリーニングを主作業として続け、アルゴリズム・スクリーニングで追加チェックをするという方式にすべきです。

★大学・研究所の役割

5年前(2019年)、アリソン・アボット(Alison Abbott)は、Nature誌に記事を寄稿し、ヨーロッパの3つの大学・研究所が、学術誌に論文を投稿する前に、スタッフが原稿をアルゴリズムでスクリーニングし、画像操作の証拠がないか調べているという内容を紹介しました。 → 2019年11月19日のアリソン・アボット(Alison Abbott)のNature記事:The science institutions hiring integrity inspectors to vet their papers

私は、世界中の大学・研究所が同じことをすべきだと思います。

スタッフに対してスクリーニングを義務としたくないなら、少なくとも希望するスタッフにサービスとして提供すべきです。

また、大学・研究所は、教員・研究員を採用する前に求職者の出版物をスクリーニングすることも検討すべきです。

多くの大学・研究所は、「パブピア(PubPeer)」で指摘されたネカト告発を自分の大学・研究所に通知してもらうサービス(PubPeer Institution Dashboard)(以下はそのページ)を利用していますが、この取り組みは受け身です。

大学・研究所は、画像不正操作の発生を、また、それを学術誌に投稿されるのを防ぐために、受身的(反応的)なスタンスから積極的なスタンスに切り替えなければなりません。

繰り返しになりますが、この目標はそれ自体が目的であるべきですが、大学・研究所の評判を維持し、助成金の流入を維持するのにも役立ちます。

★「出版か死か(publish or perish)」

画像問題の根本的な原因は、部分的には、大学・研究所が採用と昇進で用いる評価基準である「出版か死か(publish or perish)」です。

過去十数年、「出版か死か(publish or perish)」という研究評価構造を変え、個々の研究者に論文発表のプレッシャーを減らす必要性が議論されてきました。

ここで、2012年の「研究評価に関する宣言(DORA)」の議論を繰り返すことはしませんが、「研究評価に関する宣言(DORA)」創設者の一人として、私はこれらの取り組みを心から支持します。 → SPARC Innovator: The Creators of DORA – The Declaration on Research Assessment – SPARC

しかし、この方向への進展は残念なほど遅い。 → 2022年6月16日記事:Why Won’t Academia Let Go of ‘Publish or Perish’?7-148 出版か死か(Publish or Perish) | 白楽の研究者倫理

一方、研究者は、最近、ほぼ何でも発表できることを知っています。

現在のオープンアクセス(pay-to-publish open access)・モデルでは、データを不正に操作した論文でも、出版してくれる出版社があります。

しかし、研究者たちは、研究費を得るのが大変なことも知っています。

研究助成機関は、助成金申請書で引用されている申請者の論文をスクリーニングすることで、画像不正を抑制できます。

ところが、現在、申請者の論文をスクリーニングしている研究助成機関はありません。不正なデータに基づく研究への資金提供の悪循環を避けるせっかくの機会を逃していて残念に思います。

ただ、有望な展開もあり、最近、NIHの研究助成に、米国議会から「学術的不正の兆候を積極的に探す」という勧告が出されました。  → 2024年4月17日記事:Congress pushes NIH on research reproducibility and fraud

私の知る限り、NIHはまだこれをどのように行なうのかの指示をしていません。

多分、助成金申請書と研究進捗報告書については、研究者の被引用論文をチェックしてから承認することになると思われます。

★研究室主宰者

一部の大学・研究所は、研究室主宰者が学術誌に論文を投稿する前に個々の論文原稿をスクリーニングするよう、スタッフにアルゴリズムへのアクセスを提供しています。 → 2024年3月27日記事:Broad, Boston Children’s Provide Research Integrity Tools Following Longwood Data Manipulation Allegations | News | The Harvard Crimson

アルゴリズムへのアクセスを提供することで、研究室主宰者に不正画像のチェックを依存しているわけです。

私の意見では、これは不適切な不正回避策です。

本来、研究室主宰者は論文原稿に掲載する予定のすべての図表を研究室の元データ(生データ)と直接比較すべきです。

または、少なくともこの責任を信頼でき、訓練を受けたラボのメンバーに委任するか、大学・研究所が提供する担当部署の専門家に委任する必要があります。

画像操作は広範に行なわれているので、すべての研究室主宰者は、自分の研究室で画像操作が行なわれているという前提で研究室のデータに向き合うべきです。

研究室のミーティングで室員が報告しているデータや画像がすでに不正操作されている可能性も受け入れる必要があります。

投稿論文用の図表をチェックする時に重要なのは、元データそのものとの比較です。

元データは、複数の画像パネルを組み合わせたものではありません。

これらは、実験研究で得た実際のオリジナルなファイルで、変更・加工されていないものです。

画像データの場合、イメージングシステムによって生成されたファイル(昔ながらのオートラジオグラフィーなら、実際のX線フィルム)です。

私は、ゲル・ドキュメンテーション・システム(gel documentation systems、Gel doc – Wikipedia)ソフトウェアや画像処理機能を備えている顕微鏡の使用を認めます。

この場合、画像は、ファイルに保存される前に変更されている可能性があり、論文に発表した画像と比較しても、変更操作は明らかになりません。

ただし、ファイルの画像取得後に変更された疑いがある場合、それらの変更をファイルメタデータに含める必要があります。

論文に発表した画像が不正だと認定されるのを防ぐ唯一の確実な方法は、告発された研究者が比較のために元データを提供することです。

★元データ保持

大学・研究所は研究者にデータの保持年数を長期に義務付けていないため、大学・研究所のネカト調査で、被告発研究者は元データがないと主張することはとても多い。

その仕組みを変える必要があります。

データ・ストレージは、20年前に比べて大幅に安価になりました。ディスク・ストレージは、当時に比べて約100倍も安価になりました。 → Historical price of computer memory and storage

大学・研究所は、発表論文の基礎となる元データを(少なくとも論文で示した図表の元データを)永続的に保持し、提供することを義務付けるべきです。

私は、イメージングスクリーンの数千画像や何百ものホールスライド画像(whole slide images:WSI)について話しているのではありません。

私が言っているのは、論文で示した図表の元データを保存するのに必要な数メガバイト(WSIの場合はギガバイト)のことです。

データを永続的に保持するという方針を示している唯一の出版社は、学術誌「Nature」を発行するSpringer Nature社です。 → Image integrity and standards | Nature Portfolio

Springer Nature社は、「論文出版後も未処理のデータやメタデータファイルを保持し、理想的にはデータを永続的にアーカイブすることをお勧めします」と述べています。

これは、すべての学術誌が見習うべきです。

そして、大学・研究所も見習うべきです。

著者が元データを提供できない場合、論文を撤回した例はたくさんあります。 → 2018年10月25日記事:JAMA journal retracts paper when author can’t produce original data – Retraction Watch

大学・研究所は、元データを永続的に保持することを研究室主宰者に要求することで、間違ったネカト疑惑が生じたとき、この研究室主宰者を守ることもできます。

★論文工場

過去 20 年間で、画像操作の問題への対処は大きく進展しましたが、課題は残っています。

論文工場は、出版社にとって、また出版した論文の研究公正上、深刻で切迫した問題です。

論文工場は、ネカト論文を作って売る企業です。

学術誌に掲載が約束された採択論文の著者在順権を売っています。学術誌のインパクトファクターが高ければ高いほど、値段は高くなります。

大手出版社であるワイリー社(Wiley)が調べたところ、投稿原稿の10〜13%が論文工場製の論文でした。 → 2024年3月14日記事:Up to one in seven submissions to hundreds of Wiley journals flagged by new paper mill tool – Retraction Watch

論文工場に関する解説やニュース記事はたくさんあります。以下はそのうちの2例です。
 → 2021年3月23日記事: The fight against fake-paper factories that churn out sham science
 → 2023年11月19日記事:BishopBlog: Defence against the dark arts: a proposal for a new MSc course

★生成AI(generative artificial intelligence)

生成AI(ジェネレーティブAI、generative artificial intelligence)は、2022年11月のChat GPTのリリースで爆発的に増加しました。

しかし、それ以前から、コンピューター科学者は画像を生成する機械学習を開発していて、それらの技術を生物医学研究に関連する画像 (特にウェスタンブロット)に適用しています。

2021年初頭、Qi、Zhang、Luoは、敵対的生成ネットワーク(GAN)を使用して、本物のブロットに似た合成ウェスタンブロット画像を生成する論文を発表しました。 → ①2021年1月17日論文:Emerging Concern of Scientific Fraud: Deep Learning and Image Manipulation | bioRxiv、 → ②7-73 画像のAI合成:ウェスタンブロット | 白楽の研究者倫理

2022年、Wangらは、学術誌「Patterns」の論文で、敵対的生成ネットワーク(GAN) を使ってウェスタンブロット画像と医療写真の両方を合成するデモを行ないました。 → ①2022年5月13日論文:Deepfakes: A new threat to image fabrication in scientific publications?: Patterns、 → ②7-105 ディープフェイクの脅威 | 白楽の研究者倫理

また、2022年には、パデュー大学(Purdue University)のエド・デルプ(Ed Delp)らは、さまざまな生成モデルを使って、24,000個の合成ウェスタンブロットのライブラリを作成しました。このデータセットにさまざまなタイプの検出器に組み込み、最も優れたケースでは、90%の精度で合成ウェスタンブロットを検出できたと報告しています。 → 2022年5月30日論文:Forensic Analysis of Synthetically Generated Western Blot Images | IEEE Journals & Magazine | IEEE Xplore

最近では、その論文の著者の1人が、合成ウェスタンブロットの検出をさらに一歩進めて、合成ウェスタンブロットの生成に使用した特定のAIモデルを検出できたと報告しました。 → 2024年1月7日論文:Robust Source Attribution of Synthetically Generated Western Blot Images

生成AIの問題が生物医学の論文に及ぼす悪影響がどれほど深刻なのか、私たちは暗闇の中にいます。

唯一確実に言えることは、画像を生成するためのAIモデルへのアクセスが広く普及し、生成AIで作成した不正画像を目で見てチェックし、視覚的に検出するのが難しくなるため、事態は悪化しているということです。

視覚的検査では見つけられません。

生成AIによって生成された画像を検出するアルゴリズムを開発する必要があります。

開発は有望で、近い将来、その有効性を検証し、製品化し、それらを使用できるようになるでしょう。

とはいえ、学術誌と大学・研究所は、まだ、古い画像処理技術を使用した画像不正操作の膨大なバックログに取り組んでいます。

生成AIは既に、画像不正操作との新たな戦いの場になっています。

20年前、人々は生物医学論文の画像不正操作を知らなかったか、知っていても、問題は非常に軽微で対処する必要がないと考えていました。

しかし、今日、問題の深刻さを知らないと主張するのは難しいでしょう。

20年前、画像不正操作に対処する人はほとんどいなかったので、不正者の独壇場で不正が一方的に拡大する状況でした。

現在も画像不正者が優位な戦いをしているかもしれませんが、少なくとも今は、不正操作に立ち向かう人々がそこそこいます。

●7.【白楽の感想】

《1》優れた論文 

マイク・ロスナー(Mike Rossner)の「2024年8月のRetraction Watch」論文は優れた論文だ。

ここ20年の画像不正操作の問題を詳細に記述した論文は、学ぶ点が多い。

なお、日本は米国よりもネカト対処に関する意識が薄いし、活動も低い。

例えば、日本の大学・研究所で、「パブピア(PubPeer)」の「PubPeer Institution Dashboard」を利用している大学・研究所はいくつくらいあるのだろうか?

論文工場の台頭や、生成AI(generative artificial intelligence)のもたらす深刻なネカト問題を、適正に把握・対処するシステムや準備が、日本はできていない。

研究不正大国の日本は引き続き、広く・深く・長く、汚染されてしまうのだろうか?

ーーーーーーー
日本の人口は、移民を受け入れなければ、試算では、2100年に現在の7~8割減の3000万人になるとの話だ。国・社会を動かす人間も7~8割減る。現状の日本は、科学技術が衰退し、かつ人間の質が劣化している。スポーツ、観光、娯楽を過度に追及する日本の現状は衰退を早め、ギリシャ化を促進する。今、科学技術と教育を基幹にし、人口減少に見合う堅実・健全で成熟した良質の人間社会を再構築するよう転換すべきだ。公正・誠実(integrity)・透明・説明責任も徹底する。そういう人物を昇進させ、社会のリーダーに据える。また、人類福祉の観点から、人口過多の発展途上国から、適度な人数の移民を受け入れる。
ーーーーーーー
★記事中の画像は、出典を記載していない場合も白楽の作品ではありません。