2021年7月3日掲載
白楽の意図:「ねつ造・改ざん」で一番多いのがウエスタンブロット画像の加工だが、通常、「既存の画像」を加工する。ところが、敵対的生成ネットワーク(Generative Adversarial Nets:GAN)を使えば、「既存の画像」は不要で、ウエスタンブロット画像を含め、全く新しい画像を人工的に合成できる。となると、GANで合成した画像を「ねつ造・改ざん」と見破るのは至難になる。GANで画像を合成する原理はチンプンカンプンだが、ペン・ルオ(Peng Luo)の「2021年1月のbioRxiv」論文を読んだ(読めていない!)ので、紹介しよう。
ーーーーーーー
目次(クリックすると内部リンク先に飛びます)
1.論文概要
2.書誌情報と著者
3.日本語の予備解説
4.論文内容
5.関連情報
6.白楽の感想
8.コメント
ーーーーーーー
【注意】「論文を読んで」は、全文翻訳ではありません。ポイントのみの紹介で、白楽の色に染め直してあります。
●1.【論文概要】
ウエスタンブロット画像のネカトが問題になっている。現在、ウェスタンブロット画像のネカトは、重複バンドを目視で検出している。この方法の的確性は実証されていない。本論文では、敵対的生成ネットワーク(以後、GAN と呼ぶ。Generative Adversarial Nets:GAN)が実際のウェスタンブロットと区別できないリアルなウェスタンブロット画像を生成できることを示す。私たちの結果は、GAN が偽のウェスタンブロット画像を生成し、既存の問題画像検出法を欺けることを示す。科学論文のウェスタンブロットが本物であることを確認するには、現状よりも多くの情報が必要である。
●2.【書誌情報と著者】
★書誌情報
- 論文名:Emerging Concern of Scientific Fraud: Deep Learning and Image Manipulation
日本語訳:科学的詐欺の新たな懸念: 深層学習と画像操作 - 著者:Chang Qia, Jian Zhanga and Peng Luo
- 掲載誌・巻・ページ:bioRxiv
- 発行年月日:2021年1月17日
- 指定引用方法:
- DOI: https://doi.org/10.1101/2020.11.24.395319
- ウェブ:https://www.biorxiv.org/content/10.1101/2020.11.24.395319v2
- PDF:https://www.biorxiv.org/content/10.1101/2020.11.24.395319v2.full.pdf+html
- 著作権:
★著者
- 連絡著者:ペン・ルオ(Peng Luo)
- 紹介:
- 写真: https://www.researchgate.net/profile/Peng-Luo-28
- ORCID iD:
- 履歴:
- 国:中国
- 生年月日:不明
- 学歴:不明
- 分野:腫瘍医学
- 論文出版時の所属・地位:南方医科大学・珠江医院の医師(Department of Oncology, Zhujiang Hospital, Southern Medical University, Guangzhou, Guangdong, China)
南方医科大学・珠江医院(Zhujiang Hospital, Southern Medical University, Guangzhou, Guangdong, China)。写真出典
●3.【日本語の予備解説】
論文タイトルのキーワードである「Deep Learning」と「Generative Adversarial Net」が、白楽には、最初からわからなかった。
それで、まず、それらを調べた。以下に要点を示す。
★ディープラーニング(Deep Learning)
ディープラーニング(英: Deep learning)または深層学習(しんそうがくしゅう)とは、対象の全体像から細部までの各々の粒度の概念を階層構造として関連させて学習する手法のことである[1][注釈 1]。深層学習として最も普及した手法は、(狭義には4層以上[2][注釈 2]の)多層の人工ニューラルネットワーク(ディープニューラルネットワーク、英: deep neural network; DNN)による機械学習手法である[3]。多層ニューラルネットワークについては、ジェフリー・ヒントンの研究チームが2006年に考案したスタックドオートエンコーダが直接の起源となった。ディープラーニング – Wikipedia
この説明は日本語で書いてあるにもかかわらず、ザル頭の白楽にはカスル程度しか理解できなかった。
★Generative Adversarial Net(GAN)
Generative Adversarial Nets(GAN)は日本語で「敵対的生成ネットワーク – Wikipedia」と訳されている。
上記ウィキペディアの解説は以下のようだ。
敵対的生成ネットワーク (てきたいてきせいせいネットワーク、英: Generative adversarial networks、略称: GANs)は、2014年にイアン・グッドフェローらによって発表された教師なし学習で使用される人工知能アルゴリズムの一種であり、ゼロサムゲームフレームワークで互いに競合する2つのニューラルネットワークのシステムによって実装される。
白楽は、全く理解できない。
白楽に理解できそうなサイトを探した。
「用意されたデータから特徴を学習し、擬似的なデータを生成する」だそうだ。これならわかる。出典 → Generative Adversarial Network(GAN)とは | スキルアップAI | AI人材育成・開発組織の構築支援
以下の顔写真は実在しない人物だが、いかにも実在しているような有名人として、GANで作成した例である。出典: 2018年5月22日記事:Faster Learning and Better Image Quality with Evolving Generative Adversarial Networks
白楽は、実在している特定の有名人とよく似ている気がする(気がするだけ?)。
そして、線画から実物の画像を作ることができる。以下は、「バッグの線画を入力として与えて、そこに本物のような着色を施した」例である。出典 → 2018年09月04日記事:GAN:敵対的生成ネットワークとは何か ~「教師なし学習」による画像生成 – アイマガジン|i Magazine|IS magazine。元の出典(出典8):「Image-to-Image Translation with Conditional Adversarial Networks」
さらに、以下のように、「画家それぞれの画風を学習させ、入力として与えた写真(インプット)にその特徴を属性として付与して変換した。このように学習データから特徴を獲得し、画像の合成や画風の変換、特徴の付与などが可能である」。出典 → 2018年09月04日記事:GAN:敵対的生成ネットワークとは何か ~「教師なし学習」による画像生成 – アイマガジン|i Magazine|IS magazine。元の出典(出典9):「Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks」
ここまでくれば原理がわからなくても、その方法を使用した結果はわかる。
そう、ウェスタンブロットのバンドの枠線を引いて、AI処理すれば、好みのバンドを全く新しく合成できる。
そのバンドは既存のバンドとは無関係なので、既存のバンドと比較して「ねつ造・改ざん」と判定されることはない。
現代技術を使えば、上記の状況になった。
●4.【論文内容】
●《1》序論
ウェスタンブロッティングは、分子生物学および免疫遺伝学の研究で広く使用されている分析手法です 。
しかし、1990 年代以降、ウェスタンブロットに基づくタンパク質分析の正確さと再現性は、学術界から疑問視され始めます。
ウエスタンブロット画像は科学論文で見つかったネカト画像の大半を占めるようになったからである。
ネカトハンターのエリザベス・ビック(Elisabeth Bik)らは、1995 年から 2014 年までに出版された合計 20,621報の論文をスキャンした。その結果、25論文当たり1論文にウェスタンブロット画像またはその他の画像に異常があると発表した。 → Bik E M, Casadevall A, Fang F C. The prevalence of inappropriate image duplication in biomedical research publications. MBio, 2016, 7(3)
有名なネカト防止プラットフォーム「撤回監視」(www.retractionwatch.com) では、「ウェスタンブロット」というキーワードで検索すると200 を超える記事が表示される。 → Search Results for “western blot” – Retraction Watch
現在、問題のあるウェスタンブロット画像は、重複バンドかどうか、目視で検出されている。
これらの方法では、既存の画像を加工した画像しか検出できない。既存の画像に基づかないで作ったウエスタンブロット画像は見逃される。
●《2》結果
★白楽には解読不能
最近、敵対的生成ネットワーク (GAN) とその拡張の分野で大きな進歩があった。 GAN は、2 つのニューラルネットワーク間のミニマックスゲームに基づいて動作する。ジェネレーターはサンプルを生成し、ディスクリミネーターはサンプルのソースを識別する。
と論文の冒頭を意訳しようと書いてみたけど、白楽は中身を解読できない。
以下は論文の図1である。この図を見ても、図1の入口のAの段階で何を解説しているのか解読できない。
★白楽が理解した部分
それで、解読は諦めた。しかし、論文が主張していることはネカト研究者にとって重要である。
論文中の理解できた部分だけ、以下に羅列した。
- 敵対的生成ネットワーク (GAN)を使えば、リアルな画像を生成することができる。もっともらしい画像の生成、テキストから画像への生成、画像から画像への変換、画像補完、超解像度などができる。
- 合成ウェスタンブロットは実際のウェスタンブロットと実質的に区別できない。
ナサケナイケド、GANの原理はわからない。合成ウェスタンブロットの作り方もわからない。でも、論文の主張していることが重要だということだけは理解できる。
●5.【関連情報】
なし。
●6.【白楽の感想】
《1》画像の「ねつ造」
今回の論文に書かれているように画像のAI合成が容易にできるようになれば、論文の画像「ねつ造」の新しい時代に突入するだろう。
目視で画像の「ねつ造」を見つけてきたエリザベス・ビック(Elisabeth Bik)の出番がなくなる。
つまり、論文の画像をいくら解析しても「ねつ造」と判定できない。さらには、元データを提出させても、元データそのものをAI合成していれば、元データを提出さる意味がない。
ウエスタンブロット装置がなくてもウエスタンブロット画像をデータに含んだ論文を作れる。
ねつ造検出の第一歩は、研究者の実験室にウエスタンブロット装置があり、ウエスタンブロット実験を行なった証拠があるかないか、になるのだろうか?
また、研究室のパソコンを強制的に押収し、GANで画像をAI合成した証拠をつかむことになるのだろうか?
技術革新は新しい不正手法も提供する。そして、新しいネカト検出手法・防止方法の開発が必要になる。
《2》完全盗用
画像だけでなく、文章も類似の操作ができるのだろうか? 例えば、文章Aを適当なソフト(盗用すり抜けソフトと呼ぼう)で変換すると、内容がよく似ているが異なる文章Bを作れるという盗用すり抜けソフトは開発されるだろうか?
開発されると、この文章がいいなあと思えば、盗用すり抜けソフトを使って文章を変換する。そして、画像もGANでAI合成する。両方を合わせて、完璧に検出不能な盗用論文ができる。
という時代が来るのか?
ーーーーーー
日本がスポーツ、観光、娯楽を過度に追及する現状は日本の衰退を早め、ギリシャ化を促進する。日本は、40年後に現人口の22%が減少し、今後、飛躍的な経済の発展はない。科学技術と教育を基幹にした堅実・健全で成熟した人間社会をめざすべきだ。科学技術と教育の基本は信頼である。信頼の条件は公正・誠実(integrity)である。人はズルをする。人は過ちを犯す。人は間違える。その前提で、公正・誠実(integrity)を高め維持すべきだ。
ーーーーーー
ブログランキング参加しています。
1日1回、押してネ。↓
ーーーーーー
★記事中の画像は、出典を記載していない場合も白楽の作品ではありません。
●8.【コメント】
注意:お名前は記載されたまま表示されます。誹謗中傷的なコメントは削除します
進化してますね。我々も独自の解析部署を持っていますが。。