研究者の声:オピニオン
Tweet2012年6月29日更新
科学英語に関して(5ページ目/全5ページ)
■科学英語に関して その5: 統計学者からのアドバイス
統計学は社会科学においても、自然科学においても、重役のような存在で、欠かすことができません(Ref.1)。実際に、有力なJournalの中には、統計学者をReviewerとして迎えています。そうしたJournalにおいて、統計学を軽んじてはネガティブな印象を与えることがありえます。このコラムでは、多くの研究に欠かせないその統計学から、論文の執筆に関連する事
柄をに2点紹介させていただきたいと思います。1点目は、統計学用語の誤用について、2点目は統計手法を書く
際の考え方についてです。
『統計学用語の誤用について』
おそらく誰もが、「DNA」が生命科学における専門用語と認識できるかと思います。しかし、DNAと いう単語は、その「デオキシリボ核酸」という意味を脱して、抽象的な意味をもつ単語として用いられることもあります。「企業のDNA」「科学者のDNA」などというように、新聞記事などで利用されることなど想像できるのではないでしょうか。
例) http://www.hondatrading-jp.com/business/living.shtml
http://itpro.nikkeibp.co.jp/article/COLUMN/20071203/288530/
http://www.layers.co.jp/company/message_03.shtml
社会では「私の企業と、あの企業のDNAは一緒だ」という表現は成り立つのかもしれませんが、科学的には馬鹿げています。
私の書いている文章にもこうした馬鹿げた表現が無いことを祈って止みませんが、科学論文においては、こうした専門用語の誤用について、統計学者が警告します。significance, variable, robust, gross, likelihood, level, factor, sample, random, parameter... 一見すると普通の単語として使えそうなものですが、これらは統計学の理論とその応用やそれに基づいた解釈において重要な役割を果たします。
たとえば、Significanceと いう単語は、結果の有意性の有無を示する単語ですが、そういった科学的な有意性という意味ではなく、著者の任意の解釈としてこの単語を用いることは問題と なるのです。さらに、Significanceは確率に基づいて用いられるため、その誤用は、著者の科学的検証の理解に関して懐疑の芽を育むこととなります。科学英語で用いる英単語としては、非常に侮れない単語なのです(Ref.2)。
Parameterという単語は様々な分野で非統計学的に使われているようでDr. Goodmanは次の論文でその事実を紹介しています。(paradigmという単語についても、揶揄する調子で紹介しています。)
N.W.Goodman,
Paradigm, parameter, paralysis of mind
Brit Med J, 1993;307:1627-9
(Ref. 3)
parameterという単語について、この論文で挙げられている曖昧な使用例は、
・変数(variable)としての意味
・指標(measure, index)としての意味
・測定対象の種類(types)としての意味
論文を参考に簡単な例を挙げるとparameters of the phenomenum、to analyze
the economic parameters などと書いてみると、それらしく読めます。しかし、実態としては何かわからないということです。この例ですと、measurable
characteristics of the phenomenum、to analyze the economic variablesと書いた方が良いと言えるのです。parameterというのは、データの分布・形状・確率を示す量的な因子を意味します。meanやstandard
deviationといった単語の出てくる科学論文において、parameter という単語の誤用は紛らわしいというわけです。
皆さんは、Method SectionにGross Analysisと いう標記があったら何を思い浮かべますか?経済学と解剖学においてあり得る話ですが、全く意味が違います。そんな形で、各分野において見慣れた単語にも専門性が潜んでいるものなのです。統計学は量的な研究には何らかの形で貢献しているので、統計学用語が筆者の意図しない意味で使用され、誤解を生むことが
あり得るのです。論文を書く際にはもちろん、目を通す段階から、気をつけていたいものですね。
統計学者の述べる2点目は、統計学の方法と科学論文との関係についてです。統計学の教育について論じている次の論文を参考にしました。
G. Samsa, E. Z. Oddone,
Integrating Scientific Writing Into a Statistics Curriculum:
A Course in Statistically Based Scientific Writing
Ame Stat, 1994;48:117-119
(Ref. 4)
近年、生命科学の分野では、統計手法が適確に用いられていないことが問題となっています(Ref. 5,6)。たとえば、Nature Medicineという有力なJournalでは、ある期間に公に出た論文の、約30%のP値(結果の有意性を示す一つの指標)が誤りであったと報告されています(Ref.7)。そうした過ちについて指摘されているように年々、統計手法に関するReviewの目は厳しくなっています。正しい統計を用いるのはもちろんのこと、Method Sectionにおいて、仮説に対して適確な統計方法を採用していることを示さなくてはなりません。その執筆の際のキーポイントについて、Dr. Samsaは述べています。
Dr. Samsaは、ある統計手法を用いる際に、何を統計学的に試験しているのか、さらにその統計方法の条件(前提)を明示することを勧めています。さらにMethod
Sectionを越えて、もともとの仮説を試験するにその統計方法が適当であることを明示し、結果の解釈では、仮説と解析方法と結果との関係を示すことを勧めています。
Dr. Samsaの挙げる具体例を噛み砕いて紹介したいと思います。2群の平均値の比較検定において、t-testとWilcoxon testの両方が使われることがよくあります。その使用をMethod Sectionに述べる際には、どんなときにt-test、あるいはWilcoxon testを使うのか、どのグループを比較対象群にしているのか明確にし、さらにその検定に基づいた結果を解釈する際には、検定によってどの仮説がどう明らかになったのか論ぜよということです。
一般的に科学論文では、Method Sectionにおいて、なぜその方法を採用したのか論じることが求められています。Dr.
Samsaの勧めていることの1つはまさにそれと同意なのですが、さらに
1)元々の仮説を試験するのにその検定が適当か
2)研究のデザインと検定との相性は妥当か
3)検定の結果がその仮説の試験と証明とが適確に関係しているか
を明確にするように求めています。つまりは、統計方法をイントロダクションから結果とその解釈まで、『リンク』させることを勧めているのです。
この『リンク』についてよく私がよく思い起こすことは、相乗効果という概念です。たとえば、AとBという2つの薬があり、薬の効果を測るためのCという因子について、動物実験を行ったとします。そして、次のような結果が得られたとします。(生命科学に疎い方は、AとBを、馴染みのある何らかの環境の因子の有無として考え、Cについては結果の効果を測るのに適当な因子として捉えてていただければ良いかと思います。)
@群:AもBも投与しなかったとき、Cの値の変化=±0
A群:Aだけ投与したとき、Cの値の変化=+5
B群:Bだけ投与したとき、Cの値の変化=+5
C群:AとBと同時に投与したとき、Cの値の変化=+20
このとき、@〜Bとの間では有意な差は無く、Cについては@〜Bとの差が有意だったとします。このとき、AとBとの薬には相乗効果があるという結論を出せるでしょうか?答えは出せません。相乗効果とは、ここでは、C群で得られた効果が、A群とB群を組み合わせた効果(期待されるのはCの値の変化=+10)を上回ることをいいます。したがって、単純な2つの群の比較では検証できません。しかし、膨大な実験・解析のなかでこうした比較検討の対象と導かれうる結論のミスマッチは、埋もれてしまいがちです。検証方法と結果、解釈において『リンク』が破綻してしまうということになります。
皆さんの目にする研究論文において、統計方法だけ詳細に欠け孤立しているような論文はありませんでしょうか。そういった論文ではなく、統計を含めて筋が通っているものを執筆することが統計学者より推奨されています。Dr.
Samsaはその統計手法を盛り込んだ、導入から結論までのつながりを強調しています。ぜひそのつながりを念頭に、論文に目を通してみてください。
***
これで、科学英語に関するコラムはお終いです。科学英語と いうと、非英語圏から留学した者としての問題があるように感じますが、それだけではありません。英語力があれば書けるものでもなく、さらに、英語力以外の
構成のところで質を向上させることができるものなのです。科学論文自体が研究対象となり、いろいろな視点から眺めることができるということで、私のコラムが皆さんの科学的な興味をくすぐり、科学英語の執筆が楽しいものと感じていただけたら幸いです。
Ref. 1, J. Neyman, Statistics - Servant of All Sciences, Science, 1955;122:401-406
Ref. 2, J. A. C. Sterne, G. D. Smith. Sifting the evidence - what's wrong with statistical tests?, BMJ, 2001;322:226-231
Ref. 3, N.W.Goodman, Paradigm, parameter, paralysis of mind, BMJ, 1993;307:1627-9
Ref. 4, G. Samsa, E. Z. Oddone, Integrating Scientific Writing Into a Statistics Curriculum: A Course in Statistically Based Scientific Writing, Am Stat, 1994;48:117-119
Ref. 5, E. Garcia-Berthou and C. Alcaraz, Incongruence between test statistics and P values in medical papers, BMC Med. Res. Methodol., 2004;4:13-17
Ref. 6, J. Giles, Statistical flaw trips up study of bad stats, Nature 2006;443:379
Ref. 7, Editorical, Statistically Significant, Nat Med, 2005;11:1