Hatena::Groupflurry

flurryのメモ

 | 

2013-08-02(メモ)確定診断とかゴールド・スタンダードとか このエントリーを含むブックマーク このエントリーのブックマークコメント

  • 【注意】筆者は医療関係者ではありません。個人的なメモであり、内容が正しいかどうかについてはまったく保証しません。

経緯

北里大学の坂部氏による発言の解釈をめぐるところから議論がスタートします。(実際のツイートについては、この辺りからたどっていただけると。ただ、枝分かれしているのでたどるのが大変かもしれません。https://twitter.com/flurry/status/361317630688243712

クリーンルームでの確定診断】

「(クリーンルーム内での二重盲検に基づく負荷試験による)検査が最も確定的で客観性のある検査だと考えています」

http://www.igaku-shoin.co.jp/nwsppr/n2002dir/n2510dir/n2510_03.htm

  • (この発言についての私の主張)
    • 「確定診断」(下の用例1)とあるので、「疾患である」ことを示す検査であっても、「疾患ではない」ことを示す検査ではないのではないか。
    • つまり「検査が陽性→疾患である」は言えても「検査が陰性→疾患ではない」は言えないのではないか。
  • (NATROMさんの主張)

この議論から派生して、以下の論文概要をどう解釈するかが現在の焦点となっています。

診断のゴールド・スタンダードは負荷試験であるが,これも自覚症状の変化を判定の目安として使わざるを得ない.そういう制約はあるが,我々の施設ではこれまで化学物質負荷試験を,確定診断の目的で施行してきた.

http://jja.jsaweb.jp/2009/058020112j.html

坂部氏の文章の解釈を問題としたときと同様に、

  • (私)「確定診断とあるので、『検査が陰性→疾患ではない』は言えない」
  • (NATROMさん)「ゴールドスタンダードと書かれているので『検査が陰性→疾患ではない』となる」

となります。

「確定診断」について

  • 用例1(私の現時点での理解)
    • 「○○という病気である」と診断すること。「○○という病気ではない」という診断(除外診断)とは別。検査の場合は「検査が陽性 → ○○という病気である」ということになる。
    • 検査が陰性だった場合に何も言えないということは意味していません。何かしらの蓋然性に基づく情報なりが得られるのではないでしょうか。
  • 用例2(?)
    • よく知らないのですが、「確定診断」の一語で除外診断も同時に意味するという用法もあったりするんでしょうか?

「ゴールドスタンダード」について

この用語の意味がわからなかったので簡単に調べてみました(本当はNATROMさんにどこか出典を示してもらうのがいいと思うのですが)以下は現段階での私の理解です。

  • 用例1(「標準的な手法」)
    • 先日「ステッドマン医学大辞典」を立ち読みしたところ、「信頼度が十分に高く、医師間で標準とみなされた手法を指す俗語」みたいなことが書いてあった気がします。うろ覚えですが。まあ、これは英語の意味から類推しやすい気がします。
      • (追記)コメント欄で教えていただきました。本質的ではないと思いますが、かなり違いますね……
  • 用例2(「参照基準」)

定義上、ある診断方法をゴールドスタンダードと定めると、その診断法は感度100%特異度100%の検査だということになります。「その診断方法を基準にしましょう」という意味。

http://twitter.com/NATROM/status/362502353808658434

    • EBMとか臨床疫学とか臨床研究デザインの分野とかだと、ゴールドスタンダードという用語は、用例1に加えてさらに「基準となる検査方法」という特別な意味を持つようです。何を測るための基準=モノサシかというと、「他の」検査方法の信頼性になります。
    • たとえば、悪性腫瘍の診断に際して、組織の病理検査(一般的に「決め手」とされるが、患者への負担が大きいし、そもそも実際に手術しないとならなかったり)をゴールドスタンダード=基準にして、何らかの血液検査(患者への負担が小さい)による診断について評価するといった場合ですね。
    • ある検査手法の正しさを評価する際には、「診断:陽性/陰性、病気:あり/なし」( http://d.hatena.ne.jp/NATROM/20130314 )の2×2の表を用います。ここで「でも、そもそも病気のあり/なしって、どうやって見分けるの?」という疑問が湧いてきますが、「病気である=ゴールドスタンダードで陽性」「病気でない=ゴールドスタンダードで陰性」と、とりあえず『定義』することで、その検査手法について(ゴールドスタンダードと比較した)正しさを評価することが出来るようになるわけですね。

で、「負荷試験がゴールドスタンダードである」と書いてある→「検査で陰性→疾患ではない」は言える?

で、くだんの論文概要( http://jja.jsaweb.jp/2009/058020112j.html )に話題を戻します。現段階での私の意見はこんな感じでしょうか。

  • (以前からの主張)「確定診断」とあるので、「検査が陰性→疾患ではない」は言えないのでは。
  • 彼らが実施してきた負荷試験は標準化されているようには見えないし(「プロトコル標準化が行われるべきである」みたいに結論に書いてあるので、世の中一般にもまだ存在してないように見える)ここでの「ゴールドスタンダード」を(用例2)のような狭い意味で解釈するのは難しいのではないか。
  • (もし、仮に)「該当部分は『何らかの適切にデザインされた負荷試験はゴールドスタンダード(用例2)たりうる』 という信念について述べているにすぎない」と解釈してみたとしても……
    • いやそれ、何を意味するの……っていう。めんどいので後まわし。

kubotakubota2013/08/06 15:58通りすがりですが、ステッドマン医学事典では「最も有用であると広く認められている方法を記述するのに用いられる俗語」とあります。

flurryflurry2013/08/06 18:12わ、ありがとうございますー!

flurryflurry2013/08/08 15:37通りすがりのものですが、基礎医学、臨床医学ともに、flurryさんのお調べになられた使い方が一般的だと思います。感度100%特異度100%なんて検査や実験方法なんて存在を想定するのは、普通の医学者は考えていないと思いますよ。
一応、臨床医学、基礎医学の両方で活動してきた経験のあるもので、恥ずかしながら、"gold standard"という言葉を、拙著の英文レビューで使用した経験がありますが、flurryさんのおっしゃる意味で使用していました。
議論の詳しいことはフォローしていませんが、お相手の方と、良い解決点が見つかるといいですね。

Afro floorladyAfro floorlady2013/08/08 15:50あれ?上のコメントの名前が、flurryになってしまっていますね。名前欄を空欄にしたからかな?こちらのネームで宜しくお願いします。ちなみに、たとえば基礎医学で、どんな使われ方をするかと言うと、「1990年代のapoptosisの判定のgold standardはtransmission electron microscopyによるultrastructuralな所見、すなわち、chromatin condensationの存在と、初期には比較的intactな細胞質所見」とかなんとか。まあ典型的なapoptosis, necrosisが綺麗に分かれるわけではなく、spectrumをなしていると言うのは当初から言われていましたので、100%の特異度でも感度でもありませんでしたがね。当時、利便性の高かったDNA電気泳動の感度の悪さや、特異度の低さ、TUNELアッセイといわれるものの特異度の低さと解釈の難しさが指摘されていたことに対して、TEMの方が、形態学を主体とした情報量が多いよ、というくらいの感覚で、周囲の学者は使っていましたね。懐かしいな。

flurryflurry2013/08/08 17:45わー、ありがとうございます。あとでコメントをじっくり読ませていただければと思います。コメント欄の名前のデフォルトがflurryになってしまうのは知りませんでした……

Afro floorladyAfro floorlady2013/08/08 20:24こちらこそ、もろもろの貴重な情報を有難うございます。
一応、公平性のために、お相手の方の気持ちも汲んで、補足させておいていただきますね。
数学でも何でもそうですが、物事の定義には、大体、「狭義の定義」と、「広義の定義」が存在することが多いですよね。
医学検査や判定基準に、もしも理想的なものがあると仮定すれば、100%の特異度、100%の感度の検査を、「狭義の定義」でのゴールドスタンダードと考える考え方に異論はありません。(まあ、そもそも、ゴールドスタンダードという言葉自体が、医学論文でも「比喩的」にしか使われない、non-technical termなので、厳密な言い方もヘッタクレもないのですが)。
一つ前のコメントの例でも書きましたように、何かの生物学的現象や、あるいは、臨床診断というのは、ある程度の広がりを持ってスペクトラムとして存在していることも多いし、そもそも検査や実験手法と言うのが、程度の差こそあれ、すべからく、誤差や不確定性やノイズというものを内包しているので、一般的には、ゴールドスタンダードも、もっと広義の定義として使われることが多いと判断していてOKだと思います。
お相手の方のロジックは、この、狭義の定義が、途中から、広義の定義に摩り替わっていて、厳密なロジックではない、というところに、行き違いでもあるのでしょうかね?

flurryflurry2013/08/08 22:02たびたびありがとうございます。「感度100%特異度100%」「基準となる」ですが、私は本文にも書いたように、他の検査方法を評価するための基準だと思っていたのですが、先方は実は「その検査方法を基準として病気それ自体を定義する」という意味での「基準」「100%」と考えているのではないかとも想像しています。……相手に直接訊ねるのが早いとは思うのですが。

情報屋情報屋2013/08/09 00:44別の通りすがりのものですが、gold standard という用語は、コンピュータ関係の論文では良く出てきます。
通常の場合、その意味は「参照基準」で、人間の判断を gold standard として、コンピュータの結果と比較することが多いです。
「標準的な手法」の意味で使用することもありえると思いますが、私は見た記憶がありません。

Afro floorladyAfro floorlady2013/08/09 04:09flurryさん
何の病気のことが、どう議論になっているのか、あまりフォローしていないのですが、難しい問題が議論に絡まっているようですね。
まあ、多くの病気にとって、100%の特異度の診断基準というのは、難しいこともあるでしょうね。病気の定義や概念も、時とともに変遷していくことも、ままありますし、スタンダードだった診断基準や検査が、そうでなくなって行くこともあるわけですから、flurryさんのおっしゃる使い方もしっくりと来ますね。
ちょっと私の書き方も、誤解を生む書き方だったかな。上に出したapoptosisのgold standardの場合、WyllieやKerrたちがこの現象をcharacterizeした当初(本当の第一発見者は19世紀のFlemmingやNissenと言われてますが)、ultrastructureによる分類を頼りにしていたので、TEMをgold standardにした、という部分はありますね。ただ、研究が進むにつれ、対比されるnecrosisと必ずしも、綺麗に分かれない部分も出てきて、形態学上はスペクトラムをなしていることが分かってきたし、その形態に至るいろいろなメカニズムが詳しく分かってくると、apoptosisという言葉の使い方もだんだんファジーになってきて、比較的緩く使う人と、厳密な形態学上の定義に従う人と、混在してきた時期がありましたね。まあ、確かに語句の正確な使用は大事なんですが、基礎医学の場合、あまり重箱の隅をつつくよりは、みんなで新しいものを発見していきましょう、とか、本質を理解していきましょう、という流れになることが多いので、ゴールドスタンダードの議論が、本質の理解上大事な事項にならない限り、暗黙のうちに棚上げされることもあるような気はしますね。
上手く議論が解決していくといいですね。

flurryflurry2013/08/09 11:48>Afro floorladyさん
そうですね、いろいろと工夫してみます……>『上手く議論が解決していくといいですね』 どうもありがとうございました。

flurryflurry2013/08/09 11:50>情報屋さん
なるほどです。どういう分野かよく分かってないのですが「人間が判断すること」が重要だったりするのでしょうか……

情報屋情報屋2013/08/09 21:39人間の判断かどうかは重要でないです.
どちらかというと,「完全に正しい訳ではない」ということを暗に示しています.

画像認識やスパム判定の精度は,人間の方がコンピュータより高いです.
そのため,こうした分野ではコンピュータで人間並みの精度が出せるように頑張る訳です.
しかし,中には人間でも100%の精度で判定できない問題があります.

例えば「字がきれいかどうか」をイエスかノーで判定する場合,判定基準が人によって変わりますし,同じ人がやっても,時間がたてば結果が変わるかもしれません.
そのため,「完全な正解」というものは存在しません.

コンピュータで「字がきれいかどうか」を判定させるプログラムを作り,その性能を評価する場合,ある人の判定(もしくは複数人の多数決の結果) を「正解」とみなして,コンピュータの性能を測ります.
この「正解」を gold standard と呼びます.

これから類推すると,ある検査を現実にはありえない「感度100%、特異度100%」の検査とみなすことを gold standard と呼ぶのは,私には納得のいく表現方法です.

 |