MBTIが「当たらない」のは精度の問題じゃない──診断の正しい読み方は「解像度」で決まる

MBTIを2回受けました。

1回目はINTJ。

2回目はINTP。

「……どっちが本当の自分？」

この問いに、正直、しばらく引っかかっていました。

ネットで調べると「MBTIは科学的根拠がない」「再テストで50%の人が結果が変わる」という批判記事が出てくる。

一方で「MBTIは当たる」「自分を深く理解できた」という擁護記事もある。

結果が変わる体験は、実は珍しくありません。

Myers-Briggs Companyのデータでは、4週間後の再テストで35%が4文字中1文字以上変わっています。

Pittenger（1993）の研究レビューでは「39〜76%が異なるタイプコードを取得する」とされています。

でも、この記事で書きたいのは「MBTIは信頼できるか、できないか」ではありません。

もっと手前にある話です。

「当たるか当たらないか」で診断を評価している限り、どちらの結論に着地しても、自己理解は深まらない。

ここに構造的な罠があります。

「当たる/当たらない」で性格診断を評価するとき、何が起きているか
- 「当たった」の正体──バーナム効果という回路
- 「当たらない」が教えてくれること
性格診断の信頼性が測っているものの正体──「真実」ではなく行動傾向の一側面
- 結果が変わるのは「エラー」ではなく条件の違い
「精度」ではなく「解像度」で診断結果を読む
- 観測値として読むと、変動が情報になる
まとめ：確定判決を求めない。観測データを積み重ねる
- 探索ログの関連記事
- 自己分析シリーズ

「当たる/当たらない」で性格診断を評価するとき、何が起きているか

「当たった」の正体──バーナム効果という回路

MBTIを受けて「すごい、まさに自分だ」と感じたことがある人は多いと思います。

ここで1つ、有名な心理学実験を紹介させてください。

1948年、心理学者フォアラー（Forer）が39名の学生に性格テストを実施しました。

そして全員に「あなた個人の結果です」と伝えて、同じ文章を渡しました。

星占いの本から抜き出した、誰にでも当てはまる汎用的な文章です。

結果、学生たちは0〜5点スケールで平均4.26点の一致度を付けました。

「自分にぴったりだ」と。

これがバーナム効果（フォアラー効果）です。

曖昧でポジティブな記述を「自分だけに当てはまる」と感じてしまう心理メカニズム。

「at times」（ときどき）のような両面的な表現、権威ある人物からの提示、肯定的な内容──こうした条件が揃うほど、効果は強くなります。

MBTIの結果記述には、まさにこれらの条件が含まれています。

つまり「当たった」と感じた瞬間に、それが「正確だから当たった」のか「バーナム効果で当たった気がしているだけ」なのかを、本人が区別する方法がありません。

「当たらない」が教えてくれること

一方、「当たらない」と感じた場合。

多くの人はこう考えます。

「この診断は信頼性がない」「受けても意味がなかった」。

でも、ちょっと立ち止まってみてください。

「当たらない」には2つの可能性があります。

1つは、本当に診断ツールの精度が低い場合。もう1つは、そもそも測定対象を誤解していた場合。

たとえば体温計で「自分の気持ち」を測ろうとしたら、「当たらない」のは当然です。

体温計が壊れているわけではなく、体温計に期待しているものが間違っている。

性格診断でも同じことが起きています。

「診断が自分の性格の真実を教えてくれるはず」と期待して受けると、そこからズレた結果は全部「当たらない」になります。

ここが面白いところで、「当たらない」と感じた瞬間にこそ、「じゃあこの診断は何を測っているんだろう？」という問いが立ちます。

この問いが、実は自己理解の入口です。

正解を探すのをやめたら動き出した話でも書きましたが、「正解かどうか」で評価すること自体が、思考を止めてしまうことがあります。診断も同じ構造です。

性格診断の信頼性が測っているものの正体──「真実」ではなく行動傾向の一側面

ここで、各診断ツールが実際に何を測っているかを整理します。

MBTI：認知パターン（情報の受け取り方と判断の仕方）
ストレングスファインダー（CliftonStrengths）：才能（自然に繰り返される思考・感情・行動のパターン）
エニアグラム：根源的な動機（何を恐れ、何を求めるか）

どれも「性格全体」を測っているわけではありません。

あなたという多面体の、それぞれ異なる一面に光を当てているだけです。

ここに、MBTIの「信頼性は高いが妥当性は低い」という学術的な知見が重なります。

2025年に発表された193研究のメタ分析（Erford & Zhang）によると、MBTIの内的整合性は0.845〜0.921と高水準です。

つまり「質問項目間の一貫性」は十分にある。同じものを一貫して測っている。

ところが、外部指標との相関（収束的妥当性）を見ると、r≥0.50の相関はわずか2.8%しかありませんでした。

これ、分かりやすく言うと「MBTIは何かを安定して測っているけれど、その”何か”が他の心理指標と噛み合わない」ということです。

ぶっちゃけ、ここを理解していないと「信頼性は高い」「いや低い」の水掛け論が終わりません。

連続得点（スコア）の相関は0.85〜0.91と高い。でもカテゴリ分類（INTJかINTPか）に変換した瞬間に35%が変わる。

スコアとラベルは別物です。

結果が変わるのは「エラー」ではなく条件の違い

ストレングスファインダーも見てみます。

6ヶ月後の再テスト信頼性はr=0.73。Top10テーマの73%が長期間後も維持されます。

MBTIより安定していますが、それでも順位は入れ替わります。

これは「診断が壊れている」のではなく、あなたが変わったか、回答時の条件が変わったということです。

仕事が忙しい時期に受けるのと、休暇中に受けるのでは、前景に出てくる行動傾向は変わります。

16personalitiesとMBTIの違いでも解説していますが、そもそも使っているツールが違えば、測定対象自体が変わります。

結果の変動を「エラー」と見なすか「条件の違いが反映された」と見なすかで、そのデータの価値はまったく変わります。

「精度」ではなく「解像度」で診断結果を読む

ここまで整理してきた構造を、一言でまとめるとこうなります。

診断を「精度」で評価すると、「当たった/当たらない」の二択になる。「解像度」で捉えると、「どの側面を、どの条件下で、どの粒度で見ているか」という問いになる。

精度の発想は、アーチェリーの的に似ています。

的の中心に当たれば正解、外れれば失敗。正解は1つ。

解像度の発想は、写真の撮り方に似ています。

望遠で撮るか、広角で撮るか、赤外線で撮るか。

同じ風景でも、使うレンズで見えるものが変わる。

どれも「正しい」けれど、見えているものが違う。

心理学者ファンダー（Funder, 1995）のRealistic Accuracy Modelも、性格判断の正確さは「行動手がかりの利用可能性→検出→利用」の多段階プロセスだと示しています。

単純な「当たった/外れた」では捉えきれない構造がある。

観測値として読むと、変動が情報になる

この「解像度」の視点で自分の診断結果を見直すと、面白いことが起きます。

たとえば、僕の場合。

MBTIで1回目INTJ、2回目INTP。

ストレングスファインダーのTop5は収集心・内省・学習欲・達成欲・着想。

精度の発想だと「INTJとINTPのどちらが正しいか」で悩みます。

解像度の発想だと、「J→Pに変化した時期に何があったか」が情報になります。

当時、プロジェクトの終盤で締め切りに追われていた時期と、新しいアイデアを模索していた時期。

J（計画的・体系的）とP（柔軟・探索的）のどちらが前景に出るかは、環境で変わる。

ストレングスファインダーの収集心・内省・学習欲は、まさに「情報を集めて、自分の中で考え、体系化する」パターンです。

MBTIの結果変動すら、このパターンで「観測データ」として回収していることになる。

「観測」という判断軸の考え方で書いた通り、確定判決ではなく観測値として扱う。

この姿勢が、診断結果の使い方を根本的に変えます。

自分の中にある行動傾向を言語化する方法と組み合わせると、観測データの解像度はさらに上がります。

まとめ：確定判決を求めない。観測データを積み重ねる

診断は入口であって、出口ではありません。

「当たった」と感じても、そこで止まると思考が固定されます。

「当たらない」と感じても、全否定すると情報を捨てることになります。

どちらの反応も、「精度で評価する」という同じ思考回路の表と裏です。

この記事で提案したいのは、たった1つのフレームチェンジです。

診断結果を「確定判決」ではなく「ある時点・ある条件下での観測値」として読む。

すると、結果が変わることは「エラー」ではなく「異なる条件での異なる観測」になります。

観測値が増えるほど、自分の行動傾向の輪郭が少しずつ見えてくる。

もっと詳しく知りたい方は、診断を「ラベル」ではなく「観測データ」として使う方法もあわせて読んでみてください。

「当たるか当たらないか」を超えた先に、自己理解の使い方があります。