AIはなぜ「海外＝日本」と思い込んでいるのか？

AIに「外国の文化の例を挙げて」と聞くと、なぜか日本が出てきやすい、そんな研究結果がありました。

寿司、茶道、神社、侍、着物、禅、アニメ、漫画。

まるでAIの頭の中に、「海外文化といえば日本」という引き出しがあるようです。

もちろん、AIに頭の中はありません。

でも、答え方のクセとしては、たしかにそう見えるのです。

AIは国名を指定しなくても、日本を選びがち

2026年4月にarXivで公開された論文「Why are all LLMs Obsessed with Japanese Culture?」です。

研究チームは、CROQという文化に関する質問データセットを作りました。

24言語、11分野、66サブトピック、合計31,680問という大規模なものです。

質問はたとえば「家族生活を形づくる価値観は？」のようなもので、国名は指定しません。

AIに「どこの国を例にするかは自分で選んで」と任せるわけです。

すると、多くのAIが文化の例として日本やアメリカをよく選びました。

特に日本は、調査対象の8モデル中6モデルで、入力言語の国を除いたときの最多参照国だったと報告されています。

なぜ日本なのか

ここで大事なのは、AIが日本のデータばかりで学習したわけではない、という点です。

むしろLLMの事前学習データは、英語圏・欧米圏のWebに大きく依存しています。

日本語のデータは数％でしょう。

でも、だからこそ、AIは「欧米から見た外国文化」として「日本」を強く学んでいる可能性があります。

欧米の文脈で「foreign culture」「traditional culture」「exotic example」といった話をするとき、日本はとても使いやすい存在です。

とても異国的なのに、文化を表す記号が豊富。

寿司、ラーメン、禅、神社、侍、アニメ。

海外でも伝わるワードがてんこ盛りです。

さらに日本は、AIにとって“安全な異文化”でもあります。

中国、ロシア、中東、イスラエル、インドなどを例にすると、政治、宗教、民族、安全保障の話題につながりやすい。

一方で日本は、少なくとも文化紹介の文脈では、比較的センシティブになりにくい。

AIは「無難なこと」を選びたがる傾向があります。その点でも日本は選びやすいのかもしれません。

つまり日本は、「外国っぽさ」「わかりやすさ」「炎上しにくさ」のバランスがいいのです。

欧米中心のWebデータから、欧米から見た外国文化、日本の説明しやすさ、SFT後の代表例化へつながる流れ — 日本は「世界の中心」だからではなく、AIにとって使いやすい文化サンプルになっている可能性があります。

日本の強さは、伝統文化だけではない

ただし、ここでいう日本の強さは、伝統文化だけではありません。

現代の日本コンテンツも、世界市場で本当に強いのです。

たとえばポケモンは、ギネス世界記録で「最も売れたメディアフランチャイズ」とされ、2024年4月時点で推定1,470億ドルの売上を記録しています。

これはミッキーマウス、ディズニープリンセス、スター・ウォーズといった巨大IPを上回る規模です。

ポケモン公式の統計でも、2026年3月末時点で、ポケモン関連ソフトの累計出荷は5.15億本超、ポケモンカードの累計生産は850億枚超に達しています。

アニメは190以上の国と地域で放送されています。

これはもう「日本好きの一部の人が盛り上がっている」というレベルではありません。

世界中の子ども、大人、コレクター、ゲーマーの生活に入り込んだ、巨大な文化インフラです。

日本のコンテンツは、キャラクター、ゲーム、漫画、アニメ、カード、グッズを横断して広がるのが強みです。

ひとつの作品が、ゲームになり、アニメになり、映画になり、カードになり、ぬいぐるみになり、イベントになり、世界中の人の「共通言語」になります。

ポケモンの推定売上、ゲーム出荷、カード生産をまとめた図 — AIが見るWebには、伝統文化だけでなく、世界に広がった日本IPの痕跡も大量に残っています。

AIはその痕跡を大量に見ている

「日本文化」と聞いたとき、AIの中には茶道や神社だけでなく、ポケモン、マリオ、ハローキティ、ドラゴンボール、ワンピース、ナルト、ジブリ、鬼滅の刃のような現代コンテンツの記憶も重なっているはずです。

つまりAIにとって日本は、古い伝統文化の国であると同時に、世界で最も成功したキャラクター文化の国でもあるのです。

これがかなり大きいと考えられます。

また、この論文が面白いのは、この偏りが事前学習だけでなく、SFTやinstruction tuningの後に強まる可能性を示している点です。

SFTやinstruction tuningとは「人間の返答に答える能力を学ばせる」方法です。

基本的にLLMは、事前学習（大量のデータを読み込ませただけ）のみ段階では、ただ次の言葉を予測するだけの存在です。

SFTやinstruction tuningなどの追加訓練をすることで、ChatGPTのように会話ができるようになります。

事前学習AIの場合：（質問）「〇〇を教えて」
→AI「◯◯を教えてください。よろしくお願いします」（言葉を予測しただけで会話にならない）

追加学習後：（質問）「〇〇を教えて」
→AI「◯◯とは、一般的に△△から作られていて...」（ちゃんとした返事ができる）

base model（事前学習のみ状態）では参照する国が比較的ばらけていたのに、追加学習後では、日本やアメリカのような“使いやすい代表例”に寄りやすくなったのです。

これは「日本文化が世界最強」という単純な話ではありません。

むしろ、AIが世界を説明するときに、どの国を“便利な例”として使っているのか、という話です。

キノコード的にはどう考えるか？

AIは文化を語るとき、毎回ゼロから世界地図を広げて考えているわけではありません。

よく出てくる例、説明しやすい例、無難な例を選びます。

その結果、日本が「海外文化のデフォルトの例」になっているのかもしれません。

少し不思議で、少しおもしろい現象です。

でも同時に、これは大事な問いでもあります。

AI時代には、どの国が強いかだけでなく、どの国が“例として使われるか”も意味を持ちます。

プログラミング学習でも同じです。

AIが出す例は、便利ですが、中立とは限りません。

「なぜこの例が出てきたのか？」と一歩引いて考える力が、これからますます大事になります。

AIを使うときは、答えの内容だけでなく、答えのクセも観察してみる。

それは、プロンプトを書く力にも、情報を読み解く力にもつながります。

まとめ

AIにとって日本は、世界の中心ではありません。

けれど、「海外」を説明するには、やけにちょうどいい国なのです。

伝統文化があり、現代コンテンツが強く、欧米から見ても十分に異国的で、しかも比較的説明しやすい。

この「ちょうどよさ」が、AIの答えの中で日本を目立たせているのかもしれません。

AIの答えを見るときは、「何が書かれているか」だけでなく、「何が代表例として選ばれているか」も見てみる。

そこに、AI時代の新しい読み解き方があります。

参考

Why are all LLMs Obsessed with Japanese Culture?

Guinness World Records: Pokémon celebrates its 30th anniversary

The Pokémon Company: Pokémon in Figures

AIは国名を指定しなくても、日本を選びがち

なぜ日本なのか

日本の強さは、伝統文化だけではない

AIはその痕跡を大量に見ている

キノコード的にはどう考えるか？

まとめ

参考

関連する学び