Googleの検索結果にミラーサイト(複製サイト)が表示されていたので、「amaten.com」というドメインから色々と調べてみたところ、法人サイトのドメインということが分かりました。

ミラーサイトは既に検索結果から消滅していますが、DNSハイジャックやDNSキャッシュポイズニングによる不正を受けたのか、もしくは、何かしらのSEO対策でもやっていたのかという疑念は残りました。

当サイト以外にも多数のサイトが複製されていた、このミラーサイト現象の概要をこの記事ではご紹介したいと思います。

Twitterトレンドランキングサイトのミラーサイトが現れた

Twitter APIの「GET trends/place API」で取得した人気ツイート・ハッシュタグデータを使い、トレンドワード・#ハッシュタグを月別ランキングでご紹介する「ツイータン」というサイトがあります。

サイトの詳細は下記でご紹介しています。

「Twitter トレンド ランキング」といったキーワードを3語たしてやっと検索結果の下の方にでてくるようなサイトだったのですが、先日ググってみると1枚目に検索結果が表示されていることに気が付きました。

が、よく見るとサイト名は同じものの、サイト説明文がDESCRIPTIONで設定しているものとまったく違います。違うというか、説明文は見たことがない文章になっているし、★マークの評価ポイントで10分の3.1の評価があったり、712票も何かしら投票されたという構造化データによるクチコミ抜粋表示も付いておりました。

ツイータンのTITLEタグデータがそのまま使われた複製ページが存在した
TwitterトレンドランキングサイトのTITLEタグデータが複製されています

サイト名は以前設定していたTITLEタグそのまま

今のサイトTITLEタグは「ツイータン – Twitterトレンドランキング」にしていますが、

<title>ツイータン - Twitterトレンドランキング</title>

複製された「ツイッタートレンドランキング|ついーたん」という平仮名サイト名は1カ月前頃までこのサイトで使っていたものだったので、その頃までに取得したデータでサイト名TITLEを複製したということのようです。

<title>ツイッタートレンドランキング|ついーたん</title>

サイト説明文や評価は不明

Googleの検索結果に表示されているサイト説明文や評価はサイトのものではないようですが、説明文の文章自体はTwitterに関連する文章がしっかり表示されているようでした。

表示されている文言の「ちなみにトレンド入りしているワードを#ハッシュタグなどを取り入れれば」という文字列でググってみたところ、どうやらこちらのデジラボというサイトの記事文章を使っているようでした。

サイト説明文の文章はこのサイトの記事文章が表示されていた
サイト説明文の文章はこちらのサイトの記事文章が表示されているようです

あちこちのサイトやブログからスクレイピングでデータを取りまくって、キーワードに合うページを自動生成しつつ構造化データまで自動で生成したということでしょうか。何目的でやっているかも分かりませんが凄い話です。

リンク先は既に閉鎖されていた

どんなミラーサイトか確認しようとGoogle検索結果に表示されたページを見てみると、既にサイトを閉鎖してしまったのか「このサイトにアクセスできません」というChromeのエラー画面が表示されました。

このサイトにアクセスできませんというChromeエラー画面
このサイトにアクセスできません、とのChromeエラーが表示された

ホスト名「www.amaten.com」も調べてみましたが、やはりホスト名正引きでもIPを見つけることができませんでした。ドメインを消して終了したスクレイピングのスパムサイトということでしょうか。

ホスト名www.amaten.comで正引きしてみた結果は該当なし
ホスト名www.amaten.comで正引きした結果

ドメインは運営中の法人サイトのものだった

念のため、ホストwwwを除いたドメイン名「amaten.com」で調べてみたところ、普通にIPを取得することができました。

ドメインamaten.comは法人が普通に運営するサイトのもの
普通にドメイン正引きすることができました

それどころか、どうやらかなり大規模にサイトを運営する法人サイトが表示されました。

amaten(アマテン)というAmazon/iTunes/Google Play/楽天/DMMなどの電子ギフトカードの個人売買を仲介するサイトがこのドメインに該当するようです。

amaten.comは電子ギフト券を売買できるサイトamaten(アマテン)のもの
電子ギフト券を売買できるサイトamaten(アマテン)

他にも多数の複製ページが存在した

ドメインがこの法人のものということは分かったので、ホスト名「www.amaten.com」と色々なキーワードを交えて再度調べてみましたが、他にもこのような構成のページが多数存在していたであろう様子が分かりました。

例えば、ホスト名「www.amaten.com」とキーワード「サーバー」で調べてみた結果が下記の画像ですが、先ほどの複製パターンと似たようなページが山ほど検索結果に表示されておりました。

Googleでホスト名「www.amaten.com」とキーワード「サーバー」で調べた結果
Googleでホスト名「www.amaten.com」とキーワード「サーバー」で調べた結果

このキーワードの組み合わせだけでも 約 29,800 件 (0.31 秒) との表示がされておりましたので、恐ろしい数のページが一時公開されていたようです。

しかも、Googleにしっかりページを認識させるだけでなく、タイトルが同じこちらのサイトよりも上位にもってきているというのも凄い感じです。もちろん、こちらが超弱小サイトということもあるでしょうが、構造化データ付きのサイトを上位に表示しがちなGoogleのポイントを突いてるというのもあるのかもしれないです。

いずれにしても、これだけのページが表示されていたということは、似たような被害を受けている方も相当数いるのではないでしょうか。

SEO対策の失敗か何か?

amaten(アマテン)という会社を見ると六本木ヒルズに入る法人で、電子ギフトカードの個人売買仲介といった特質的なサービスをやっているようなので、自社でこんな問題になるようなことをやるとは思えません。やはり、DNSハイジャックやDNSキャッシュポイズニングのようなことをやられたということなのでしょうか。

もしくは、社内でスクレイピングを使ったブラックハットSEOのテストをやっていたら、間違って公開してしまってたという冗談みたいな話なのかもしれませんが。どこにも情報がないので原因がさっぱり分かりません。

検索結果に表示された関連キーワード

このサービス「アマテン」で調べて出てくる関連キーワードはこのような感じでした。裁判という単語も並んでおりましたので、商材が電子ギフトカードというのもあるので色々とトラブルはあるのかもしれないです。この検索結果の件も含めて色々と闇を感じてしまいます。

Googleでキーワード「アマテン」を調べた関連キーワード
検索結果の関連キーワードがネガティブなものが多い

おわりに

Googleの検索結果にはまだ残っているものの、上記のようにDNSのゾーン自体は消えているようなので、じきGoogle検索結果からも消えるのではないでしょうか。どうしても気になるという場合には、Googleの著作権侵害フォームなどから通報することもできそうですが、公開されていたページも既にありませんのでどうでしょうか。

とにもかくにも、ブログのTITLE・DESCRIPTIONを使って複製サイトのようなものを公開された前回とはまた一味違う何かダークなものを感じました。ちなみに、前回の複製についてはこちらの記事でご紹介しています。よければ合わせてご参照ください。