ari23の研究ノート

メーカ勤務エンジニアの技術ブログです

ブログがそっくりパクられた話と撃退した方法

タイトルのまんまです。私のブログがそっくりコピーされました。

Twitterでギャーギャー騒いで、最近だいぶ落ち着いてきたので、情報共有かねて整理しますね...トホホ🐜

→撃退できてました!(2020年11月28日確認)

発覚までの経緯

Google Search Console(通称サチコ)というサービスで、自分のブログをリンクしてくれたサイトがわかるんですが、あるときこんな内容でした。

GoogleSearchConsole上位のリンク元サイト201113
GoogleSearchConsole上位のリンク元サイト201113

「なんか異様にリンクしてくれてるサイトあるぞ...なんだこれ?」

異変を感じてそのサイトを見に行ったところ、こんな画面が出てきました。

ニセモノ
ニセモノ

なんじゃこりゃあああ怒怒怒

いやぁ、久しぶりにマジギレしましたよ、ほんとに。

このサイトはウェブスパムと呼ばれるもので、とにかく私のブログをパクリまくってました。

比較すると、こんな感じ。

比較トップページ
比較トップページ

比較ソースコード
比較ソースコード

もう、ソースコードからパクってんじゃん...

これの実害は、本来私のブログに来てくれるはずの方が、ニセモノサイトに行ってしまうことです。 私のブログは主にGoogle検索からの流入が多く、たとえば「ari23の研究ノート」で検索すると、こんな感じです。

Google検索結果
Google検索結果

「初めまして」じゃねーよ(−_−#)

放っておけばいいって話もありますが、私はGoogleのアルゴリズムを100%信じていない、というか完璧はありえないので、色々対策してみました。

対処法

Googleの検索エンジンでパクリサイトがヒットしてしまうことが問題なので、Googleに報告するのが一番の対処法です。
したがって、手っ取り早く対処法を知りたい方は、Googleに報告の章をご覧下さい。

関係ありそうなところに連絡してみた

「Googleの検索結果に出ないようにする」ことは、本当の意味で悪を退治出来ていない。私はパクリサイトそのものを駆逐したいのだっ!!!(←だれ?)

ということで、関係ありそうなところに片っ端からにメールしてみました。

はてなサポート

私のブログは、はてなブログで運営しているので、まずははてなのサポートに連絡してみました。 すると、以下のようなお返事を頂きました。 (抜粋して一部変更)

頂いたURLを確認したところ、「ウェブスパム」と呼ばれるものでした。
コピーされた内容が投稿されている場所は、はてな外の場所であるため、はてなブログ側でできることはありません。

やっぱり、そうですよねorz

でも、はてなのサポート担当者様に「ウェブスパム」っていうキーワードを教えていただきました! 情報ありがとうございますm(__)m

お名前.com

調べてみると、お名前.comが2015年に「.top」というドメインを扱い始めたと、ここに書いてありました。 そこでヘルプサポートに連絡したところ、以下のようなお返事を頂きました。 (抜粋して一部変更)

お問い合わせいただいたドメインは、弊社外で取得されたドメインであり、運用も弊社外サーバで行われています。
したがって、直接管理者様にご確認いただくようお願いいたします。

お名前.comはあくまで「ドメインを管理する」ドメイン登録サービスを提供しているだけで、サーバ管理しているわけではないと、ここで初めて知りましたorz

また、お名前.comの担当者様に、ドメインからIPアドレス提供元の情報を教えて頂きました! 情報ありがとうございますm(__)m

NameSilo

自己流で調べている中で、NameSiloという会社がヒットしたので、こちらから連絡してみました。

NameSiloは海外のドメイン管理会社で、当然サーバ管理していないので、問い合わせ先としては間違っているのですが、 とても丁寧に対応してくださいました。

たとえば、こんな感じのメールを頂きました。

If you or your client are the holder of a trademark that you feel is being infringed upon via a domain name registered with us, you are advised to consider a UDRP dispute.
We will comply as required by ICANN rules upon the commencement of a UDRP dispute.
Main UDRP Bodies:
National Arbitration Forum - adrforum.com.
World Intellectual Property Organization (WIPO) - wipo.int
*Asian Domain Dispute Resolution Centre (ADR) - adndrc.org
* Czech Arbitration Court (CAC) - adr.eu
* Resolution Canada - resolutioncanada.ca

要約すると「You、裁判しちゃえよ☆」ってことだと思いますw
チェコ仲裁裁判所(Czech Arbitration Court)をオススメされても困る。

似たような内容のメールが、NameSiloの方からスパムかと思うくらいたくさん頂きました。 流石に裁判はしませんが、有益な情報を教えていただき、ありがとうございますm(__)m

ちなみに、私が出したメールはこんな感じです。

TITLE: Please DELETE "https://pakuri.com/"

Hi, I'm ari23, the administrator of "ari23の研究ノート"(https://ari23.hatenablog.com/).

My blog is copied by "https://pakuri.com/".
It's STEALING!!!

Please DELETE this site stealing my blog.

Regard,
hogefuga@e-mail.com

こんなひどい英語でも、私の言いたいことは伝わったようですねw

サーバ運営元

お名前.comの担当者様からいただいたパクリサイトの情報に、サーバ運営元らしきメールアドレスがあったので(HKってあったので多分場所は香港)、連絡してみましたが返信はありません。

まあ、予想通りですね。

Googleに報告

Googleへの報告のやり方はいくつかあり、私はそれを全部試しました。

DMCA

DMCAとはDigital Millennium Copyright Act(デジタルミレニアム著作権法)の略で、この法律に則ってGoogleなどに申請することをDMCA申請というようです。

このDMCA申請をすることで、検索結果に表示させないようにすることが出来ます。

ただし、デメリットが2つあります。

1つ目ですが、おそらく本名での署名が必要です。

上記リンクに飛ぶとわかるのですが、申請時に署名する必要があります。 この署名はペンネームでも良いとも言われているのですが、私の場合、実名で署名していないことを理由に棄却されてしまいました。

DMCA申請返信
DMCA申請返信

本名を書いてしまうと、それがDMCAクレームの詳細情報にそのまま掲載されてしまうので、私のようなユーザには使いにくいです。

また、2つ目として、申請の手間があります。

DMCA申請ではパクられたページを一つひとつ申請する必要があり、今回私のブログがそっくりコピーされたので、全ページを申請するのは現実的ではありません。

フィッシングサイト連絡

DMCA申請では今回の場合だと非常にやっかいですが、Search Consoleのヘルプによると、ドメインをフィッシングサイトとして報告してしまえば、ページごとに報告する必要がなくなるそうです。

申請方法は次の通りです。

まず、こちらから進むと、以下のようなページが現れます。

フィッシング詐欺の報告のページ
フィッシング詐欺の報告のページ

ここで必要事項を記入するだけで、申請はおしまいです。例として、私の申請内容を以下に記載しておきますね。

URL: http://pakuri.com/

フィッシングの違反に関する詳細情報:
『ari23の研究ノート』(https://ari23.hatenablog.com/)を管理しているari23と申します。
わたしのブログが、下記サイトで、そっくりそのままコピーされていました。
http://pakuri.com/
フィッシング詐欺の可能性は十分ございますので、削除などの対応をよろしくお願いします。

ちなみに申請後、以下のような画面が現れます。

フィッシング詐欺の報告送信後
フィッシング詐欺の報告送信後

Googleさんは、イライラしていた私の心情を理解しているw

ウェブスパムレポート

フィッシング詐欺の報告とほぼ同じようなウェブスパムレポートというものもあります。

申請方法は次の通りです。

まず、こちらから進むと、以下のようなページが現れます。

ウェブスパムレポート
ウェブスパムレポート

先程よりも少し項目は多いですが、これらを入力するだけで申請は完了します。例として、私の申請内容を以下に記載しますね。

不正行為があるウェブページのアドレス: (必須)
http://pakuri.com/

問題のある検索キーワード(Google検索ボックスからコピー): (省略可)
ari23の研究ノート

その他の詳細: (省略可)(全角150文字以内)
フィッシングの違反に関する詳細情報:
『ari23の研究ノート』(https://ari23.hatenablog.com/)の管理者ari23と申します。
今回報告したWebページは、私のブログをまるまるコピーしたものでした。 削除などの対応をよろしくお願いします。

なお、申請後は、以下のような画面が現れます。

ウェブスパムレポート申請後
ウェブスパムレポート申請後

リンク否認

少し異なる方法として、自分のブログのリンクを貼らせないようにする機能がGoogle Search Consoleにあります。

詳細はこちらを参照してください。

.txtファイルをアップロードすることで、リンク否認するサイトを指定できます。 たとえば、以下のように作成します。

# pages to disavow
http://pakuri.com/entry/self-introduction
http://pakuri.com/archive

# domains to disavow
domain:pakuri.com

上半分はページごと、下半分はドメインごとに指定しています。

結果

2020年11月28日に確認したところ、パクリサイトにアクセスできないことから、無事に駆逐できたことを確認できました!

ほんとによかったああ!!!

検索結果にはまだ残っていますが、しばらくすれば消えると思います。

御礼と参考URL

Twitterのフォロワーさんから、色々アドバイスいただきました。ありがとうございますm(__)m

教えていただいたものを含め、私が参考にしたサイトは以下の通りです。

おわりに

「記事をパクられる」に初めて遭いましたが、気持ち良いものではないですね...

以下、お願いです。
事態を詳細に記載するために画像ではパクリ元のURLを載せていますが、検索しないようお願いいたします。
また、もし同じようなパクリサイトを見かけましたら、私のTwitterまで知らせていただけると助かります。

最初発見したときは取り乱しましたが、逆に言えば私のブログがそれだけ有名になってきたと、前向き捉えたいと思います!

参照してくださる分にはまったく問題ないので、今後ともよろしくお願いします。

参考になれば幸いです(^^)