あなたは過去にブログやWebサイトを運営して、そのページを消したことがあります?
一見、ページが見えなくなったように思えても…実はしっかりインターネット上にデータが残されている場合があります。
今回はそんな恐ろしい話と、対処法までご紹介したいと思います。
Wayback Machine(ウェイバックマシーン)
海外のInternet Archive(インターネットアーカイブ)というサイトが無料で提供している【Wayback Machine(ウェイバックマシーン)】というツールがあります。
ブラウザ上からURLを入れるだけで、過去の運用履歴を閲覧することができる恐ろしいツールです。
「勝手にこんなことしていいの?!」と思うかもしれませんが、何やら研究者・歴史学者・ひいては世界人類のための図書館として活用してもらいたい…といった大義名分のもとに行ってるそうです。
では、ウェイバックマシーンの使い方を簡単に解説します。
ページにアクセスしたら、以下の画像のように赤枠で囲った欄に調べたいサイトのURLを入れます。
するとこんな感じでカレンダーが表示されます。試しに「Yahoo」のURLを入れて調べてみました。
上にある西暦の欄から調べたい年を選択すると、下のカレンダーが切り替わります。
カレンダーに青色で丸く記されてるのが、ページの情報をキャッシュした日で、マウスオーバーで詳細の時間が出てきます。
この詳細の時間をクリックすることで、この当時のページデザインが表示される仕組みになっています。
ちなみに緑色で丸く記されてるのはリダイレクト処理された日だそうです。
1997年4月14日の17:03:43にキャッシュされたページを振り返ってみると…
す、すごい…!!
office97のキャンペーンとか…ネット創成期のゴテゴテとしたデザイン、古き良き香りが漂ってきますね。
…と、このように過去のデータもしっかりインターネット上にアーイカイブされています。
検索一覧からもキャッシュが見れる
ウェイバックマシーンを使わなくても、直近のサイトデータであればGoogleが保持するインデックスデータの【キャッシュ】でも閲覧することが出来ちゃいます。
やり方は簡単!Googleのキーワード検索を行い、検索結果一覧を表示します。
今回は試しに「ダイエット」と検索して出てきたwikipediaを例に解説します。
すると、表示されたページたちのURLの右端に小さく「▼」マークが出てるのが分かるでしょうか?ここを押すと、「キャッシュ」というリンクが表示される(されない場合もあります)ので、この文字をクリックします。
するとこのようにキャッシュだけで構成された過去のページを見ることができます。といっても先ほども申した通り「直近のサイトデータ」のキャッシュなので、それほど古い内容ではありません。
ですが、これは割と便利な意味で使われる場合が多いです。
例えば、一時的にサーバーがダウンしているページを見たい時などに、このキャッシュを閲覧することで何とかページの内容を確認することはできます。
もしご自分で運営してるサイトなどでページの更新をミスッてしまった時なんかに、少し前の情報でもいいから確認したい!って時に使えますね。
ただし、画像が見えなかったり、CSSなどが吹っ飛んだ状態になるのでデザインは崩れてしまう場合が多いのでデザインの確認は難しいですが、テキストはしっかり読めるので書いてある内容は分かります。
何かあった時の証拠にもなるウェブ魚拓
次に紹介するのは「ウェブ魚拓」というサイトです。

魚拓というのは魚釣りの用語で、釣った魚に墨を塗って紙にこすり付けて転写することですが、これのWeb版とでも言いましょうか。
現時点のサイト情報をプリントスクリーンするかのように、データとして保存(魚拓)してくれるサービスです。
使い方はとっても簡単!今回も「Yahoo」のURLを入れてみましょう。
調べたいサイトのURLを「魚拓をURLで検索・取得」の入力欄に入れ、「検索と確認」のボタンを押すだけ。
するとこんな風に、秒で魚拓を取ってくれます。
過去の魚拓一覧には過去に誰かが取った魚拓も見ることができます。
早速、リストにある7月11日に誰かが取ったYahooの魚拓を見てみましょう。
このように、誰かが取得してくれた時点のWebサイトの情報を簡単に見ることができます。
用途は様々ありますが、例えば悪質なサイトを見つけた時なんかに証拠として魚拓を取っておけば、後からサイト内の情報を消されたり更新されたりしても「ウェブ魚拓を取ってあるぞ!」と突きつければ、この情報を改変することはできないので物的証拠としての効力は認められると思います。
キャッシュも消え、ウェイバックマシーンでも見つからないよう完全消去されたしまったサイトは、もはや探し出す術がなのでこのサイトに訪れて過去に魚拓が取られないか確認してみると良いでしょう。
完全に削除するための対処法
これまでご紹介したように、インターネット上に一度でも公開し、インデックスされてしまった情報は “探そうと思えば見つけることができてしまう” というわけです。
もしあなたが過去にインターネット上にアップした黒歴史があるのなら…消したつもりでも残ってるかもしれませんよ?
というわけで最後に、インターネット上から完全に削除する方法について解説します。(ウェブ魚拓を取られてしまっていたら手遅れですが…)
方法は、Googleのインデックスを削除してもらうのが一番確実です。
GoogleのURL削除ツールというページから、ご自身が運営するサイトのプロパティを選択し、消したいページ・データのURLを打ち込んで申請しましょう。
サイトを丸ごと消すこともできてしまうので、入力する内容には十分に注意してください。責任は負いかねます。
以降はこちら→新しいURL削除ツールで申請することになるようです。
これ以外の方法で削除する方法をぼくは知りませんが、どうしてもネットから完全消去したい黒歴史がある方は、他にも方法があるかもしれないので探してみてください。
というわけで今回のお話は、以上です!