ご利用のブラウザではJavaScriptが無効になっています。すべてのコンテンツを閲覧するにはJavaScriptを有効にしてださい。
目次 > 自説と諸説 >
サイトのバックアップのすすめ 魚拓も検閲されていて消える記事は消える
The-advice-of-the-backup-of-the-website, 2018.1.14, 2021.3.6, 評価(A)
ウォーカーさんがSNSとメールをすべて削除される被害に遭っていました。
ですが、魚拓からデータの復元に成功しています。
本当は自分でバックアップをとったほうがいいのですが、自分のUSBメモリなどを物理的に守れないほどひどい被害に遭っているなどの場合は、いくつかの海外魚拓サイトも合わせて使っておいたほうが安全かもしれません。
できれば、全データの復元が楽なのでサイトダウンロードツールか自作HTMLのバックアップがおすすめです。 2019.1.23
更新履歴
普通のファイルダウンロードツールでバックアップする方法 2020.4.6
Website Explorer 更新 2020.2.23
告知しないで引っ越していることも 追加 2020.1.12
続き
目次
バックアップのすすめ
無くなりやすいサイト
消えたサイトを見る方法
魚拓やGoogle/Yahoo検索にキャッシュがあることも
ウェブ魚拓の裏
真の闇を隠すためにある?
サイトバックアップツールを使うコツ
ブログサービス毎に必要な設定など
普通のファイルダウンロードツールでバックアップする方法
関連・参考
バックアップのすすめ
結論から言うと、データ(記事や画像など)保存だけなら複数の海外魚拓サイトへの登録、データを復元するなら自作HTMLかサイトダウンローダーのバックアップをUSBメモリなどで管理するのがそれぞれおすすめです。
データを自分で保存しておけば、手元のUSBなどだけではなく、知り合いに保存を頼んだり、ネットのアーカイブサイトにデータを保存しておくこともできます。
実際にバックアップをとるとなると、みなさん時間は足りていないことだろうと思うので、普通の人はいくつかの海外魚拓、サイバー攻撃・ネットストーカーなどの被害に遭っている人はサイトダウンローダーを使うのがいいだろうと思います。
せっかく自分が書いたブログが、明日ネット世界からなくなっていたら、どんな気持ちになると思いますか?
たぶん、毎日せっせとノートに書いていた日記をなくしたり、育てていた植物が根元から切られてしまったり、人によっては恋人から突然別れを告げられたような、暗い気持ちになるだろうと思います。
あなたはその喪失感に耐えらますか?
またゼロからやり直す気力が残っていると思いますか?
無理だと思う人は対策をしておくべきです。
がんばれば防げることなので、みなさんにはなるべくがんばってほしいと思っています。
アカウントの乗っ取りや規約違反、政府の実質的な検閲などで、ブログなどのデータがなくなってしまうという可能性は本当にあります。
このサイトでも実際に何度かサイトの一部や全部丸ごと削除されてしまったことがあります。
残念ですが、魚拓も著作権違反や内部規約違反などで削除される可能性があります。
データのバックアップ自分でUSBメモリなどにとっておくのがおすすめですが、不法侵入や身体操作でデータ保全が難しい場合は、魚拓のような外部サーバーにバックアップしておくのもいいかもしれません。
理想はUSBと魚拓の両方というより、できる限り多くの対策をとっておくことです。
バックアップデータの一部が改ざんされるような被害もあるので、データはいろいろなところに、なるべく多く、何世代でもとっておいたほうが安全です。
ブログやサイトは、サイトダウンローダーを使えば、だいたいダウンロードできます。
ベクターや窓の杜などで「サイト、ウェブ、ホームページ、ブログ、ダウンロード(ダウンローダー)」などの単語で検索すればフリーのツールが見つかるはずです。 2018.1.14, 2019.1.25
私は「Website Explorer」を使っていますが、これでだいたいのブログやサイトはダウンロードできます。
有料のツールで「ホームページクローン作成」というツールがあって、初回起動時だけ無料で使えました。
ダウンロード性能はよかったですのでおすすめです。
TLS1.2問題にも対応してありました。
有料といっても作者に100円送金するだけでもいいので、手数料込みで100~500円くらいしかかかりません。
「ホームページクローン作成」はPRO版があって、こちらを使うとカレンダーの日付を無限に追ってしまうのを防ぐ設定のできるのでおすすめです。
(※ただし、使い方はマニュアルを少し調べないといけないので、よく分からない人は通常版のほうが無難です。)
(追加情報:ホームページクローン作成とPROがアメブロからアクセスをブロックされていることが分かりました。
ダウンロードできない状態になっていました。
作者の方に確認したところ、アメブロ側の問題なので今のところは仕方ないことだということでした。 2019.1.30, 2019.5.6)
< 関連 >
サイトバックアップツールを使うコツ
ブログサービス毎に必要な設定など 2019.5.5
誰かにサイトが削除される危険がある人は、似たような危険のある人同士で、バックアップを取り合ったりすることもできますが、自動でバックアップできないブログのバックアップを頼むのはマナーがよくないだろうと思います。
誰か親切な読者がバックアップを取っておいてくれるという可能性もかなり低くなってしまうはずです。
このサイトはhtmlで自作しているのでデータをアップロードしただけでサイトを復帰できましたが、データが復帰できない状態だったら、せっかく作ったサイトもあきらめるしかなかったでしょう。
ブログやその他のホームページなどをSNSのウェブシステムを使って作っている場合、データはサービスを提供している会社が使っているサーバーに保存されています。
何かの理由でブログなどが使えなくなってしまった場合、せっかく書いたブログなどはすべて見れなくなってしまいます。
本人に無断でネット上から消えてしまうことがあるのです。
それであきらめがつくのなら問題ありませんが、それが嫌なら自分でバックアップを取ることをおすすめします。
バックアップさえあればサイト消失という悲劇を乗り越えることができます。
自分の書いたブログなどに少しでも価値があると思うならバックアップを取っておくべきしょう。
バックアップはネットブラウザの機能で保存するか、ブログなどの本文をテキストファイルなどにコピーしておくのが楽です。
このサイトのようにhtmlをすべて自作する方法もありますが、ブログなどのほうがコメントやアクセス解析などの機能がついているので便利です。
コメントは掲示板を自作することで、またアクセス解析はフリーのサービスがあるので、どちらも代用はできますが、ブログサービスとセットになっているものを使ったほうが楽でしょう。
ブログサービスのパソコン用とスマホ・携帯用に別々の画面表示をする機能も便利です。
このサイトではパソコンとスマホ・携帯のコンパーチブルレイアウトを自作しているのであまり問題ありませんが、自作する場合、パソコンとスマホ・携帯用の両方の表示を意識しながら作るか、別々に作る必要があり面倒です。
このサイトは政府系犯罪、国家権力犯罪である集団ストーカー・テクノロジー犯罪の被害者が作っているので、ある日突然削除されたり、ひどいときは毎日のように削除されたことがありました。
初めから削除される前提で作りバックアップも取っていたのですが、実際に削除されてすぐに復帰できたというのは、なかなか爽快な出来事となりました。
加害者側が毎日のように削除できたということから考えるとは、どうやらサーバー側に加害者か協力者が入り込んでいたようです。
このサイトの場合はアカウント乗っ取りなどではなく、サーバー上からhtmlファイルが消えていました。
ちなみにブログの被害体験記事でも裁判や、あるいはいずれなされるであろう政府の集スト被害者認定のときなどの証拠となる可能性がありますので、なるべく客観的な記録を残しておいたほうがよいでしょう。
被害記録は紙のノートなどを使ってもよいのですが、盗まれてしまえばそれで終わりですから、証拠はたくさん保存しておいたほうが有利です。
被害者ではない普通の人の場合は、そこまでの危険はないでしょうから、大事な記事だけたまにUSBメモリなどに保存しておくくらいで十分でしょう。
このサイトの読者は集スト・テク犯被害者も多いのではないかと思いますが、被害者でブログをやっている人の中には2回も削除されたという人もいました。
あまり詳しく調べた訳ではありませんが、今のところ、このサイトが調べた限りでは
、削除されたことがないブログサービスは見つかっていません。
アメブロもFC2もヤフーブログも他のブログでも削除されたという被害者が見つかっています。
削除されたブログが加害勢力のとって特に不都合な内容だったかというと、そういう内容の場合もありますが、そうでないものも削除されています。
ブログやサイトの削除は、内容の良し悪しも関係するでしょうが、それぞれの加害者の独断で行われることもあるようです。 2018.1.14, 2019.5.6
< 参考 >
Web魚拓のようにウェブサイトを保存できるサービスまとめ 2016/5/14
いくつかのサイトに登録しておけば安心 2019.1.23
無くなりやすいサイト
ネットの情報は出てくるのも早いですが消えるのも早いです。
政治ニュースなどは公開当日にもめて削除されてしまうこともあります。
次に見ようとしたときにはなくなっているかもしれないというのがネット情報です。
サイトが消える基準を意識的に考えてみることで、削除した側がどのような判断基準を持ち、何を目指しているのか理解できるようになってくるだろうと思います。
消えたページに重要な情報があったのかはともかく、見れなくなるとことで悔しい思いをすることには変わりありまえせん。
そんなときも気になるサイトが手元に保存してあれば、悔しい思いをせずにすみます。
ブログなどで人の記事をリンクしている人は、リンク先をページごと自分のPCなどに保存しておけば、リンク先が消えてもあまり困らないようにすることもできます。
データ保全のためにリンク張りとローカル保存がセットとなるようなネット常識ができればいいと思います。
そうなれば削除する側も削除をあきらめる始めるでしょうが、記事の削除件数が減るとリンクを張る側も油断するようになるのでバックアップを取る人も減っていくでしょう。
そうなると結局ところ記事の削除と保存はイタチごっことなっていくのかもしれません。
< 集スト・テク犯の話 >
ちなみにこのサイトが追っている集スト業界では本物の被害者サイトでは、活動が活発なサイトは数年、手堅く活動しているサイトでも10年くらいでなくなるか、更新停止、あるいはアカウント乗っ取りなどの被害にあっているようです。
ひどい被害を告白したまま更新停止となっている人などは心配です。
ですが、そう思わせるのが加害者の目的なのかもしれません。
更新停止した人も被害に耐えながらもそれなりに生活しているのかもしれません。
このあたりは調査してみないと分からないので、自分ひとりの感覚で決め付けないようにしておいたほうがいいでしょう。
アカウントが乗っ取られたサイトは完全に別人が更新を続けている場合もありますが、数年以内に更新が止まり、さらに数年以内に削除されていっているようです。
なかには5年以上更新停止していて削除もされていないサイトもありますので、加害者側の基準はあまり定まっていないようです。
これは加害者や加害勢力同士の連携が弱いことも影響しているだろうと思います。
被害者は集スト・テク犯被害を同じ種類のひとくくりの犯罪と考えがちですが、実際には本格的なテロに近いテク犯から町内会の低レベルな模倣犯のような加害者まで色々あります。
大枠ではひとつの犯罪と言ってもいいのですが、細かくみると集スト・テク犯は色々な加害者や組織がそれぞれの目的で悪用しています。
被害者がネット記事を守る場合は、USBメモリなどが盗まれたり、PC本体が壊されたりする危険があるので、複数の海外魚拓サイトに登録しておいたほうがデータが守りやすいだろうと思います。 2018.4.2, 2019.1.23
消えたサイトを見る方法
魚拓やGoogle/Yahoo検索にキャッシュがあることも
リンクからアクセスすると記事が見つからないことがあります。
元のデータが消えてしまったということでしょうが、実は魚拓系のサイトやGoogle/Yahoo検索のキャッシュ(※一時保存データのこと)から記事が読めることがあります。
古い記事やSNSの一覧ページなどはキャッシュがないことがありますが、10年前くらいの記事でもそれなりにアクセス数のあった記事であれば、探せばどこかにデータが残っていることがあります。
Google/Yahoo検索はヒットしたリンクのキャッシュを見るとことができます。
検索結果の下のURLの右に「キャッシュ」と表示されるていれば確認できます。
このキャッシュは記事などのデータのバックアップになっています。
これは検索エンジン用のキャッシュですが、普通の人も見れるようになっています。
キャッシュを見るには検索結果に該当記事を正しくヒットさせる必要があります。
これはリンクのURLを検索ワードに指定して検索するとヒットしすくなります。
URLでヒットしない場合は、たぶん記事がないということだろうと思います。
もしかすると誰かが引用・転載している可能性もあるので、そういうときは記事のタイトルなどで検索すれば見つかるかもしれません。
自分のサイトが消えてしまってもあわてずにキャッシュを探せば復元できるチャンスがあります。
そうとはいえ消えてから、急いでキャッシュを探して復元するようなことにならないように、日頃からバックアップをとっておくのがおすすめです。
魚拓のほうにも念のためURLを登録しておけば、手元のバックアップデータが使えなくなったときなどに便利なので、なるべく登録しておいたほうが安全です。
ブログなどを魚拓からデータを復帰して、いざ更新再開となると、ひとつづつコピーして公開するのは面倒です。
このサイトとしては、やはりサイトダウンローダーで丸ごと保存しておくか、自作HTMLで保存しておくのがおすすめです。 2019.1.8, 2019.1.23
< 参考 >
「消えたサイトを見る」 - Yahoo検索 2019.3.6
告知しないで引っ越していることも
ブログによってはサービス停止などのせいで他のブログなどに引っ越していることがあります。
そういうときはURL検索ではなくブログや記事のタイトル、著者名などで検索すると見つかることがあります。
ブログしかやっていない人がブログサービスの終わりをきっかけに引っ越すと、元のURLで引越の通知ができなくなってしまいます。
結果的に無告知での引越となってしまいす。
これは意外と分かりにくいです。
新ブログに引っ越したときは引越の告知と元のブログUのRLを書いた記事を作っておくと検索でヒットさせやすくなります。
ブログサービス終了や工作によるブログ削除・アカウント乗っ取りなどはたまにしか起こらないことなので引越の告知は忘れられがちですが意外と重要なことです。 2020.1.12
Yahooキャッシュへのリンクは定期更新で切れる
リンク先をキャッシュにしておいたら、保存期限が切れたということで見れなくなっていました。
元のURLで検索しなおすとキャッシュがありました。
こちらはちゃんと見れました。 2019.10.28, 2020.1.13
ウェブ魚拓の裏
真の闇を隠すためにある?
ウェブ魚拓を含めたウェブアーカイブサイトを、裏社会(本当はこちらが真の真世界)的にみると、たぶん、真の闇を隠すという隠された目的を持って運営されているのだろうと思います。
魚拓サイトはたくさんありますが、本当は全部同じ勢力が管理しているサービスだった、なんてことは裏社会ではいかにもありそうな話です。
「ただほど高いものはない」と言われるように無料サービスの裏には闇が隠されているものです。
例えばただで見られるテレビは毎日、印象操作や変更法を行い、私たちの思考パターンや価値観・道徳観、さらには常識や社会通念まで変更するような、大規模な大衆洗脳を行っています。
話を戻します。
魚拓に保存したデータの本体はアーカイブサイトにあるので、数年毎にサイトを閉鎖していけば、証拠となるデータを一気に削除できます。
運営側の都合で不都合な記事を削除したり、内容を変更してしまうこともできます。
先のことを考えれば、歴史の改ざんに悪用されるだろうと思います。
他には私たち一般市民が、どんな情報を守ろうとしているのか、というビッグデータ収集という目的もあるだろうと思います。
保存しておきたい記事というのは、特に大事な記事のはずですから、ネット裏社会ではその記事には特に高い評価が付けられていることだろうと思います。
そこから裏社会にとって危険な人物を割り出したりしているはずです。
大事そうなデータはやっぱり自分の手元に保存しておくことをおすすめします。
世界の国家内国家、ディープステートのネットワークのようになっている世界支配層ネットワークが連携して、すべてのアーカイブサイトを同時に閉鎖したりした日には目も当てられません。
ですが、データは個人監視やプロファイル、情報銀行などで使える価値のあるものですから、世界大戦などよっぽどのことがない限りは世界の魚拓サイトが一気になくなるようなことはないだろうと思います。
全魚拓を同時に閉鎖しないと、残った魚拓の価値が一気に上がって世界的なシェアを奪われてしまうので、実際にはそんなことは起こらないだろうと思います。
普通に考えるといくつかの海外魚拓サイトにサイトを保存しておくのが一番安全だろうと思います。 2018.10.29, 2019.1.23
国内のSNSが海外魚拓からのアクセスをブロック(拒否)
魚拓がいいの悪いのと、話が二転三転してしまい申し訳ないところですが、管理人や集団ストーカー被害者のみなさんは監視国家へ向かう時代の最先端にいるようなのでいたし方ありません。
サイトを削除する側も対応しているらしく、さっそくアメブロやFC2などのブログ側が海外魚拓からのアクセスをブロックしてきました。
「404 Not Found」と表示されるのはページが見つからないという意味ですが、ブロックしたときにも表示されるので、ブロックされているのだろうと思います。
ブロックされていない魚拓はまだ使えるでしょうが、数が少ないのでいつかはすべてブロックされてしまうだろうと思います。
ジャパンディプステートと呼ぶべき日本政府や背後組織の検閲もずいぶんと厳しいものです。
たぶん、海外のSNSを使えばブロックされずにすむだろうとおもいます。
ですが、そういう人が増えてくると、次は海外SNSを利用(登録)できないようにするのが政府のやり方だろうとは思います。
他にYahooブログは閲覧権限を制限することで記事を読めないようにしていました。
管理人やメンバーだけしか見られないように設定を変えてしまう方法です。 2019.1.23, 2019.1.30
サイトバックアップツールを使うコツ
ブログサービス毎に必要な設定など
< 追伸 2021年3月6日 >
残念なことに手持ちのバックアップツールがほぼ全滅してバックアップが取れなくなってしまいました。
加害勢力がツールを機能しないようにしているようです。
今後は一般的なダウンロードツールをうまく使ってダウンロードするしかありません。
結果的にバックアップをする価値は上がっていますのでできそうな人はチェレンジしてみてください。
理想は初めから作者がバックアップしてデータを配布することです。
有料ですが月々500円程度で使えますのでWorpPressなど自サイトをバックアップできるSNSを利用することをおすすめします。
集スト会社の記事などのはワインのように時と共に価値が上がっていきますので、ぜひバックアップ体制を整えておくことにも価値があります。
< 関連 >
ウォーカーさんのサイトのバックアップ完了 | 集団ストーカー犯罪と社会不正の今を分析 被害改善活動 進捗と展望 2021年3月 | 被害改善責任論
(追伸終わり)
< 以下、本文 >
ツールの細かい使い方は説明があるはずなのでそちらで確認してください。
ここではツールの簡単な説明や、ブログやサイト毎に必要になる設定について、管理人のメモを兼ねて説明していきます。
基本
サイトのURLの最後がスラッシュ('/')になるように設定するツールが多いです。
まずツール自体がちゃんと使えるものかどうか確認する必要があります。
次にサイト毎に使えるものとそうでないものがあるのでこれも確認する必要があります。
さらにサイト側も仕様変更されることがあるので、ある日バックアップできなくなったりします。
そのときは別のツールを使ってみるか、自分で原因を探すしかありません。
ツールもバージョンアップして仕様変更されることがありますが、サイトが対象外になったり、バグが入って使えなくなることがまれにあります。
(バージョンアップでは普通はバグが修正されたり機能が増えたりします)
私がいくつかのツールを使ってみたところ、ブログを書いている本人やサイト運営者でもなければすべてのコンテンツを保存しておく必要はないということです。
記事ページのみ保存しておけば十分だろうと思います。
バックアップやそのための検索開始ページを最新記事のページに設定して、そのURLの最後がブログ記事専用の文字列になっていれば、その部分を抜き出すことで記事だけを保存する設定ができるツールもあります。
(例えばURLが「blog-date-(日付・連番).html」となっていたら、「blog-date-」の部分が記事を表す文字列である可能性が高いのです。
一覧ページなどのURLと比べてそれが記事を表す文字列かどうか予想できます。)
特にブログなどのSNSでは一覧やカテゴリー別ページなど便利なもののなくてもテキスト検索などで代用できるページがあり、保存しなくてもそれほど困りません。
画像は、お気に入りのサイトやいい情報が載っているようなサイトならなるべく保存しておいたほうがいいです。
ですが、HDDを圧迫してしまうので、念のため保存しておくだけといったサイトであれば特に必要はないだろうと思います。
このあたりは何のためにどのサイトを保存するのか考えて判断してください。 2019.6.9
Website Explorer
基本的にはダウンロードするブログによって設定が少し変わるので気を付けてください。
URLを指定するときに、トップページのものを指定すると、他のブログまでダウンロードしてしまうことがあります。
そういうときは、各記事のURLを指定するとうまくダウンロードできるようになることがあります。
これはURLのフォルダ階層をよく見て判断してください。
(ダウンローダーは基本的にURLで指定した階層の配下を調査する仕組みになっているため)
また、「アクション > クイック設定」から「?に続くクエリー取得」をチェックしないと落とせないブログもあります。
記事のURLに「?」が含まれているサイトは基本的にはチェックしておいたほうがいいです。
普通はチェックをはずしたほうが動作が速くなります。
私のPC/ネット環境(Vista/ADSL)だと、ダウンロードできるページ数の最大は2万ページくらいでした。
るいネットのように3万記事以上あるサイトは落とせませんでした。
もっと性能のいいPCやネット環境、あるいは別のダウンローダーならもっと落とせるかもしれません。
Website Explorer は、例外としてWixなどの静的なページを持たないらしいブログはダウンロードできませんでした。
それとYahooブログのようにセキュリティの関係でPCの環境によってはダウンロードできないものもありました。
自動でバックアップが取れないと不便なので、WixやYahooブログがダウンロードできない人は、この二つのブログサービスを自分で使うのはさけたほうが無難です。
URLをフィルタリングすると余計な記事をダウンロードせずにすみます。
「アクション > 詳細設定 > フィルタ(タブ) > サイト内データ > ページ」で設定する方法を説明しておきます。
アメブロなら「次の語をファイル名に含むページを解析しない」をチェックして「page-」と入力します。
そうするとページの無限追跡をしなくなるので無限に検索し続けるのと防げたり、同じページのダウンロードを省略できるようになります。
FC2の場合は「次の語をファイル名に含むページのみ解析する」をチェックして「blog-entry-」と入力します。
そうするとブログ記事だけダウンロードできるようになり、テーマ一覧などその他の記事のダウンロードを省略できるようになります。
(※FC2の古いブログはこれに当てはまらないこともあるのでURLに「blog-entry-」が含まれているか確認してください。)
他のサイトは初期設定の「すべて」をチェックしておけばだいたいダウンロードできるだろうと思います。
(Wixなど例外サイトはもちろんダウンロードできないことがあります。
とはいえバージョンアップされていつかダウンロードできるようになるかもしれませんので、最新版が出ていないかチェックしておいたほうがいいです。) 2018.1.14, 2020.2.24
ホームページクローン作成(通常版とPRO版)
ページを調査しながらすぐにダウンロードするので一度の操作でダウンロードできます。
ダウンロード時間全体もWebsite Explorerよりも速いはずです。
Website Explorerは調査フェーズの後に、自分でダウンロード設定しないといけないので、少し手間がかかります。
それにくらべてホームページクローン作成なら、巨大サイトを夜寝る前とか、出かける前にセットしておいてダウンロードしておくような使い方もできます。
有料とはいえ、本当に100円と振込み手数料だけでも使えます。
PRO版は設定ファイルを作る必要があります。
サンプルがあるので、記号の意味が分からない人でも、よく見てがんばって真似すれば作れるだろうと思います。
とにかく調べたり文章を読むのが嫌だという人は素直に通常版を使ってください。
(それだとネット社会では成長できないので、本当は自分で調べるスキルを身につけておいたほうがいいです)
サイトダウンロドーダーは一般的に日付を無限追跡してしまうという問題があります(ブログサイトの設計によって起こる)。
ですがこのツールだと、調査日付を限定できるので、この問題に対応した賢いダウンローダーになっています。
日付追跡回避の設定は、追跡除外キーワードを設定するという処理になるので、除外キーワードが設定できるツールならだいたい同じようなことができるはずです。
それでもPRO版だと正規表現が使えるので、工夫次第ではかなり複雑な条件も設定できます。
特定の日時範囲で特定の単語が含まれる記事だけダウンロードするようなことができます。
ちなみにせっかくの高機能ツールなのですが、管理人の場合は、日付指定くらいしか使わないので、せっかくの正規表現も宝の持ち腐れになっています。
さらに言うと、日付を指定しなくても通常版で落とせることが多いです。 2019.5.6
はてなサイト
ページ内に「最近言及したキーワード」という単語検索へのリンクがあると、このリンクからサイト内を大量に重複調査してしまうので、このリンクは除外したほうがいいです。
同じサイト内の同じ記事を何度も追跡しても意味はありません。
リンクは「http://d.hatena.ne.jp/denjirou/searchdiary?word=%A5%D6%A5%ED%A5%B0」のような感じになっているので、「searchdiary?word=」あたりをツールの除外ワードに設定すればいいでしょう。 2019.5.6
TLS問題
(※注意:このテーマは2019年12月15日以降はYahooブログサービスが終わってしまうので、テーマ対象がなくなり、たぶんあまり意味のないテーマになってしまう見込みです。
その日、以降に読んでいる人には読まないことをおすすめします。)
せっかく突き止めたので技術的な部分も説明しておきます。
サイトダウンローダーはIEでダウンロードしたページを保存するものが多いようです。
Website Explorer もそうです。
YahooブログはアクセスにTLS1.2を要求するので、TLS1.1までしか対応していないIE9ではアクセスできなくなっていました。
これはVistaの最新版IEである9が、TLS1.1までしか対応していないせいです。
新しいウィンドウズについているIEなら普通にダウンロードできるはずです。
これは管理人が確認したところではYahooブログでしか起こっていないようです。
ですが、そのYahooブログも2019年12月でサービス終了となることが決まっているで、この件はもうすぐ昔話になってしまいます。 2018.1.14, 2019.5.6
普通のファイルダウンロードツールでバックアップする方法
サイトを丸ごとバックアップするツールは使えなくなってしまう傾向があります。
元々ダウンロードできないサイトもあります。
そんなサイトは1ページづつ手動で保存することもできます。
ですが、よりスマートな方法で、より早く、より楽に処理するというのがコンピューター世界の美学です。
いわゆる最適化ですね。
コンピューターユーザーである以上は最適化のための創意工夫にかける労力をおしんではいけません。
そこでサイトを丸ごと落とすツールが使えないときは、普通の画像などのファイルを落とすツールを使うのがベターな選択肢になります。
ページのURLやそのリンク先のURLまでチェックして落とすツールがあるのでこれを使うと楽です。
ブログなどの一覧ページがあればそこから一気に落とせます。
落とすファイルは拡張子毎に指定できるとなおよいです。
落とす拡張子は htm, html, jpg, jpeg, png, gif, bmp, wav, wmv, mp3, mp4 あたりを指定しておけばいいでしょう。
後ろの wav 以下は音声や動画ファイルです。
近頃は直リンクしている人は少ないのですがたまにいるので一応指定しておいてもいいです。
落とした後は画像などのパスが変わってしまうので html ファイル内のパスを変更します。
ローカルで見たり別環境にアップしないのであれば別に変えなくても大丈夫です。
一覧ページのパスを直すと一覧ページから各記事が見れるようになるので便利です。
パスの変更は正規表現の一括検索と置換ができるツールがあるのでこれを使うと楽です。
正規表現はベテランユーザーでもなんとなくさけていてよく知らないという人もいるかもしれません。
簡単に説明しておきます。
パスを変えるだけなら「*」と「.」だけでだいたいできると思います。
「*」は全パターンの文字列を表すワイルドカードです。
「.」は1文字の全パターンを表しています。
使い方は次のようになります。
元のパス:https://higai/kaizen/sekininron/2020/04/15/image_file.jpg
検索する正規表現:https://higai/kaizen/*/2020/../../
(kaizen フォルダ以下の 2020 フォルダで全年月日のパスを変える例 )
変更文字列:2020/
置換結果:2020/image_file.jpg
(※月日は二桁の数字を想定しているので [0-9][0-9]/[0-9][0-9] などとすることが多いですが面倒なのでやっていません。
何千ファイルとか大量のファイルを何度も書き換えるときは時間がかかるので正規表現も最適化したほうがいいです。)
こうすることで2020年の全月日の画像やその他のファイルのパスを 2020 フォルダに変更することができます。
ファイルは画像を想定してますが、落としてきた画像を 2020 フォルダに入れればパスが通りブラウザなどに表示されるようになります。
ファイルダウンロードとパス変更機能を合わせたツールも探せばあるかもしれません。
それがサイト丸ごとバックアップツールであるともいえます。
これをしないで元のパスと同じ構成を自分で作る方法もあります。
パスではなくフォルダ構成を元のものに合わせるというやり方です。
ダウンロードツールがパスを再現してくれるのであればそちらのほうが文字列を置換しないですむので楽です。
閲覧する予定ならまずはフォルダ構成を維持してくれるダウンロードツールを探したほうがいいですね。
そうすれば https:// あたりをローカルフォルダに全置換するだけでいけるはずです。 2020.4.6
関連
対処法:パスワード・アカウントハック
パスワードなどが使えなくなってしまった場合の復帰方法 2018.7.5
更新履歴
archive.org
海外の魚拓的サイト 動画や音楽も保存 2018.2.13
Web魚拓のようにウェブサイトを保存できるサービスまとめ 2016/5/14
いくつかのサイトに登録しておけば安心 2019.1.23
更新履歴(続き)
基本 - サイトバックアップツールを使うコツ 追加 2019.6.9
サイトバックアップツールを使うコツ 追加 2019.5.6