以前このブログが吹っ飛んだのは話した通り。
mysql のダンプファイルと睨めっこするも、やはり不可逆にエンコーディングされている気がする。7bit に落ちていたわけではないけれど、mysql に突っ込んでみても読める箇所が単語単語で点在しているだけのエントリになってる。
しかも Movable Type の「書き出し」機能でバックアップはしていなかった。
今日ようやく気が乗ったので /archives/000001.html とかいう形で保存されているアーカイブ済み HTML から「書き出し」に相当するファイルの復元に挑戦。
ぶっちゃけいつになっても過去ログというのはイタイだけの代物なので、このまま葬りたいというのもあるけれど、生き恥は晒していこうかと。
で、結果は案外あっさり成功。産むが易し。
当然ながらアーカイブ HTML はサイトによってパースの仕方が全く異なってしまうし、復元出来る内容もまちまちだけれども、この問題で悩んでいる人は多いのではないかと思われるので参考までにスクリプトを公開しておく。
ただし、perl と正規表現が苦手なので、とても美しくない書き方なのは勘弁。出来れば少しでも美しい書き方を知っていたら勉強の為にも指摘して欲しいかと。
過去ログの復元は済んでいるものの、現在 mt-2ch を入れてないので、今までコメントしてくれた人のトリップが漏れないように対策してから公開予定。