Date July 06, 2013
Tags pelican / perl / snippet
Share このエントリーをはてなブックマークに追加

このブログの生成にはPelicanっていうサイトジェネレーターを使ってるんだけど、 生成されたRSSをブラウザで見ると、なんかエラーがでてたので調べてみた。

character encoding - PHP generated XML shows invalid Char value 27 message - Stack Overflow

なんでも、XMLで使えないUTF-8文字が含まれてるときに出るエラーらしく、 それをすべて置換しないといけないらしい。

とりあえず解答にのってるPHPコードみたいなのを生成後に走らせたら出なくなったので、 解決?したのかよくわからないけど、まあ直ったからいいか。

perl -i.bak -CIO -nlp -e 's/[^\x{0009}\x{000a}\x{000d}\x{0020}-\x{D7FF}\x{E000}-\x{FFFD}]+//g' /path/to/feeds/*.xml

Perlのワンライナーについてはこちらを参考にさせてもらいました。


Comments

comments powered by Disqus