2011-12-31 修正のおしらせ
正規表現のパターンで間違いがありました。記事は以下のように修正されています。
正:"[^"]*?"
誤:"[^"]*"?
?は文字の後ろに置いたら「0or1回出現」の指定でした。文字連続指定の+か*の後ろの?だと最短指定になりますね。申し訳ありません。あんまり追いかけてませんが、修正前のソースだと、きちんと閉じられていないダブルクオーテーションが出現すると微妙におかしくなりそうな気がします。ならないかな…?うーむ。修正版ではきちんと閉じられないダブルクオーテーションが出現すると、その一文字だけ読み飛ばして、残りの文字列が「ダブルクオーテーション以外の文字の連続」として最後に抽出されます。Split仕様としてはこれで問題ない…かな。