青空文庫作業マニュアル・校正に出てくる正規表現をウェブ上でチェックできるようにしました。(同時に複数選択できますが、マッチすべき文字列が重複していると、一つしかマッチしません。動作に何らの保証もしません。個人的には、一番下の OCR 関係のやつがお勧めです。)

点検するファイル:

片仮名ヘペベ
平仮名へぺべ
片仮名文字列に接する平仮名へぺべをみて、読み取り誤り
片仮名文字列でない中に、一字混じった片仮名
片仮名文字列の中に、一字混じった片仮名ではない文字
新字ファイルに混じる旧字
旧字ファイルに混じる新字
仮名を小書きしないファイルに紛れ込んだ、小書き
全角とするべき可能性の高い、一文字の半角アルファベット
半角の「.」の後に、半角のアキ(「 」)なしで文字が続くもの
文末に、不要な空白(全角、半角)が入っていないか
空白もしくは括弧以外が文頭にきているものをみて、誤って入れられた改行
行頭の括弧の前に、青空文庫では入れないことにしている空白がないか
ルビの中に、仮名以外がないか
ルビの文字数に対して、ルビの付く側の文字数が長めのものをみて、「|」の入れ忘れ
ルビの付く文字が連続するものをみて、過分割
ルビ中の拗促音が小書きされていないもの
誤入力の可能性の高い、半角の丸括弧「()」と角括弧「[]」
使われることのまれな文字
OCRの読み取りミスや誤入力が生じやすい文字
//g; (行頭行末の指定はできません。JIS漢字の範囲も指定できません)
//g; (行頭行末の指定はできません。JIS漢字の範囲も指定できません)