[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Fw: 質問; Elispの正規表現



同封のメールを meadow-users-jp に投げたのですが、誰も答えてくれません。
# 日本語がわかりにくいのかな?

どなたかこのメールの答えを知っている方はいらっしゃいませんか。

−−−−−−−−

ROMばかりしている渡辺@湘南工科大です。

Elispの正規表現に関して質問があります。

正規表現の文字集合 [] の中で、 \w (語構成可能クラス) とか \sw とか
\cj (これで日本語という文字カテゴリーをもつ文字を表せますよね?)
を表すにはどうしたらよいのでしょうか? そもそも無理なのでしょうか?

ELispの文字集合のなかでは - ^ ] 以外は文字自身を表すので、 "[\w]"
"[\\w]"  ... どうやっても表現できないのです。

このような質問をするわけは、
[^0-9a-zA-Z] は英数文字以外にマッチしますが、これを日本語を含むように
拡張したかったのです。日本語としては、ひらがな、全角カタカナ、漢字、
全角数字、全角アルファベット、(半角カタカナもかな?)を含んで欲しい
のです。文字コードの表を見て、対応する文字の範囲を丁寧に書き込むしか
ないのでしょうか? [^0-9a-zA-Zあーん  ... 亜-??]