[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Fw: 質問; Elispの正規表現
- To: BEP ML <bep@argv.org>
- Subject: Fw: 質問; Elispの正規表現
- From: Takayuki Watanabe <takayuki@la.shonan-it.ac.jp>
- Date: Fri, 21 Jul 2000 22:14:52 +0900
- Delivered-To: mailing list bep@argv.org
- Mailing-List: contact bep-help@argv.org; run by ezmlm
同封のメールを meadow-users-jp に投げたのですが、誰も答えてくれません。
# 日本語がわかりにくいのかな?
どなたかこのメールの答えを知っている方はいらっしゃいませんか。
−−−−−−−−
ROMばかりしている渡辺@湘南工科大です。
Elispの正規表現に関して質問があります。
正規表現の文字集合 [] の中で、 \w (語構成可能クラス) とか \sw とか
\cj (これで日本語という文字カテゴリーをもつ文字を表せますよね?)
を表すにはどうしたらよいのでしょうか? そもそも無理なのでしょうか?
ELispの文字集合のなかでは - ^ ] 以外は文字自身を表すので、 "[\w]"
"[\\w]" ... どうやっても表現できないのです。
このような質問をするわけは、
[^0-9a-zA-Z] は英数文字以外にマッチしますが、これを日本語を含むように
拡張したかったのです。日本語としては、ひらがな、全角カタカナ、漢字、
全角数字、全角アルファベット、(半角カタカナもかな?)を含んで欲しい
のです。文字コードの表を見て、対応する文字の範囲を丁寧に書き込むしか
ないのでしょうか? [^0-9a-zA-Zあーん ... 亜-??]