@634

正規表現エディタ - URL抽出処理(正規表現)

Advertisement

正規表現でURLを抽出する

  • 正規表現をつかって文字列からURLを抽出する

check()メソッドの実装

check()メソッドの実装
※枠組みはここ
//データ抽出
public void check(){
    // URLを正規表現で定義
    Pattern pattern = Pattern.compile("(http://|https://){1}[\\w\\.\\-/:]+");

    // 比較対照文字列
    Matcher matcher = pattern.matcher(text.getText());

    StringBuffer buffer = new StringBuffer();
    while(matcher.find()){              // 検索
    buffer.append(matcher.group());	    // マッチした文字列取得
    buffer.append("\r\n");              // 改行

    // テキスト設定
    result.setText(buffer.toString());
}
正規表現
(http://|https://){1}[\\w\\.\\-/:]+
正規表現でURLを表している。具体的には「http://かhttps://で始まっている、任意の文字列の繰り返し」を表している。

java.util.regex.Patternクラスとjava.util.regex.Matcherクラス
Javaの標準APIで、正規表現を使用できるようにしたクラス。J2SE1.4から付属。
上記コードでは、Patternクラスのmatcherメソッドで文字列を比較して、findメソッドループ内でgroupメソッドで一致した文字列を抽出している。
抽出したデータをテキストエリアに出力して終了。

動作イメージ

抽出前
図1:テキストを読み込んで「文字列抽出」を実行する

抽出後
図2:URLが抽出された。

Advertisement

ショートカット

634
634ブログ
このカテゴリのトップページに戻る
Incubator(Pukiwiki)
634ラボ
   UIコレクションギャラリー
   ZO-3ジェネレーター

サイト検索


Y!ログール