Ruby でハロウィンとかハロウインとかhalloweenとかをテキストから抽出する。

サンプルコード。


$ cat halloween.rb

text = 'Halloween, halloween, halloweeeeeeeeeeeen! ハロウイン、ハロウィン、ハロウイイン、ハロウィィィィィィィィン! ハロウイーン、ハロウィーン、ハロウィーーーーーーーン、ハロウィィィィィィーーーーーーーン!!!'

md = text.scan(/hallowe{2,}n|ハロウ(?:ィ+|イ+)ー*ン/i)

md.each{|m|
  puts m
}

実行結果。


$ ruby halloween.rb 
Halloween
halloween
halloweeeeeeeeeeeen
ハロウイン
ハロウィン
ハロウイイン
ハロウィィィィィィィィン
ハロウイーン
ハロウィーン
ハロウィーーーーーーーン
ハロウィィィィィィーーーーーーーン

今回の環境: macOS Sierra + Ruby 2.3.1


$ ruby --version
ruby 2.3.1p112 (2016-04-26 revision 54768) [x86_64-darwin15]

tags: ruby regex

Posted by NI-Lab. (@nilab)