Ruby でハロウィンとかハロウインとかhalloweenとかをテキストから抽出する。
サンプルコード。
$ cat halloween.rb
text = 'Halloween, halloween, halloweeeeeeeeeeeen! ハロウイン、ハロウィン、ハロウイイン、ハロウィィィィィィィィン! ハロウイーン、ハロウィーン、ハロウィーーーーーーーン、ハロウィィィィィィーーーーーーーン!!!'
md = text.scan(/hallowe{2,}n|ハロウ(?:ィ+|イ+)ー*ン/i)
md.each{|m|
puts m
}
実行結果。
$ ruby halloween.rb
Halloween
halloween
halloweeeeeeeeeeeen
ハロウイン
ハロウィン
ハロウイイン
ハロウィィィィィィィィン
ハロウイーン
ハロウィーン
ハロウィーーーーーーーン
ハロウィィィィィィーーーーーーーン
今回の環境: macOS Sierra + Ruby 2.3.1
$ ruby --version
ruby 2.3.1p112 (2016-04-26 revision 54768) [x86_64-darwin15]
tags: ruby regex
Posted by NI-Lab. (@nilab)