当前位置 : 主页 > 编程语言 > ruby >

Ruby和正则表达式的问题非常奇怪

来源:互联网 收集:自由互联 发布时间:2021-06-23
我从string.scan和几个正则表达式测试人员那里获得了完全不同的结果…… 我只是想从字符串中抓取域名,这是最后一个字. 有问题的正则表达式: /([a-zA-Z0-9\-]*\.)*\w{1,4}$/ 字符串(1个单行
我从string.scan和几个正则表达式测试人员那里获得了完全不同的结果……

我只是想从字符串中抓取域名,这是最后一个字.

有问题的正则表达式:

/([a-zA-Z0-9\-]*\.)*\w{1,4}$/

字符串(1个单行,在Ruby的运行时btw中验证)

str = 'Show more results from software.informer.com'

工作正常,但在ruby….

irb(main):050:0> str.scan /([a-zA-Z0-9\-]*\.)*\w{1,4}$/
=> [["informer."]]

我认为我会在software.informer.com上得到一个匹配,这是我的目标.

它看起来不像你期望的结果多一个(特别是当正则表达式被锚定时).在这种情况下,没有理由使用扫描.

'Show more results from software.informer.com'[ /([a-zA-Z0-9\-]*\.)*\w{1,4}$/ ]
#=> "software.informer.com"

如果您确实需要使用扫描(在这种情况下您显然需要删除锚点),您可以使用(?:)创建非捕获组.

'foo.bar.baz lala software.informer.com'.scan( /(?:[a-zA-Z0-9\-]*\.)*\w{1,4}/ )
#=> ["foo.bar.baz", "lala", "software.informer.com"]
网友评论