Ruby正则表达式匹配url
可能重复:
正则表达式匹配URL
正则表达式删除ruby中url的网页部分
我正在寻找一个正则表达式来解析文件中的所有url。
我尝试了谷歌搜索后获得的许多正则表达式,但在一个或另一个案例中失败了。 我的想法是写一个在begening检查http或https的presense,它将匹配所有内容,直到它看到一个空格。
有任何想法吗 ?
注意:我不需要解析url但删除文件中的所有url或至少使其无法读取。
你可以试试这个:
/https?:\/\/[\S]+/
\S
表示任何非空白字符。
(Rubular)
标准URI库提供URI.regexp
,它是url字符串的正则表达式。
require 'uri' string.scan(URI.regexp)