如何从字符串中剥离URL并将其放置为数组？

我正在构建一个小脚本，用于搜索服务推文的5张最新图片，隔离URL并将该URL放入数组中。

def grabTweets(linkArray) #brings in empty array tweets = Twitter.search("[pic] "+" url.com/r/", :rpp => 2, :result_type => "recent").map do |status| tweets = "#{status.text}" #class = string url_regexp = /http:\/\/\w/ #isolates link url = tweets.split.grep(url_regexp).to_s #chops off link, turns link to string from an array #add link to url array #print linkArray #prints [] linkArray.push(url) print linkArray end end x = [] timelineTweets = grabTweets(x)

该函数返回如下内容：[“[\”http：//t.co/6789 \“]”] [“[\”http：//t.co/12345 \“]”]

我试图让它返回[“http://t.co/6789”，“http://t.co/1245”]，但它没有管理它。

任何帮助在这里将不胜感激。我不确定我做错了什么。

在Ruby中获取URL的最简单方法是使用URI::extract方法。这是一个预先存在的轮子工作：

 require 'uri' require 'open-uri' body = open('http://www.example.com').read urls = URI::extract(body) puts urls

哪个回报：

 http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd http://www.w3.org/1999/xhtml http://www.icann.org/ mailto:iana@iana.org?subject=General%20website%20feedback

获得arrays后，您可以根据需要进行过滤，也可以为其提供一个要提取的方案列表。

grep返回一个数组：

grep（pattern）→数组
grep（pattern）{| obj | block}→数组

返回枚举中每个元素的数组，其中Pattern === element 。

所以你的奇怪输出来自to_s调用跟随你的grep 。你可能正在寻找这个：

 linkArray += tweets.split.grep(url_regexp)

或者如果您只想要第一个URL：

 url = tweets.split.grep(url_regexp).first linkArray << url if(url)

您也可以跳过split.grep并使用scan ：

 # \S+ should be good enough for this sort of thing. linkArray += tweets.scan(%r{https?://\S+}) # or url = tweets.scan(%r{https?://\S+}).first linkArray << url if(url)

要删除一个字符串并推入urls数组，您可以执行以下操作：

 urls = [] if mystring =~ /(http:\/\/[^\s]+)/ urls << $1 end

如何从字符串中剥离URL并将其放置为数组？

如何在jRuby中启用C扩展支持？

Rails3 ActionView模板处理程序不适用于Production Server

Mongoid has_and_belongs_to_many关联

带有双冒号的Ruby类命名约定

ActionController :: RoutingError（UserAccountsController的未定义方法`load_and_authorize_resource’：Class）：

在Ruby中设置请求标头

Ruby Timeout :: timeout不会触发Exception，也不会返回记录的内容

Rails：使用“attributes”方法将属性从对象复制到另一个对象

PyObjc vs RubyCocoa for Mac开发：哪个更成熟？

何时使用`method_missing`