解析youtubeurl

我写了一个ruby youtube url解析器。它被设计为输入以下结构之一的youtube url（这些是我能找到的youtube url结构，也许还有更多？）：

http://youtu.be/sGE4HMvDe-Q http://www.youtube.com/watch?v=Lp7E973zozc&feature=relmfu http://www.youtube.com/p/A0C3C1D163BE880A?hl=en_US&fs=1

目的是只保存剪辑或播放列表的id以便嵌入它，所以如果它是一个剪辑： 'sGE4HMvDe-Q' ，或者它是一个播放列表： 'p/A0C3C1D163BE880A'

我写的解析器适用于这些url，但看起来有点脆弱和冗长，我只是想知道是否有人可以建议一个更好的ruby方法来解决这个问题？

 def parse_youtube a = url.split('//').last.split('/') b = a.last.split('watch?v=').last.split('?').first.split('&').first if a[1] == 'p' url = "p/#{b}" else url = b end end

 def parse_youtube url regex = /(?:.be\/|\/watch\?v=|\/(?=p\/))([\w\/\-]+)/ url.match(regex)[1] end urls = %w[http://youtu.be/sGE4HMvDe-Q http://www.youtube.com/watch?v=Lp7E973zozc&feature=relmfu http://www.youtube.com/p/A0C3C1D163BE880A?hl=en_US&fs=1] urls.each {|url| puts parse_youtube url } # sGE4HMvDe-Q # Lp7E973zozc # p/A0C3C1D163BE880A

根据您使用它的方式，您可能希望更好地validationURL确实来自youtube。

更新：

几年后再回到这里。我一直对最初的答案是多么草率感到恼火。由于Youtube域的有效性无论如何都没有得到validation，我已经删除了一些slop。

 NODE EXPLANATION -------------------------------------------------------------------------------- (?: group, but do not capture: -------------------------------------------------------------------------------- . any character except \n -------------------------------------------------------------------------------- be 'be' -------------------------------------------------------------------------------- \/ '/' -------------------------------------------------------------------------------- | OR -------------------------------------------------------------------------------- \/ '/' -------------------------------------------------------------------------------- watch 'watch' -------------------------------------------------------------------------------- \? '?' -------------------------------------------------------------------------------- v= 'v=' -------------------------------------------------------------------------------- | OR -------------------------------------------------------------------------------- \/ '/' -------------------------------------------------------------------------------- (?= look ahead to see if there is: -------------------------------------------------------------------------------- p 'p' -------------------------------------------------------------------------------- \/ '/' -------------------------------------------------------------------------------- ) end of look-ahead -------------------------------------------------------------------------------- ) end of grouping -------------------------------------------------------------------------------- ( group and capture to \1: -------------------------------------------------------------------------------- [\w\/\-]+ any character of: word characters (az, AZ, 0-9, _), '\/', '\-' (1 or more times (matching the most amount possible)) -------------------------------------------------------------------------------- ) end of \1

使用Addressable gem，您可以节省一些工作。 stdlib中还有一个URI模块，但是Addressablefunction更强大。

 require 'addressable/uri' uri = Addressable::URI.parse(youtube_url) if uri.path == "/watch" uri.query_values["v"] if uri.query_values else uri.path end

编辑| 消除了疯狂。没注意到Addressable已经提供了#query_values 。

 require 'uri' require 'cgi' urls = %w[http://youtu.be/sGE4HMvDe-Q http://www.youtube.com/watch?v=Lp7E973zozc&feature=relmfu http://www.youtube.com/p/A0C3C1D163BE880A?hl=en_US&fs=1] def parse_youtube url u = URI.parse url if u.path =~ /watch/ p CGI::parse(u.query)["v"].first else p u.path end end urls.each { |url| parse_youtube url } #=> "/sGE4HMvDe-Q" #=> "Lp7E973zozc" #=> "/p/A0C3C1D163BE880A"

解析youtubeurl

从ruby中的字符串中删除子域

Ruby Time.parse让我超出范围错误

ruby包括问题

播种未通过嵌套表validation（validates_presence_of）

使用正确的参数转义从ruby在后台执行shell命令

为什么我的ActiveRecord范围与`merge`返回一个数组？

耙资产：预编译找不到ruby

无法使用Watir绕过不安全的证书警告

Michael Hartl的Ruby on Rails教程。第9.1章中的失败测试

load / require / require_relative如何处理没有文件扩展名的文件？

解析youtubeurl

从ruby中的字符串中删除子域

Ruby Time.parse让我超出范围错误

ruby包括问题

播种未通过嵌套表validation（validates_presence_of）

使用正确的参数转义从ruby在后台执行shell命令

为什么我的ActiveRecord范围与`merge`返回一个数组？

耙资产：预编译找不到ruby

无法使用Watir绕过不安全的证书警告

Michael Hartl的Ruby on Rails教程。 第9.1章中的失败测试

load / require / require_relative如何处理没有文件扩展名的文件？

Michael Hartl的Ruby on Rails教程。第9.1章中的失败测试