Tag: 解析

从Rails中的字符串解析/提取文本？: 我在Rails中有一个字符串，例如“这是一个Twitter消息。＃Tossstoy的战争与和平。我喜欢这本书！”，我想解析文本并仅提取某些短语，如“战争与和平”利奥托尔斯泰“。这是使用正则表达式并在“#books”到“。”之间解除文本的问题吗？如果消息没有结构，例如：“这是一条Twitter消息，那么Leo Tolstoy的战争与和平我喜欢这本书！” 或者“这是Twitter的消息。我喜欢Leo Tolstoy #books的战争与和平书”如何在不知道事前口语的情况下可靠地拉出“战争与和平由Leo Tolstoy”。有没有可以帮助我做到这一点的gem，方法等？至少，你会说我想做什么？它将帮助我在Google上搜索解决方案。我尝试了几次“解析”搜索没有运气。 —编辑—基于@rogeliog建议，我将添加以下内容：我可以忍受#books之后的垃圾文本，但之前没有。我试过“匹配。（/＃books。* /）” – 结果在这里： www.rubular.com/r/gM7oSZxF5M 。但是我如何捕获结果＃6？（例如，当某人将#books放在句子末尾时）？有没有办法让我用正则表达式做if-then？就像是：如果[#books在消息的末尾]，然后[拿#books之前的最后10个字]，别的[match。（/＃books。* /）] 如果您提供正则表达式，请使用rubular.com通过永久链接发布您的解决方案

Rails中的高级Feed解析: 我是rails的新手，我一直在观看Rails Castsvideo。我有兴趣了解FeedZirra（ Rails演员阵容168 ）以及特别是feed解析。例如，我需要解析来自Telegraph和Guardian的提要我想把两份报纸上的所有体育新闻放在一张桌子上，另一张桌子上的足球新闻，另一张桌子上的板球新闻等如何使用feed-zirra实现这一目标？如何在一个视图中仅显示足球新闻，在另一个视图中仅显示板球新闻？此外，我希望用户在他实际点击链接并发现之前知道他将访问哪个网站。像这样的东西 2010年莱德杯：Graeme McDowell 5分钟前是欧洲的完美英雄 Telegraph.co.uk 我如何显示Telegraph.co.uk 期待您的帮助和支持谢谢

如何使用解析器gem来提取我想要的代码片段？: 我偶然发现了这个Parsergem 。我想要做的是从长文件中提取一个特定的方法。一个例子是来自Rails的has_many方法： def has_many(name, scope = nil, options = {}, &extension) reflection = Builder::HasMany.build(self, name, scope, options, &extension) Reflection.add_reflection self, name, reflection end 唯一的问题是，我需要能够提取同一方法的另一个版本（从较早的时间开始），这更加冗长和复杂。那个版本看起来像这样： def has_many(association_id, options = {}) validate_options([ :foreign_key, :class_name, :exclusively_dependent, :dependent, :conditions, :order, :finder_sql ], options.keys) association_name, association_class_name, association_class_primary_key_name = associate_identification(association_id, options[:class_name], options[:foreign_key]) require_association_class(association_class_name) if options[:dependent] and options[:exclusively_dependent] raise […]

如何从LinkedIn解析Mash以创建Ruby对象: 我使用pengwynn的LinkedIn gem来获取LinkedIn的身份validation。一切正常，我在回调中得到一个Mash，如下所示： #<LinkedIn::Mash all=[#<LinkedIn::Mash company=# id=2851554 is_current=true start_date=# summary=”” title=”Boss”>] total=1> 我怎样才能将它解析为类似于Rails参数的东西，以便从中创建一个新对象？谢谢。

Rails XML解析: 任何人都可以告诉我如何解决这个问题。 messageType SMS id xxxxxxxxxxxxxx source xxxxxxxxxxx target xxxxxxxxxxxxx msg xxxxxxxxxxxxx udh 我无法控制这个xml，但我希望在保存到我的数据库之前我可以使参数看起来像这样 message”=>{“msg”=>”sampler”, “id”=>”1”, “target”=>”23123”, “source”=>”312321312”} 这是我访问我的方法时收到的参数 message”=>{“param”=>[{“name”=>”id”, “value”=>”2373084120100804002252”}, {“name”=>”messageType”, “value”=>”SMS”}, {“name”=>”target”, “value”=>”23730841”}, {“name”=>”source”, “value”=>”09156490046”}, {“name”=>”msg”, “value”=>”Hello world via iPhone”}, {“name”=>”udh”, “value”=>nil}]}

Nokogiri解析: 我有一些XML： xml = <<-EOT Sport Mobile Flowers EOT 并希望解析它： id=[] text=[] doc = Nokogiri::XML(xml) doc.search(‘advcampaign_categories’).each do |cat| c = cat.at(‘category’) text << c.text id << c['id'] end h = Hash[text.zip id] 我的目标是获得像{sport:85, mobile:79..etc}这样的哈希值。这段代码的问题是它只返回一个元素sport:85 。有什么建议？

如何使用Nokogiri gem获取innerHtml: 例如我有html： bla bla bla bla 我需要获得div.item的内部html： bla bla bla bla 我知道我可以使用： doc.css(“div.item:first”).text text方法返回没有任何html标签的干净文本但是我应该怎样做才能获得div.item的内部html？尝试： doc.css(“div.item:first”).html 但是没有用，文档也无济于事有任何想法吗？

在ruby中解析: 我有这个Hash ： cookie = {“fbs_138415639544444″=>[“\”access_token=138415639544444|5c682220fa7ebccafd97ec58-503523340|9HHx3z7GzOBPdk444wtt&expires=0 &secret=64aa8b3327eafbfd22ba070b&session_key=5c682220fa7dsfdsafas3523340 &sig=4a494b851ff43d3a58dfa8757b702dfe&uid=503523340\””], “_play_session”=>[“fdasdfasdf”]} 我需要在access_token=之前&expires之后才能获得子串。问题是密钥fbs_138415639544444中的数字每次fbs_138415639544444改变，只是部分fbs_保持不变。知道如何获得： “138415639544444|5c682220fa7ebccafd97ec58-503523340|9HHx3z7GzOBPdk444wtt”

解析apache常见的日志格式日志文件: 我正在尝试从常见的日志格式日志文件中获取三条信息。日志文件的条目是： 65.54.188.137 – – [03/Oct/2007:02:20:22 -0400] “GET /~longa/statistics/code/xlispstat/smoothers/spline/ HTTP/2.0” 301 2633 从那时起，我想在散列中存储IP的出现次数，URL和状态代码。我认为他们每个人都必须独立。即使您可以指出我正确的方向，任何帮助将不胜感激。