Tag: 解析

从Rails中的字符串解析/提取文本?

我在Rails中有一个字符串,例如“这是一个Twitter消息。#Tossstoy的战争与和平。我喜欢这本书!”,我想解析文本并仅提取某些短语,如“战争与和平”利奥托尔斯泰“。 这是使用正则表达式并在“#books”到“。”之间解除文本的问题吗? 如果消息没有结构,例如:“这是一条Twitter消息,那么Leo Tolstoy的战争与和平我喜欢这本书!” 或者“这是Twitter的消息。我喜欢Leo Tolstoy #books的战争与和平书”如何在不知道事前口语的情况下可靠地拉出“战争与和平由Leo Tolstoy”。 有没有可以帮助我做到这一点的gem,方法等? 至少,你会说我想做什么? 它将帮助我在Google上搜索解决方案。 我尝试了几次“解析”搜索没有运气。 —编辑—基于@rogeliog建议,我将添加以下内容: 我可以忍受#books之后的垃圾文本,但之前没有。 我试过“匹配。(/#books。* /)” – 结果在这里: www.rubular.com/r/gM7oSZxF5M 。 但是我如何捕获结果#6? (例如,当某人将#books放在句子末尾时)? 有没有办法让我用正则表达式做if-then? 就像是: 如果[#books在消息的末尾], 然后[拿#books之前的最后10个字], 别的[match。(/#books。* /)] 如果您提供正则表达式,请使用rubular.com通过永久链接发布您的解决方案

Rails中的高级Feed解析

我是rails的新手,我一直在观看Rails Castsvideo。 我有兴趣了解FeedZirra( Rails演员阵容168 )以及特别是feed解析。 例如,我需要解析来自Telegraph和Guardian的提要 我想把两份报纸上的所有体育新闻放在一张桌子上,另一张桌子上的足球新闻,另一张桌子上的板球新闻等 如何使用feed-zirra实现这一目标? 如何在一个视图中仅显示足球新闻,在另一个视图中仅显示板球新闻? 此外,我希望用户在他实际点击链接并发现之前知道他将访问哪个网站。 像这样的东西 2010年莱德杯:Graeme McDowell 5分钟前是欧洲的完美英雄 Telegraph.co.uk 我如何显示Telegraph.co.uk 期待您的帮助和支持 谢谢

如何使用解析器gem来提取我想要的代码片段?

我偶然发现了这个Parsergem 。 我想要做的是从长文件中提取一个特定的方法。 一个例子是来自Rails的has_many方法: def has_many(name, scope = nil, options = {}, &extension) reflection = Builder::HasMany.build(self, name, scope, options, &extension) Reflection.add_reflection self, name, reflection end 唯一的问题是,我需要能够提取同一方法的另一个版本(从较早的时间开始),这更加冗长和复杂。 那个版本看起来像这样: def has_many(association_id, options = {}) validate_options([ :foreign_key, :class_name, :exclusively_dependent, :dependent, :conditions, :order, :finder_sql ], options.keys) association_name, association_class_name, association_class_primary_key_name = associate_identification(association_id, options[:class_name], options[:foreign_key]) require_association_class(association_class_name) if options[:dependent] and options[:exclusively_dependent] raise […]

如何从LinkedIn解析Mash以创建Ruby对象

我使用pengwynn的LinkedIn gem来获取LinkedIn的身份validation。 一切正常,我在回调中得到一个Mash,如下所示: #<LinkedIn::Mash all=[#<LinkedIn::Mash company=# id=2851554 is_current=true start_date=# summary=”” title=”Boss”>] total=1> 我怎样才能将它解析为类似于Rails参数的东西,以便从中创建一个新对象? 谢谢。

Rails XML解析

任何人都可以告诉我如何解决这个问题。 messageType SMS id xxxxxxxxxxxxxx source xxxxxxxxxxx target xxxxxxxxxxxxx msg xxxxxxxxxxxxx udh 我无法控制这个xml,但我希望在保存到我的数据库之前我可以使参数看起来像这样 message”=>{“msg”=>”sampler”, “id”=>”1”, “target”=>”23123”, “source”=>”312321312”} 这是我访问我的方法时收到的参数 message”=>{“param”=>[{“name”=>”id”, “value”=>”2373084120100804002252”}, {“name”=>”messageType”, “value”=>”SMS”}, {“name”=>”target”, “value”=>”23730841”}, {“name”=>”source”, “value”=>”09156490046”}, {“name”=>”msg”, “value”=>”Hello world via iPhone”}, {“name”=>”udh”, “value”=>nil}]}

Nokogiri解析

我有一些XML: xml = <<-EOT Sport Mobile Flowers EOT 并希望解析它: id=[] text=[] doc = Nokogiri::XML(xml) doc.search(‘advcampaign_categories’).each do |cat| c = cat.at(‘category’) text << c.text id << c['id'] end h = Hash[text.zip id] 我的目标是获得像{sport:85, mobile:79..etc}这样的哈希值。 这段代码的问题是它只返回一个元素sport:85 。 有什么建议?

如何使用Nokogiri gem获取innerHtml

例如我有html: bla bla bla bla 我需要获得div.item的内部html: bla bla bla bla 我知道我可以使用: doc.css(“div.item:first”).text text方法返回没有任何html标签的干净文本 但是我应该怎样做才能获得div.item的内部html? 尝试: doc.css(“div.item:first”).html 但是没有用,文档也无济于事 有任何想法吗?

在ruby中解析

我有这个Hash : cookie = {“fbs_138415639544444″=>[“\”access_token=138415639544444|5c682220fa7ebccafd97ec58-503523340|9HHx3z7GzOBPdk444wtt&expires=0 &secret=64aa8b3327eafbfd22ba070b&session_key=5c682220fa7dsfdsafas3523340 &sig=4a494b851ff43d3a58dfa8757b702dfe&uid=503523340\””], “_play_session”=>[“fdasdfasdf”]} 我需要在access_token=之前&expires之后才能获得子串。 问题是密钥fbs_138415639544444中的数字每次fbs_138415639544444改变,只是部分fbs_保持不变。 知道如何获得: “138415639544444|5c682220fa7ebccafd97ec58-503523340|9HHx3z7GzOBPdk444wtt”

解析apache常见的日志格式日志文件

我正在尝试从常见的日志格式日志文件中获取三条信息。 日志文件的条目是: 65.54.188.137 – – [03/Oct/2007:02:20:22 -0400] “GET /~longa/statistics/code/xlispstat/smoothers/spline/ HTTP/2.0” 301 2633 从那时起,我想在散列中存储IP的出现次数,URL和状态代码。 我认为他们每个人都必须独立。 即使您可以指出我正确的方向,任何帮助将不胜感激。

将字符串解析为复杂布尔值的递归逻辑?

我确信之前已经完成了,我找不到它。 我需要将“((A OR B)和C)或D”之类的内容转换为属性的数据库查询。 具体来说,我正在使用Ruby Sequel。 任何人都可以指出我的例子或实用程序或某些东西会阻止我重新发明轮子吗?