删除重复序列

我是Ruby新手，我喜欢一些指示。我有一个包含以下许多内容的文件：

更新：

+ ?@??>=???>?>??>?>=9>>==?2>====== @IL9_2657:1:1:1:1217/1 TTTTCCGTGCTTTTTTTTTCGGTTCGATCCCCTCTTT +

我想要一个脚本，对每个包含+到+的块说，如果序列有一个，则删除块

 TTTTTTTTT.

提前致谢。

标记

这应该做：

 s = 'preceding_string+ ?@??>=???>?>??>?>=9>>==?2>===<=>=== @IL9_2657:1:1:1:1217/1 TTTTCCGTGCTTTTTTTTTCGGTTCGATCCCCTCTTT +following_string' s.gsub!(/\+[^+]*TTTTTTTTT[^+]*\+/, '') ps # => "preceding_stringfollowing_string"

首先将数据拆分为数组。 scan可以使用简单的正则表达式执行此操作。然后，您可以删除不需要的项目reject! 。例如：

 data = "+x+ +y+ +TTTTTTTTT+ +z+" blocks = data.scan(/\+[^+]+\+/) blocks.reject! { |b| b.include? "TTTTTTTTT" } p blocks # => ["+x+", "+y+", "+z+"]

 ruby -0777 -ne 'puts $_.split(/\+/).reject{|x| x[/TTTTTTT/] }.join("+")' file

序列中是否含有过多的腺嘌呤？如果是这样，使用bioruby获得序列的反向补码。

删除重复序列

如何在案例中“突破”……在Ruby中

工作的twitter-typeahead例子？

如何在没有RVM的情况下在Ubuntu上安装Ruby 1.9.3？

ExecJS :: RuntimeError：SyntaxError：意外的标记：operator（>）（行：22342，col：24，pos：826182）

如何将Heroku日志保存到文本文件

默认值：Rails资源路由的排除选项

无法安装指南针

使用Engine Yard部署Gollum wiki

为什么Ruby有时只释放内存？

在OS X 10.5下，Ruby的常规GEM路径是什么？