Tag: mp3

flac:“错误:输入文件有一个ID3v2标签”(它没有)

我正在尝试构建一个相当长的程序和库链,最终使用语音到文本API将mp3文件运行到人类可读的文本中。 我很惊讶地发现在网上这么做的API很少 – 我找到的唯一工作就是speech2text项目: https : //github.com/taf2/speech2text ,它与谷歌的非官方语音到文本API有关。 这实际上起初有效。 我做了一些手动转换,并对结果感到满意。 但是,由于尝试在Java中自动化进程链,因此它已停止正常工作。 编辑 – 以下错误消息从技术上来自flac本身,而不是speech2text。 尝试仅使用flac而不是speech2text转换这些文件也会导致id3v2错误消息,因此错误与speech2text无关(尽管speech2text可能是错误标记的来源) Java将此报告为错误(在使用ProcessBuilder调用speech2text并打印出流后): /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_inspector.rb:50:in initialize’: undefined method first’for nil:NilClass(NoMethodError)from / Library / Ruby / Gems / 1.8 / gems / speech2text-0.3.4 / lib / speech / audio_splitter.rb:77:in new’from new’ from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:77:in初始化’来自/Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:15:in new’ from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:15:in /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/bin/speech2text:11 from / usr / bin / speech2text:19:in来自/ […]

Ruby音频库

有什么好的Ruby音频库可以构建吗? 需要管理/编辑mp3文件!

Ruby mp3 Id3解析

目前我正在从事音乐项目,处理用户mp3上传。 问题是我找不到一个能够正常运行所有文件的id3库。 我尝试过id3-ruby和Mp3Info库,但没有一个能给我一致的正确结果。 例如,最常见的问题: 错误的流参数(比特率和采样率,有时持续时间) 不支持扩展标签 我决定添加一个表单,用户可以提供艺术家和标题等可选信息; 这有点帮助,但没有完全解决问题。 什么是ruby最实用,最强大的ID3库?

从文件中提取快速傅立叶变换数据

我正在构建一个应该在服务器上运行并分析声音文件的工具。 我想在Ruby中执行此操作,因为我的所有其他工具也都是用Ruby编写的。 但我找不到一个完成这个的好方法。 我发现的很多例子都是可视化器和图形化的东西。 我只需要FFT数据,仅此而已。 我需要获取音频数据,并对其进行FFT。 我的最终目标是计算一些东西,如平均值/中位数/模式,第25百分位数和第75百分位数在所有频率(加权幅度),BPM,以及可能还有一些其他好的特性,以便以后能够将类似的声音聚集在一起。 首先我尝试使用ruby-audio和fftw3,但我从来没有让两者真正合作。 文档也不好,所以我真的不知道什么数据被洗牌。 接下来我尝试使用bplay / brec并限制我的Ruby脚本只使用STDIN并对其执行FFT(仍然使用fftw3)。 但我无法让bplay / brec工作,因为服务器没有声卡,我没有设法直接将音频直接发送到STDOUT,而无需先进入音频设备。 这是我得到的最接近的: # extracting audio from wav with ruby-audio buf = RubyAudio::Buffer.float(1024) RubyAudio::Sound.open(fname) do |snd| while snd.read(buf) != 0 # ??? end end # performing FFT on audio def get_fft(input, window_size) data = input.read(window_size).unpack(“s*”) na = NArray.to_na(data) fft = FFTW3.fft(na).to_a[0, window_size/2] […]

如何以编程方式将mp3转换为itunes-playable aac / m4a文件?

我一直在寻找一种方法,以编程方式或通过命令行将mp3转换为aac而没有运气。 理想情况下,我有一段代码,我可以从我的rails应用程序调用,将mp3转换为aac。 我安装了ffmpeg和libfaac,并能够使用以下命令创建aac文件: ffmpeg -i test.mp3 -acodec libfaac -ab 163840 dest.aac 当我将输出文件的名称更改为dest.m4a时,它不会在iTunes中播放。 谢谢!