使用SPHINX / ultrasphinx索引文件

我正在开发一个从网站上抓取数据的应用程序。 page_url,site_url,last_modified等详细信息将存储在数据库中,page_content将存储在文件中。 后来我想搜索文件的内容。 我正在尝试Thinkingsphinx来实现这一目标。 有没有人知道如何实施它?

你能改用Solr全文搜索吗? 我听说它甚至可以索引像PDF或单词这样的二进制文件

http://lucene.apache.org/solr/tutorial.html [enter link description here] [1]