注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

(power up)

道可道,非常道。

 
 
 

日志

 
 
 
 

solr抓取mysql里的数据 之 dataimporthandler配置  

2014-06-27 16:57:13|  分类: Lucene/Solr |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
环境:
apache-tomcat-8.0.8
solr-4.8.1

初始安装请看:solr 4.8.1安装

/solr/path = /absolute/path/apache-tomcat-8.0.8/webapps/solr

1、首先需要把下面三个jar包放到/solr/path/WEB-INF/lib目录下面,或者放到tomcat的lib目录下面。
注:{{VERSION}}请换成你自己下载的对应的版本。
solr-dataimporthandler-{{VERSION}}.jar
solr-dataimporthandler-extras-{{VERSION}}.jar
mysql-connector-java-{{VERSION}}-bin.jar

2、修改/solr/path/instance/collection1/conf/solrconfig.xml,添加一个requestHandler

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>


3、添加data-config.xml文件,路径为:/solr/path/instance/collection1/conf/data-config.xml,其内容如下,同样把{{大写字母}}替换成你自己的相对内容

<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://{{HOST}}/{{DATABASE}}"
user="{{USERNAME}}"
password="{{PASSWORD}}"
batchSize="-1"/>
<document name="law">
<entity name="tax" query="select * from {{TABLE}};">
<field column="id" name="id" />
</entity>
</document>
</dataConfig>


重启tomcat,试试是否可以fetch

假设你有一个知识类型的数据库,把一些元数据和内容分开放在了两个表里面。比如:标题在一个表,内容在另外一个表里面。怎么抓取到一条里面呢。配置如下,我们以上面的配置为为例,以<document>开始:

<document name="law">
<entity name="tax" query="select * from {{TABLE}};">
<field column="id" name="id" />

<!-- 需要把内容表放到上面的entity里面 -->
<entity name="tax_content" query="select content from {{TAX_TABLE}} where id=${tax.id};">
<field column="content" name="content" />
</entity>
</entity>
</document>

关键在于红色加粗的部分,怎么样把两个数据关联起来。
  评论这张
 
阅读(144)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017