## Wikipediaデータダウンロード先 http://dumps.wikimedia.org/jawiki/latest/ ## ダウンロード&解凍 ``` # wget http://dumps.wikimedia.org/jawiki/latest/jawiki-latest-pages-articles-multistream.xml.bz2 # bunzip2 jawiki-lasest-pages-articles.xml.bz2 ``` ## コレクションディレクトリ作成 ``` # cd /usr/local/solr/{プロジェクト名}/solr ``` この中の「collection1」ディレクトリがコレクションの本体になる これを任意の名前に変更する 今回はWikipediaのarticleのため、「article」コレクションとする ``` # mv collection1 article ``` ## 設定変更 ``` # vi /usr/local/solr/{プロジェクト名}/solr/article/core.properties ``` ``` name=article ``` ## スキーマ設定 ``` # vi /usr/local/solr/{プロジェクト名}/solr/article/conf/schema.xml ``` articles.xmlの定義に沿ってスキーマを設定 ``` -- 中略 -- -- 中略 -- # これ以下にある, の記述は起動時にエラーになるため削除する ``` ``は65行目〜250行目当たりにある 一旦すべて削除して必要な記述だけ記載 ###メモ ####DynamicField Solr実行時に動的にフィールドの定義を行うもの ####CopyField ドキュメント追加時にsource属性の値をdest属性にコピー ## Solr設定 ``` # vi /usr/local/solr/{プロジェクト名}/solr/article/conf/solrconfig.xml ``` データインポート用の設定を追加 ``` -- 中略 -- wikipedia-article-config.xml -- 中略 -- ``` ## データインポート設定 ``` # vi /usr/local/solr/{プロジェクト名}/solr/article/conf/wikipedia-article-config.xml ``` 上記solrconfig.xmlで定義したに対応するファイルを新規作成 ``` ``` ## インポート開始 ### Solr再起動 ``` # /etc/init.d/solr restart ``` ブラウザからアクセス http://localhost:8983/solr/ 左タブの「Core Selector」→上記で指定したコレクション名に移動 「Dataimport」をクリックし、「Execute」をクリック ※エラーが出た際は、左タブ「Logging」の内容を見ながら対処