Last active
August 29, 2015 14:01
-
-
Save shrink0r/82af462b281b4b547f0b to your computer and use it in GitHub Desktop.
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
| LocalNews Dataset | |
| ========= | |
| https://s3-us-west-2.amazonaws.com/elasticsearch-hackfest/localnews.bulk | |
| This LocalNews dataset contains 21453 records of localnews for Berlin. | |
| Each item is related to a district and has a (lon/lat) geo point. | |
| For information on Berlin's district/neighborhood structure see: | |
| http://berlin.barwick.de/information/districts/index.html | |
| Further more every item has a category and optional tags. | |
| Following up a list of the fields that make up a news item: | |
| - **id:text** An id which is unique inside this dataset. | |
| - **title:text** A news item's title. | |
| - **text:text** The news item's text/content. | |
| - **teaser:text** Shorter than text, can be used for teasers... | |
| - **publishDate:date** Point of time at which an item was published (ISO8601 date format) | |
| - **source:text** Holds a news item's source, reporting entity. | |
| - **category:text** A news item's category; one of: *Polizeimeldungen*, *Kiezleben*, *Kiezkultur*, *Bekanntmachungen*, *Stadtteilentwicklung* | |
| - **tags:text** A list of arbitrary tags. | |
| - **location:object** An object describing a news item's location. | |
| - **coordinates:geopoint** Holds the WGS84 longitude & latitude values that localize a news item's. | |
| - **street:text** | |
| - **postCode:text** | |
| - **administrativeDistrict:text** An news item's disrict's official/administrative name. | |
| - **district:text** Holds an item's "old" district name (for example Prenzlauer Berg was it's own district not so long ago) | |
| - **neighborhood:text** Holds the neighborhood in Berlin that a news item relates to. (Grunewald, Niederschönhausen etc.) | |
| - **city:text** | |
| - **name:text** | |
| Below an example news item in the JSON format: | |
| ```json | |
| { | |
| "id": "localnews-10001", | |
| "location": { | |
| "coordinates": { | |
| "lat": 52.48127, | |
| "lon": 13.43558 | |
| }, | |
| "administrativeDistrict": "Neukölln", | |
| "district": "Neukölln", | |
| "neighborhood": "Neukölln", | |
| "street": "Karl-Marx-Straße 83", | |
| "name": "Rathaus Neukölln", | |
| "city": "Berlin", | |
| "postCode": "12043" | |
| }, | |
| "title": "Aktuelle Bebauungspläne liegen im Rathaus aus", | |
| "tags": [], | |
| "category": "bekanntmachungen", | |
| "teaser": "Die Bebauungspläne für die Grundstücke Hermannstraße 134 bis 137A sowie eine Teilfläche des Grundstücks Hermannstraße 133 liegen im Fachbereich Stadtplanung aus. Bewohner können sich hier bis 25. Oktober 2012 über den Stand der Dinge informieren.", | |
| "text": "Wesentliches Ziel ist die planungsrechtliche Sicherung der vorhandenen Wohnbebauung sowie der Schaffung neuer Wohnbauflächen im Ortsteil Neukölln durch die Festsetzung von Allgemeinen Wohngebieten (WA). Die Erschließung wird mittels privater Verkehrsflächen und Straßenverkehrsflächen gesichert.\nDas Verfahren wird gemäß § 13a des Baugesetzbuchs als beschleunigtes Verfahren ohne Durchführung einer Umweltprüfung nach § 2 Abs. 4 des Baugesetzbuchs durchgeführt.\n\nDie Bürger sind innerhalb der Auslegungszeit aufgefordert, Anregungen vorzubringen. Dabei besteht auch die Möglichkeit, sich unmittelbar online zu beteiligen.\n\nDer Plan kann von Montag bis Donnerstag von 8.30 Uhr bis 16.30 Uhr und freitags von 8.30 Uhr bis 15.30 Uhr im Rathaus Neukölln eingesehen werden.\nDer Bebauungsplanentwurf kann auch im Internet eingesehen werden unter: http://www.berlin.de/ba-neukoelln/verwaltung/bebauungsplaene/bplan.html", | |
| "source": "Bezirksamt Neukölln", | |
| "publishDate": "2012-10-09T12:32:31+0200" | |
| } | |
| ``` |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
The
mapping.jsonfile specifies a ICU plugin for sorting correctly in german etc. You can remove that part from the mapping or install the necessary plugin:bin/plugin -install elasticsearch/elasticsearch-analysis-icu/2.0.0This should make the indexing work then.