salmanmaq · November 16, 2018 17:23
diff --git a/get_core_and_non_core_list.py b/get_core_and_non_core_list.py
 """
 Get the arxiv ids of all the Core and Non-Core records in INSPIRE.
 """

 from invenio_search import current_search_client as es
 from elasticsearch.helpers import scan
 import numpy as np

 core = []
 non_core = []


 for hit in scan(es, query={"query": {"exists": {"field": "arxiv_eprints"}}, "_source": ["core", "arxiv_eprints"]}, index='records-hep', doc_type='hep'):
  source = hit['_source']
  if source.get('core') == True:
    core.append(source['arxiv_eprints'][0]['value'])
  else:
    non_core.append(source['arxiv_eprints'][0]['value'])
    
 core = np.array(core)
 non_core = np.array(non_core)
  
 core.tofile('inspire_core_list.txt', sep='\n')
 non_core.tofile('inspire_noncore_list.txt', sep='\n')
	"""
	Get the arxiv ids of all the Core and Non-Core records in INSPIRE.
	"""

	from invenio_search import current_search_client as es
	from elasticsearch.helpers import scan
	import numpy as np

	core = []
	non_core = []


	for hit in scan(es, query={"query": {"exists": {"field": "arxiv_eprints"}}, "_source": ["core", "arxiv_eprints"]}, index='records-hep', doc_type='hep'):
	source = hit['_source']
	if source.get('core') == True:
	core.append(source['arxiv_eprints'][0]['value'])
	else:
	non_core.append(source['arxiv_eprints'][0]['value'])

	core = np.array(core)
	non_core = np.array(non_core)

	core.tofile('inspire_core_list.txt', sep='\n')
	non_core.tofile('inspire_noncore_list.txt', sep='\n')
No results found