bhanpuramufaddal · June 20, 2023 12:50
diff --git a/TokenizeLemmatizeMecab.py b/TokenizeLemmatizeMecab.py
 from typing import Iterable
 from typing import Callable
 from typing import Text

 from MeCab import Tagger

 def _get_tagger() -> Tagger:
    opts = getenv('MECAB_OPTS', '-d /usr/local/Cellar/mecab-ipadic/2.7.0-20070801/lib/mecab/dic/ipadic')
    tagger = Tagger(opts)
    # for some reason the first request to the tagger doesn't produce output
    # so pre-warming it here once to avoid serving daft results later
    parsed = tagger.parseToNode('サザエさんは走った')
    while parsed:
        parsed = parsed.next
    return tagger
  
  def _tokenize(sentence: Text) -> Iterable[Text]:
    parsed = _get_tagger().parseToNode(sentence)
    while parsed:
        token = parsed.surface.strip()
        if token:
            yield token
        parsed = parsed.next
	from typing import Iterable
	from typing import Callable
	from typing import Text

	from MeCab import Tagger

	def _get_tagger() -> Tagger:
	opts = getenv('MECAB_OPTS', '-d /usr/local/Cellar/mecab-ipadic/2.7.0-20070801/lib/mecab/dic/ipadic')
	tagger = Tagger(opts)
	# for some reason the first request to the tagger doesn't produce output
	# so pre-warming it here once to avoid serving daft results later
	parsed = tagger.parseToNode('サザエさんは走った')
	while parsed:
	parsed = parsed.next
	return tagger

	def _tokenize(sentence: Text) -> Iterable[Text]:
	parsed = _get_tagger().parseToNode(sentence)
	while parsed:
	token = parsed.surface.strip()
	if token:
	yield token
	parsed = parsed.next
No results found