DN6 · November 3, 2021 19:03
diff --git a/sparknlp-comet.py b/sparknlp-comet.py
 import sparknlp
 from sparknlp.base import *
 from sparknlp.annotator import *
 from sparknlp.logging.comet import CometLogger

 spark = sparknlp.start()

 OUTPUT_LOG_PATH = "./run"
 logger = CometLogger()

 document = DocumentAssembler().setInputCol("text").setOutputCol("document")
 embds = (
    UniversalSentenceEncoder.pretrained()
    .setInputCols("document")
    .setOutputCol("sentence_embeddings")
 )
 multiClassifier = (
    MultiClassifierDLApproach()
    .setInputCols("sentence_embeddings")
    .setOutputCol("category")
    .setLabelColumn("labels")
    .setBatchSize(128)
    .setLr(1e-3)
    .setThreshold(0.5)
    .setShufflePerEpoch(False)
    .setEnableOutputLogs(True)
    .setOutputLogsPath(OUTPUT_LOG_PATH)
    .setMaxEpochs(1)
 )

 logger.monitor(logdir=OUTPUT_LOG_PATH, model=multiClassifier)
 trainDataset = spark.createDataFrame(
    [("Nice.", ["positive"]), ("That's bad.", ["negative"])],
    schema=["text", "labels"],
 )

 pipeline = Pipeline(stages=[document, embds, multiClassifier])
 pipeline.fit(trainDataset)
 logger.end()
	import sparknlp
	from sparknlp.base import *
	from sparknlp.annotator import *
	from sparknlp.logging.comet import CometLogger

	spark = sparknlp.start()

	OUTPUT_LOG_PATH = "./run"
	logger = CometLogger()

	document = DocumentAssembler().setInputCol("text").setOutputCol("document")
	embds = (
	UniversalSentenceEncoder.pretrained()
	.setInputCols("document")
	.setOutputCol("sentence_embeddings")
	)
	multiClassifier = (
	MultiClassifierDLApproach()
	.setInputCols("sentence_embeddings")
	.setOutputCol("category")
	.setLabelColumn("labels")
	.setBatchSize(128)
	.setLr(1e-3)
	.setThreshold(0.5)
	.setShufflePerEpoch(False)
	.setEnableOutputLogs(True)
	.setOutputLogsPath(OUTPUT_LOG_PATH)
	.setMaxEpochs(1)
	)

	logger.monitor(logdir=OUTPUT_LOG_PATH, model=multiClassifier)
	trainDataset = spark.createDataFrame(
	[("Nice.", ["positive"]), ("That's bad.", ["negative"])],
	schema=["text", "labels"],
	)

	pipeline = Pipeline(stages=[document, embds, multiClassifier])
	pipeline.fit(trainDataset)
	logger.end()
No results found