kunato · June 8, 2024 16:43 · Jun 8, 2024 · Jun 8, 2024 · Jun 8, 2024 · Jun 8, 2024
diff --git a/convert_to_awq.py b/convert_to_awq.py
@@ -13,7 +13,7 @@
     # Load model
     model = AutoAWQForCausalLM.from_pretrained(model_path)
     # Quantize
-    model.quantize(tokenizer, quant_config=quant_config) # add calib_data=huggingface_datasets to optimize how the model get optimized (better tobe Thai & English unsupervised corpus)
+    model.quantize(tokenizer, quant_config=quant_config) # add calib_data=huggingface_datasets to optimize how the model get optimized (using Thai & English unsupervised corpus (maybe en_wiki + th_wiki)
     # Save quantized model
     model.save_quantized(quant_path)
 
diff --git a/convert_to_awq.py b/convert_to_awq.py
@@ -13,7 +13,7 @@
     # Load model
     model = AutoAWQForCausalLM.from_pretrained(model_path)
     # Quantize
-    model.quantize(tokenizer, quant_config=quant_config) # add calib_data=huggingface_datasets to optimized how the model get optimized
+    model.quantize(tokenizer, quant_config=quant_config) # add calib_data=huggingface_datasets to optimize how the model get optimized (better tobe Thai & English unsupervised corpus)
     # Save quantized model
     model.save_quantized(quant_path)
 
diff --git a/convert_to_awq.py b/convert_to_awq.py
@@ -1,7 +1,7 @@
 from awq import AutoAWQForCausalLM
 from transformers import AutoTokenizer
 
-# TODO pip install autoawq==0.2.4from awq import AutoAWQForCausalLM
+# TODO pip install autoawq==0.2.4
 
 if __name__ == '__main__':
     model_path = 'scb10x/llama-3-typhoon-v1.5x-8b-instruct'

diff --git a/convert_to_awq.py b/convert_to_awq.py
@@ -1,7 +1,7 @@
 from awq import AutoAWQForCausalLM
 from transformers import AutoTokenizer
 
-# TODO pip install autoawq==0.2.4
+# TODO pip install autoawq==0.2.4from awq import AutoAWQForCausalLM
 
 if __name__ == '__main__':
     model_path = 'scb10x/llama-3-typhoon-v1.5x-8b-instruct'
@@ -13,6 +13,7 @@
     # Load model
     model = AutoAWQForCausalLM.from_pretrained(model_path)
     # Quantize
-    model.quantize(tokenizer, quant_config=quant_config)
+    model.quantize(tokenizer, quant_config=quant_config) # add calib_data=huggingface_datasets to optimized how the model get optimized
     # Save quantized model
-    model.save_quantized(quant_path)
+    model.save_quantized(quant_path)
+
diff --git a/convert_to_awq.py b/convert_to_awq.py
@@ -0,0 +1,18 @@
+from awq import AutoAWQForCausalLM
+from transformers import AutoTokenizer
+
+# TODO pip install autoawq==0.2.4
+
+if __name__ == '__main__':
+    model_path = 'scb10x/llama-3-typhoon-v1.5x-8b-instruct'
+    quant_path = 'llama-3-typhoon-v1.5x-8b-instruct-awq'
+    quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMM" }
+    tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
+    tokenizer.save_pretrained(quant_path)
+
+    # Load model
+    model = AutoAWQForCausalLM.from_pretrained(model_path)
+    # Quantize
+    model.quantize(tokenizer, quant_config=quant_config)
+    # Save quantized model
+    model.save_quantized(quant_path)
No results found