robertkraig-bambee · March 30, 2022 20:21
diff --git a/all-cheat-script-for-python b/all-cheat-script-for-python
 ############################################################################################################
 ##################                                                             #############################
 ##################                                                             #############################

                  This Gist collection contains all scripts for python
                    
 ##################                                                             #############################
 ##################                                                             #############################
 ############################################################################################################
diff --git a/csv-cheatsheet.py b/csv-cheatsheet.py
 import pandas as pd

 def fetchFieldFromCsvFile(file):
    for row in file.itertuples():
        Arr.append(row.csv_header)
    print(len(Arr))
    print(Arr)
    
 def bifurcateDuplicateAndUniqueValuesFromCSV(file):
    # Get duplicate from csv file
    """ example csv file - 
        csv_header
        "duplicate"
        "duplicate"
        "unique"
    Output - 
    duplicate.csv contains duplicate value
    unique.csv contains unique values
    
    """
    unique = []
    duplicate = []
    count = 0
    for row in file.itertuples():
        count+=1
        if row.csv_header in unique:
            duplicate.append(row.csv_header)
        else:
            unique.append(row.csv_header)
        print(count)
    print("Number of duplicate records ", len(duplicate))
    print("Number of unique records ", len(unique))
    pd.DataFrame(duplicate).to_csv("duplicate.csv", header=False, index=False)
    pd.DataFrame(unique).to_csv("unique.csv", header=False, index=False)
    return unique

 file = pd.read_csv("csvFile.csv")
 fetchFieldFromCsvFile(file)
 bifurcateDuplicateAndUniqueValuesFromCSV(file)
	############################################################################################################
	################## #############################
	################## #############################

	This Gist collection contains all scripts for python

	################## #############################
	################## #############################
	############################################################################################################
	import pandas as pd

	def fetchFieldFromCsvFile(file):
	for row in file.itertuples():
	Arr.append(row.csv_header)
	print(len(Arr))
	print(Arr)

	def bifurcateDuplicateAndUniqueValuesFromCSV(file):
	# Get duplicate from csv file
	""" example csv file -
	csv_header
	"duplicate"
	"duplicate"
	"unique"
	Output -
	duplicate.csv contains duplicate value
	unique.csv contains unique values

	"""
	unique = []
	duplicate = []
	count = 0
	for row in file.itertuples():
	count+=1
	if row.csv_header in unique:
	duplicate.append(row.csv_header)
	else:
	unique.append(row.csv_header)
	print(count)
	print("Number of duplicate records ", len(duplicate))
	print("Number of unique records ", len(unique))
	pd.DataFrame(duplicate).to_csv("duplicate.csv", header=False, index=False)
	pd.DataFrame(unique).to_csv("unique.csv", header=False, index=False)
	return unique

	file = pd.read_csv("csvFile.csv")
	fetchFieldFromCsvFile(file)
	bifurcateDuplicateAndUniqueValuesFromCSV(file)