Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Select an option

  • Save thanhson10f/f428868560edec2369486c7e43145b99 to your computer and use it in GitHub Desktop.

Select an option

Save thanhson10f/f428868560edec2369486c7e43145b99 to your computer and use it in GitHub Desktop.
Chuyển đổi từ Tiếng Việt có dấu sang Tiếng Việt không dấu
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""Chương trình chuyển đổi từ Tiếng Việt có dấu sang Tiếng Việt không dấu
"""
import re
def no_accent_vietnamese(s):
s = s.decode('utf-8')
s = re.sub(u'[àáạảãâầấậẩẫăằắặẳẵ]', 'a', s)
s = re.sub(u'[ÀÁẠẢÃĂẰẮẶẲẴÂẦẤẬẨẪ]', 'A', s)
s = re.sub(u'[èéẹẻẽêềếệểễ]', 'e', s)
s = re.sub(u'[ÈÉẸẺẼÊỀẾỆỂỄ]', 'E', s)
s = re.sub(u'[òóọỏõôồốộổỗơờớợởỡ]', 'o', s)
s = re.sub(u'[ÒÓỌỎÕÔỒỐỘỔỖƠỜỚỢỞỠ]', 'O', s)
s = re.sub(u'[ìíịỉĩ]', 'i', s)
s = re.sub(u'[ÌÍỊỈĨ]', 'I', s)
s = re.sub(u'[ùúụủũưừứựửữ]', 'u', s)
s = re.sub(u'[ƯỪỨỰỬỮÙÚỤỦŨ]', 'U', s)
s = re.sub(u'[ỳýỵỷỹ]', 'y', s)
s = re.sub(u'[ỲÝỴỶỸ]', 'Y', s)
s = re.sub(u'Đ', 'D', s)
s = re.sub(u'đ', 'd', s)
return s.encode('utf-8')
if __name__ == '__main__':
print no_accent_vietnamese("Việt Nam Đất Nước Con Người")
print no_accent_vietnamese("Welcome to Vietnam !")
print no_accent_vietnamese("VIỆT NAM ĐẤT NƯỚC CON NGƯỜI")
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""Chương trình chuyển đổi từ Tiếng Việt có dấu sang Tiếng Việt không dấu
"""
import re
def no_accent_vietnamese(s):
s = re.sub(u'[àáạảãâầấậẩẫăằắặẳẵ]', 'a', s)
s = re.sub(u'[ÀÁẠẢÃĂẰẮẶẲẴÂẦẤẬẨẪ]', 'A', s)
s = re.sub(u'[èéẹẻẽêềếệểễ]', 'e', s)
s = re.sub(u'[ÈÉẸẺẼÊỀẾỆỂỄ]', 'E', s)
s = re.sub(u'[òóọỏõôồốộổỗơờớợởỡ]', 'o', s)
s = re.sub(u'[ÒÓỌỎÕÔỒỐỘỔỖƠỜỚỢỞỠ]', 'O', s)
s = re.sub(u'[ìíịỉĩ]', 'i', s)
s = re.sub(u'[ÌÍỊỈĨ]', 'I', s)
s = re.sub(u'[ùúụủũưừứựửữ]', 'u', s)
s = re.sub(u'[ƯỪỨỰỬỮÙÚỤỦŨ]', 'U', s)
s = re.sub(u'[ỳýỵỷỹ]', 'y', s)
s = re.sub(u'[ỲÝỴỶỸ]', 'Y', s)
s = re.sub(u'Đ', 'D', s)
s = re.sub(u'đ', 'd', s)
return s
if __name__ == '__main__':
print no_accent_vietnamese("Việt Nam Đất Nước Con Người")
print no_accent_vietnamese("Welcome to Vietnam !")
print no_accent_vietnamese("VIỆT NAM ĐẤT NƯỚC CON NGƯỜI")
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment