mysql

2022.04.22 16:18

utf8mb4_general_ci utf8mb4_unicode_ci

  • 관리자 2022.04.22 인기
  • 4,657
    0

MySQL UTF8MB4 Charset의 Collation 선택 

https://blog.daum.net/osban/17147427 



utf8mb4_unicode_ci와 utf8mb4_general_ci는 문자 정렬 순서에 약간의 차이가 있을 뿐 거의 비슷한 형태의 collation을 제공하는 것으로 알려져 있다. 

(general 쪽은 좀 더 human friendly, unicode 쪽은 performance 최적)

하지만 실제 결과를 보면 utf8mb4_general_ci와는 다르게, utf8mb4_unicode_ci는 전각/반각 문자를 구분하지 않는 것을 확인할 수 있다.


● 정렬 결과 정리

 

utf8mb4_general_ci

utf8mb4_bin

utf8mb4_unicode_ci

utf8mb4_unicode_520_ci

알파벳 대소문자 구분

X

O

X

X

전각/반각 문자 구분

(알파벳, 숫자, 가타가나 등)

O

O

X

X

emoji 문자 구분

X

O

X

O

 

※[참고] utf8mb4에서 emoji 문자지원 

  • 공유링크 복사