“programming”을 입력하다가 문득 어색함이 느껴졌다. ‘double m…?’
그 순간부터 programming 이 맞는지, programing이 맞는지 헷갈리기 시작했다.
(분명 스펠링이 헷갈릴 때 단어 그 자체가 어색하게 다가오는 상황을 한번쯤 겪어보았을 것이다.)
그래서 간단히 Google Ngram Viewer를 사용해서 알아보았다.
(문법적인 옳음을 따지는 것을 제쳐두고!!)
N-gram이란, 어떤 문장에서 N개의 단어를 묶어서 그룹으로 만든 것(gram)을 가리키는 말이다.
Google Ngram Viewer를 사용하면 구글이 지금까지 스캔해 온 책들 중에서 입력값으로 준 N-gram들의 빈도가 어떻게 나타나는지 보여주는 서비스이다.
조금 아쉽지만 한국어는 지원하지 않는 듯 하다!
Google Ngram Viewer에 저런 double m 이 나타날만한 키워드를 입력해 보았다. (이 경우에는 1-gram인 것이다.)
programing, programming, programmed, programed
그 결과는 아래에 있다.