프로그램과 웹서비스

단어사용 빈도를 알려주는 구글의 새로운 서비스 Books Ngram Viewer

네그나 2010. 12. 19. 13:00

구글이 책을 디지털 정보로 변환시키고 있다는 것은 잘알려졌죠. 디지털의 강점이 보여주는 새로운 서비스가
나왔습니다. http://ngrams.googlelabs.com




‘구글북스’로 인류 언어사용 변화 한눈에 본다… 1500년대 이후 책 1500만권 디지털화



Books Ngram Viewer 에서 단어를 검색하면 빈도수를 그래프로 보여줍니다.
아쉽게도 한국어는 지원하는 않습니다.
예를 들어서 korea로 검색을 하면



< korea라고 입력했을 때 >


korea가 처름 언급된 시기는 1850년 경이네요.
같은 정보라도 단어를 달리 입력하면 다른 정보가 나옵니다. south korea를 입력하면 1980년대 부터 언급됩니다.

< south korea 라고 입력을 했을 때 >



internet 이라고 입력했을 때는 1900년 부터 나오네요. 신기하군요.  단어 사용이 생각보다 빠릅니다.


smartphone  이라고 입력을 했을 때도 1900년 부터 언급되었네요. 폭발적으로 늘어난 것은 2000년 전후이고요.
이 서비스를 활용하면 트렌드 파악하기가 용이하겠습니다. 티핑포인트가 언제 인지 확인할 수 있습니다.


구글북스를 보면서 느끼는게 구글의 강점은 이런 것입니다. 그들의 사명대로 전세계의 정보를 수집하고 분류하는
거죠. 요즘에는 페이스북 같은 소셜네트워크가 부상하고 있습니다. 페이스북이 구글을 위협할 정도가 되면서
구글에게는 감성이 없다는 지적이 나오고 있습니다. 엔지니어 중심으로 돌아가는 구글에게 고민을 안겨주고 있죠.


하지만 능력 이라는 것은 어디에서 사용하는냐에 따라서 효과가 다르겠죠.  이런 프로젝트는 엔지니어 마인드가
강점을 발휘할 수 있습니다. 어떻게 하면 효율적으로 빨리 수집할까를 고민해야 하니까요. 이런 서비스를 소셜이나
위키류의 서비스에 적용한다면 한계가 있을 수 밖에 없겠죠.

반응형