https://github.com/garfieldnate/kengdic
깃허브에 있는 자료를 db로 만들어 봤습니다.
그냥 쉽게 생각해서 word, def, hanja 컬럼만 이용해봤습니다.
학교, school, 學校 이렇게 져장된 자료가 나온다고 생각하시면 됩니다.
총 13만 이상의 데이터가 있습니다.
위쪽 링크자료 중에서 tsv 를 이용해서 db로 만든 겁니다.
티브이를 보다가 초성퀴즈가 나오길래 이걸 좀 쉽게 접근해보자 싶어서 고안했습니다.
초성을 찾는 방법은 문자표에서 가 코드가 44032 입니다.
각각 초성은 588새씩 ㄱㄲㄴㄷㄸ.... ㅎ 순서로 저장되어 있습니다
고로 그 글자의 코드를 알면 초성이 뭔지 알 수 있다는 이야깁니다.
원하는 글자의 코드에서 44032를 빼고 그 숫자를 588로 나누면 몇번째 페이지인지 알아낸다는 방법입니다.
db 에서는 substr, unicode FUNCTION 을 쓸 수 있겠으나 태스커 플러그인 sqlite3 는 불행히도 blob, unicode 함수 오류가 나오므로 해당초성을 가 보다 크고 깋 보다는 작거나 같고 등으로 처리하시면 됩니다.
substr(word,1,1) <= '가' and substr(word,1,1) <= '깋'
이 쿼리는 word 첫번째 단어 초성이 ㄱ 인 경우를 찾지요.
substr(word,2,1) <= '나' and substr(word,2,1) <= '닣'
2번째 글자의 초성이 ㄴ 인 경우입니다.
지금 처리할 일이 좀 있는 관계로 간략하게 설명했습니다.
** 참고
참고로 태스커 변수에서 문자코드 값을 구하는 방법은
var input = input.charCodeAt(0)
java scriptlet 을 이행하는 겁니다.
변수 input 의 코그사 반환됩니다. 마지막 괄호안 숫자는 0일때 첫문자 1일때 두번째문자 입니다.
문제적남자 문제에서 나왔던 ㅅㅇㅈ 초성으로는 76개가 나오네요