Search Results for 'Semantic Search'


2 POSTS

  1. 2009.11.24 특이성(Specificity)과 일반성(Generality)
  2. 2009.10.07 네이트의 시맨틱 검색

특이성(Specificity)과 일반성(Generality)

Posted 2009.11.24 19:15 by 하은빠 SemanticWeb

참고로 이 글은 이 글을 읽는 분들께 아이디어를 구하고자 하는 것이 목적이다.

정보이론(Information Theory)에 따르면 이벤트가 발생할 확률을 이용하여 자신의 자기 정보량(Self-Information)을 측정할 수 있다.


자기 정보량은 확률에 대한 -log로 계산되는데, -log를 사용함으로써 발생확률이 낮을 수록 무한대로 큰 값을 갖게 된다.


즉, 발생 확률이 낮을 수록 그 자체가 가진 정보의 양은 커진다는 것이다.
따라서 이를 특이성(Specificity)라고 부른다.

그렇다면 이와 반대되는 일반성(Generality)을 구할 수 있을 것이다.
특이성과는 반대로 발생 확률이 높을 수록 큰값을 갖는다는 것이다.
이를 위해 자기 정보량 함수로부터 [0, 1] 구간에서 반대가 되는 함수를 구하였다.


근데 문제는 발생 확률이 1이 될 경우 단순히 -log 함수를 [0, 1] 구간에서 뒤집었기 때문에 무한대 값으로 계산이 되지 않는다.

따라서 일반성을 계산하는 효과적인 방법은 아닌 것 같다.

일반성을 구할 수 있는 좋은 방법이 있다면 누가 좀 알려주세요.

'Semantic Search' 카테고리의 다른 글

특이성(Specificity)과 일반성(Generality)  (0) 2009.11.24
네이트의 시맨틱 검색  (0) 2009.10.07

Tag : Generality, Information Theory, Self-Information, Specificity, 일반성, 자기정보량, 정보이론, 특이성

네이트의 시맨틱 검색

Posted 2009.10.07 10:13 by 하은빠 SemanticWeb


내 연구 분야가 Semantic Search인 만큼 시맨틱 검색을 시도하고 있는 사이트들을 자주 찾아보곤 한다.
물론 여기서의 시맨틱 검색은.. 알겠지만... 잠재의미 색인(Latent Semantic Indexing)과 다르다.. (다들 아는 얘긴가? ㅡㅡ;;)

국내에서도 여러 차례.. 아니 몇 차례 시맨틱 검색에 대한 시도가 있었던 것이 사실이다.
온톨로지 기반이든 아니든 간에..
솔직히 내가 Semantic Search를 하고 있지만 현재의 웹을 온톨로지화하여 시맨틱 검색을 적용한다는 것은 아직은 무리일 것이라 생각한다.
이러한 상황에서 온톨로지 기반은 아니지만 온톨로지와 같은 개념으로 접근한 시맨틱 검색이 현재의 주류를 이루고 있는 상태인 것이다.
물론 이것이 지금의 상황에 더 적합하기 때문일 것이다..
이것에 대한 논의를 하자면 길어지니까 여기까지..

어쨋든.. 오늘 우연히 싸이월드에서 9월30일에 공개한 네이트 시맨틱 검색이란 것을 보게 되었다.
이거.. 쫌 흥미있더라..

어떤 검색 키워드에 대해 주제별 분류를 한 후에 주제에 따라 검색 결과를 제공해 주는 방식을 취하고 있다.
온톨로지와 매핑시켜 본다면 검색어를 입력할 경우 검색어와 연관된 인스턴스들을 클래스 분류에 따라 보여주는 방식이다.
온톨로지를 쓰지는 않지만 온톨로지 검색과 아주 유사한 형태로 볼 수 있을 것 같다.

보다 자세한 정보는..
http://natesearch.egloos.com/10158929/


한가지 궁금한 점은 어떻게 주제별 분류를 했는지 모르겠다.
자동으로 이루어 진다고 하는데(당연히 자동이겠지만..) 쫌 의문이다.
몇 가지 검색을 해본 결과 분류의 영역이 검색어마다 다 다르다.
이 얘기는 관계나 클래스가 정의되어 있지 않다는 의미로 받아들일 수도 있을 것 같은데..
어떻게 분류가 되는지 궁금할 따름이다.
조금 더 조사할 필요가 있다.. @.@a

어쨋든 아직 공개한 지가 며칠 되지 않아(물론 베타 기간까지 하면 쫌 되겠지만) 어느 정도의 효과를 거둘지는 미지수다.
하지만 이러한 시도들이 시맨틱 검색에 있어서의 발판을 마련해 주길 바랄 뿐이다.
그래야 나도 먹고 사니까.. ㅡㅡ;;

그리고 단언컨데 향후 검색의 트랜드는 분명 시맨틱 웹에서의 시맨틱 검색일 것이기 때문에 네이트의 시맨틱 검색이 선도적인 역할을 할 수 있으리라 생각된다.

'Semantic Search' 카테고리의 다른 글

특이성(Specificity)과 일반성(Generality)  (0) 2009.11.24
네이트의 시맨틱 검색  (0) 2009.10.07

Tag : semantic search, 네이트, 시맨틱 검색

티스토리 툴바