'hakia'에 해당되는 글 3건

  1. 2009/07/15 hakia vs. Google 결과는? (2)
  2. 2008/03/20 Semantic Searchengine의 시대가 오는가?
  3. 2007/06/18 [검색엔진]Hakia (1)

hakia vs. Google 결과는?

정보검색 2009/07/15 10:02 Posted by 마루날
hakia

Semantic search를 한다고 하는 업체가 몇개 있는데, 작년에 MS에 인수된 PowersetHakia가 대표적이다. Semantic search라고 하면, 사용자의 질문의 의도와 뜻을 이해하여 검색결과를 제공하는 검색이라고 할 수 있다.

2007/06/18 - [검색엔진]Hakia

하지만, 사용자의 질문의 의도와 뜻을 이해하기보다는 질문과 의도를 문장으로 받아서 처리하는 수준이지, 의도와 뜻을 이해하지는 못하고 있다. 개인적으로 의도와 뜻을 파악하는 것은 최소한 추론이라는 과정이 있어야 그나마 뜻과 의도를 이해한다고 이야기할 수 있는 것 아닌가 생각된다.

어찌되었든 Powerset이나 hakia 모두 구글에 대한 대항마라기 보다는 구글이 제대로 하지 못하는 문장단위의 질의를 처리하여 검색하는 '자연어 검색'분야의 선두주자라고 할 수 있다.


hakia vs. Google

그런데 재미있게도 Hakia는 자신들과 구글( + 야후, MS)을 비교해서 자신들이 훨씬 낫다는 서비스를 제공하고 있다. (hakia와 비교 말고도 구글, 야후, MS가 간접비교를 할 수 있으니 테스트해보시기를)


접속을 하면 자동으로 'penguins'라는 질의어가 입력되고 위의 이미지처럼 검색결과가 비교가 된다. 확실히 hakia의 검색결과가 구글에 비해서 연관도(relevancy)가 높아 보인다.

몇가지를 더 테스트해보면 알겠지만, 내가 입력한 질의어와 연관있는 결과가 나와서 정확하게 보이는데, 결국 자연어 검색이라는 것을 통해서 단순히 문서에서 질의어가 많이 나온 순서대로 결과를 보여주는 것이 아니라 구문 관계나 의미 관계까지 고려를 해서 결과가 나오기에 훨씬 더 정확해 보이는 것 같다.

자연어 검색

그럼 다시 자연어 검색이 대세가 될까? 위에서도 잠깐 언급했었지만, hakia나 Powerset 모두 구글의 대항마라기 보다는 구글의 부족한 부분을 파고드는 니치 마켓(niche market) 검색이라고 할 수 있겠다.

특히나 우리나라에서는 자연어 검색이라는 것은 한물 지나간 기술로 취급받고 있고, 실제로 대학에서 자연어 검색을 연구하는 곳도 많이 줄어들고 자연어 검색을 전공하는 대학원생도 줄어들고 있다.

자연어 기술과 시장 관련해서 모란소프트의 조영환 대표님이 좋은 말씀을 해주셨는데, 결국 돈이 되지 않는 기술이라고 시장에서 생각하고 있는 것이 현실이기는 한데, 자연어 기술이라는 것은 대단히 중요한 원천기술인데 더 이상 연구개발할만한 새로운 주제가 없어서 그런지 몰라도 투자도 제대로 이루어지지 않고 관련 회사도 많이 없어지는 것이 안타까울 따름이다.

현재 대부분의  자연어처리 기술 관련 인력은 주요 포탈에 흡수되어 있지만 이렇다할 만한 성과를 보여주지 못하고 있는 것도 현실이다.

아무튼 우리나라도 다시 hakia와 같은 새로운 도전을 해 줄 수 있는 검색엔진이 나타나기를 빌어본다.


 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독하세요~



TRACKBACK :: http://ithelink.net/trackback/532 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon namsangboy  수정/삭제  댓글쓰기

    국내에서도 자연어 검색중에서 의견 검색 이라는 분야에 있어서 http://buzzni.com 에서 조용히 서비스를 하고 있습니다. 세계적으로 보았을때에 의견 검색 분야가 앞으로 활발히 연구 개발 될것으로 보이는데, 이 분야에 있어서 세계 최고 업체가 되기 위해 노력중입니다. ^^

    2009/07/16 09:19
    • BlogIcon 마루날  수정/삭제

      아..네 저도 유심히 지켜보고 있습니다. ^^
      혹시 관계자 분이신가봐요?
      잘 되시기를 빕니다.

      2009/07/16 09:35

Semantic Searchengine의 시대가 오는가?

정보검색 2008/03/20 09:05 Posted by 마루날
국내 semantic 전문업체인 시맨틱스에 의해 개발된 Qrobo[각주:1]가 CeBIT 2008에서 공개되었다.

그리고 시맨틱스의 글로벌 경쟁업체라고 하는 Hakia에서는 처음으로 자신의 솔루션 중 일부를 라이센스를 통해서 RiverGlass라는 웹 정보 분석솔루션 업체에 공급하였다.

새로운 서비스를 론칭하는 것도 의미 있는 일이지만, 비즈니스가 일어났다는 것이 훨씬 더 중요한 것 같다.

아무튼 이제 본격적으로 Semantic Search의 시대로 접어든 것인가? 하는 의문이 드는데, 이번 비즈니스에 대해서 미국에서도 이슈가 되었던 것 같다..

사용자 삽입 이미지사용자 삽입 이미지

구글의 경쟁상대인지? 아니면 완전히 새로운 패러다임의 검색엔진인지? 등등의 많은 얘기들이 오가고 있다고 한다. 구글의 독주가 몇 년째 계속되다 보니 경쟁자의 출현에 다들 신경을 곤두세우고 있는 것 같다.

Hakia의 CEO인 Riza C Berkan 박사가 Hakia 블로그에 직접 올린 글중에서 일부이다.

However, we need to make one small correction to misunderstandings that appear here and there: Are we a Google killer? Are we competing with Google-esque search engines? Are we a specific application search engine?

hakia is a general purpose “semantic” search engine whereas Google-esque are general purpose “statistical” search engines. As a semantic search engine, hakia is being developed to fulfill different needs of a different type of on-line searchers. These differences refer to potential benefits (yet not fully realized) within the boundaries of “general purpose” utility. If it sounds confusing I would’t blame you.

Let me throw an example. If the user enters the query “benefits of aspirin”, Google-esque search engines will rank results by popular opinion (via link referrals). Popular opions are formed by millions of ordinary people rather than by a small group of the designers of the drug at Bayer. Therefore, there is no alternative view available on the Web today, alternative being a different criteria, different perspective, perhaps the perspective of credibility, freshness, applicability, feasibility, depth, and so forth.

If you were going to take aspirin and wondering about the benefits of it, versus you may have a weak heart, versus you might be a genetics researcher. Again, depending on who you are, the perspective of ranking search results can vary. Using Google-esque search engines, we are always seeing one fixed perspective. hakia is about to enrich this experience.

For the reasons I am trying to explain, hakia’s competitive position is undefined, and hakia’s promise is not built on competing for the same turf with others. Note that other semantic search start-ups are saying similar things, thus there is an independently formed concensus about it: Semantic technologies will bring out something new about the Web that is hard to place in any competitive scale.

[원문 : http://blog.hakia.com/?p=258 ]


Semantic Search가 이번 시맨틱스의 Qrobo 공개에서도 주장한 바이지만, 핵심 중 하나인 온톨로지 등을 구성할 때 완전 자동화를 한다는 것은 거의 불가능한 일이다.[각주:2]

그래서, 구글과 같은 Statistical 검색처럼 도메인이 관계없이 비슷한 수준의 Scalability를 보여주는 것은 거의 불가능하기에 특정 도메인에 한정되게 제공하는 식으로 포지셔닝을 가져가게 된다.

그런데, 이번에 시맨틱스와 Hakia가 서로 경쟁자이면서도 완전히 다른 모습을 보여주고 있어서 흥미롭다.

Hakia는 자신의 솔루션을 미국에서 유행하는 API형태로 제공하면서 모든 웹의 인터랙션의 인프라가 되겠다는 생각으로 접근하고 있고(검색이 아닌 그리고 나쁘지 않아 보인다.) 시맨틱스는 정공법으로 Semantic Search로 기존 검색 패러다임을 바꾸려고 하고 있다.

앞으로 검색의 관심사는 검색 대상인 '데이터'에서 검색 사용자인 '사람'으로 옮겨와야 하지 않을까? user의 Intention, Needs에 대한 답을 해주어야 하는 것 아닐까?

과연 어떤 길이 정답일까?
비즈니스에서 정답이란 것은 존재하지 않지만



  1. 근데 왜 불여우버전은 없나? 인터넷 익스플로러만 지원하는게 이상하다 -_- [본문으로]
  2. 그런 면에서 시맨틱스의 완전자동화는 놀랍고 혁신적인 기술이라고 할 수 있는데, 과연 완전자동화인지 궁금하다. [본문으로]

TRACKBACK :: http://ithelink.net/trackback/241 관련글 쓰기

  1. [큐로보] 온톨리지를 기반으로 한 시맨틱웹 검색

    Tracked from 쩐의시대  삭제

    시맨틱스에서 현재 개발/테스트 중인 Qrobo... 자사 홈페이지에 소개되어 있는 내용을 정리하자면 다음과 같다. 디렉토리 검색엔진은 예전부터 사용해 온 도서 분류학을 모태로 하여 각 홈페이지의 성격을 정하여 사용자의 접근을 좁혀 나가 결국에는 자신이 원하고자 하는 자료를 획득할 수 있었으나, 이젠 하나의 사이트가 하나의 성격을 가지는 것이 아니라, 여러가지 성격을 내포하고 있어 더 이상 구조화된 분류 체계로 표현하기 힘들다. 또한, 200억 페이지..

    2008/03/20 10:11

댓글을 달아 주세요

[검색엔진]Hakia

정보검색 2007/06/18 21:00 Posted by 마루날
hakia

URL : http://www.hakia.com/
  • search for meaning
  • 자연어처리 기반의 검색 startup
  • 현재 베타 버전을 시범적으로 운영 중이며 올해 상용 서비스를 선보일 계획
  • 온톨로지, 대화 기능 등의 이야기를 하고 있는 것을 보면, 자연어처리 기술의 원천기술을 가지고 있으며, 형태소/구문/의미분석 기술을 가지고 있는 것으로 보여짐
사용자 삽입 이미지
[초기화면]

사용자 삽입 이미지
[검색결과]

질의어에서 '이순신이 누구인가'에 대한 의미를 가지고, 검색 결과에서 '이순신과 술부'로 이루어진 결과를 하이라이트 해서 보여주고 있음

사용자의 질의에 대한 '키워드'기반 검색에서 더 나아가 사용자의 질의의 '주술적[각주:1] 의미관계'를 추출하고, 검색 대상 데이터에서 '주술적 의미관계'를 추출하여 의미간 연관도 순으로 검색결과를 제공하는 것으로 보여짐



  1. 주부와 술부 [본문으로]

TRACKBACK :: http://ithelink.net/trackback/94 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon 마루날  수정/삭제  댓글쓰기

    구글과의 경쟁이 기대되는 검색엔진 startup

    2007/06/18 21:01

BLOG main image
마루날의 雜學辭典(잡학사전)
소셜미디어, 웹 오피스, 클라우드 컴퓨팅, 소셜 서치, 모바일 에 관심 있음. 분석, 화내기 잘해요. 책읽기, 등산 좋아해요. 잠실, 올림픽공원 자주 가요. 모든 비린내 싫어해요. YO~
by 마루날

카테고리

분류 전체보기 (440)
e-Business (104)
Social Web (57)
eBook | office | Cloud (2)
Management (23)
독서일기 (127)
Startup (1)
모바일 (6)
정보검색 (101)
Etc. (19)

당신을 위해 준비한 모임

마루날's Blog is powered by Textcube. Designed by Qwer999. Supported by Tatter & Media.