'검색엔진'에 해당되는 글 68건

  1. 2009/11/24 실시간 검색은 대화 검색의 특성 중 하나이다. (3)
  2. 2009/10/06 인기검색어의 유혹 (2)
  3. 2009/09/23 검색의 미래는 정보를 꿰는 역량에 달려있다. FirstRain
  4. 2009/09/10 VIZOOO를 아세요? (2)
  5. 2009/07/15 hakia vs. Google 결과는? (2)
  6. 2009/06/02 MS Bing은 왜 이렇게 오픈을 한걸까? (6)
  7. 2009/04/06 문서검색 사이냅과 비주얼검색 루키
  8. 2009/04/01 지미 웨일스, 위키아 서치 포기하다
  9. 2009/03/09 새로운 네이트 검색을 사용해보니 (2)
  10. 2009/02/26 포털의 승부처는 블로그 검색이다.
  11. 2009/02/16 네이트의 도전 (2)
  12. 2009/01/22 검색의 Collective Filtering + SN = 구글 서치위키 (2)
  13. 2009/01/16 2009년 검색서비스의 미래
  14. 2008/12/09 Conversational Search, artiklz
  15. 2008/11/05 솔트룩스의 새로운 서비스, 아울림
  16. 2008/10/29 패션전문 쇼핑검색, 고르다~ (2)
  17. 2008/10/28 국내 검색서비스의 Niche는 포털? (2)
  18. 2008/10/27 검색서비스 스타트업이 고려해야 하는 것
  19. 2008/10/17 한국의 대안 검색엔진들 (6)
  20. 2008/10/06 메타데이터 검색 (2)
  21. 2008/09/29 동영상검색서비스, Enswer.net
  22. 2008/09/09 큐로보 아이폰 버전 사용해보니..
  23. 2008/08/26 구글의 모바일 검색 도전, 성공할 수 있을까? (4)
  24. 2008/08/19 편리한 블로그 검색창 - Live Search! (2)
  25. 2008/08/12 검색엔진에 대한 아내의 바램?
  26. 2008/07/31 야후 블로그 검색 미워요~ T.T (12)
  27. 2008/07/23 검색되지 않는 것은 존재하지 않는 것이다. (4)
  28. 2008/07/22 evri : Search less, understand more
  29. 2008/07/16 블로그 뉴스 이미지 UCC 중심의 트랜드 검색, DABOT (2)
  30. 2008/06/27 MS 파워셋 인수
다이나믹 색인

검색엔진 기술 중에서 지금은 보편화된(?) 기술 중 하나가 다이내믹 색인입니다. 동적 색인이라고도 하는데요. 간단하게 설명을 드리면 다음과 같습니다.

색인이라고 하는 것은 검색 대상이 되는 정보를 가져와서 색인어(주로 명사)별로 출현빈도 등의 기준에 따라서 해당 색인어를 가지고 있는 문서의 정보를 나열해서 미리 정의해 놓은 데이터구조로 쌓는 것을 색인이라고 합니다. 색인을 만들어 놓아야 사용자들이 검색엔진에 검색을 하면 입력된 검색 질의어에 해당하는 색인의 정보를 가져와서 검색결과로 화면에 뿌려지게 됩니다.

bookshelf spectrum, revisited
bookshelf spectrum, revisited by chotda 저작자 표시비영리변경 금지

그래서 보통 색인은 정적(static)으로 이루어지는데, 검색대상 정보를 모아서 한번에 색인을 하게 됩니다. 검색대상 정보가 많지 않거나 자주 업데이트가 되지 않는 경우라면 괜찮지만, 검색대상 정보가 많아지거나 자주 업데이트가 되는 경우에는 동적으로 색인을 하게 됩니다.

검색하러 왔는데, 최근 데이터가 없으면 사용자의 외면을 받기에 대부분의 검색엔진들은 바로 바로 수집된 데이터에 대해서 색인을 해서 검색결과에 반영하는 과정 – 이를 다이내믹 색인이라고 – 을 하게 됩니다.


실시간 검색? 근실시간 검색!

요즘 많이 들리는 실시간 검색은 또 다이내믹 색인과 좀 다릅니다. 실시간 검색의 뉘앙스는 마치 새로운 정보가 올라오면 바로 검색결과에서 확인할 수 있는 것처럼 느껴지지만, 위에서 설명한 것처럼 색인이라는 시간이 소요되기에 실시간에 가까운 검색입니다.(뭐 거의 실시간에 가깝다는 의미로 근실시간 검색이라는 말을 사용하는 경우도 있더군요)

실시간 검색이 존재하지 않느냐 그런 것은 아닙니다. 일반적인 검색엔진이 아니라 DBMS에서는 실시간 검색이 가능합니다. DB에 데이터가 추가되면 바로 검색에 반영이 되어 나오게 되는데, 일반적인 검색엔진에서는 사전적인 의미 그대로의 실시간 검색은 절대로 불가능합니다. 아무리 작은 데이터여도 데이터가 생성된 시점으로부터 검색엔진이 색인 하기까지는 동시에 이루어질 수 없고 시간차가 당연히 발생하게 됩니다.

그래서 실시간에 가까운 검색은 존재하여도 실시간 검색은 존재하지 않는다고 보시면 됩니다. 다만, 트위터와 같이 속보성이 중요한 컨텐츠의 경우에 있어서는 트위터에 새로운 트윗이나 리트윗이 올라온 시점과 검색엔진의 색인에 반영되는 시간차를 최소화할 수 있어야 합니다. 한마디로 근실시간 검색이 가능하도록 해야 합니다.

위에서 많이 보편화되었다고 말씀 드렸지만, 실제로 다이나믹 색인은 기술적으로나 운영을 위한 인프라 측면에서 고급 검색기술에 속하고 인프라도 많이 소요됩니다. 트위터와 같이 속보성이 중요한 데이터를 근실시간 검색을 하자면 검색엔진이 빠른 다이나믹 색인속도를 낼 수 있어야 하고 그에 따른 인프라가 필수적으로 지원되어야 합니다.

그래서 트위터 검색결과가 별로라고 많이들 이야기하는 이유도 서비스 운영주체로서 모든 정보를 가지고 있음에도 트위터 특성을 살린 검색이 안되기에 구글이나 MS와의 제휴에 나서는 것인지도 모릅니다.


대화검색

트위터 검색이 주목을 받으면서 트위터 검색 = 실시간 검색이라는 이야기를 하는 분들이 계신데요. 제가 보기에는 실시간 검색이라는 특징(정확하게는 근실시간 검색)을 가지고 있는 대화 검색이라고 부를 수 있을 것 같습니다.

트위터를 검색한다고 하면 특정 트윗 하나만 근실시간으로 검색하면 되는 것이 아니라 트윗과 해당 트윗에 대한 리플라이와 리트윗 등을 함께 검색할 수 있어야 하는데, 이를 위해서는 대화를 추적해야 하고 이는 결국 대화뭉치를 검색할 수 있는 검색이 되어야 합니다.

Not getting Involved
Not getting Involved by TarikB 저작자 표시비영리

즉, 검색대상 데이터가 트위터의 트윗과 같은 속보성을 띠는 대화뭉치를 대상으로 하는 검색을 실시간 검색으로 부르기 보다는 대화 검색이라고 부르는 것이 맞아 보입니다. (소셜검색이라고 하는 분도 있는데, 소셜네트워크의 컨텐츠를 검색하는 것이 소셜검색이 아닙니다. 관련해서는 별도로 포스팅을 하겠습니다.)

아무튼 최근 검색엔진과 관련해서는 의미를 이야기하거나 실시간을 이야기 하는데, 결국 소셜미디어와 소셜네트워크의 발전으로 인해서 새로운 형태의 컨텐츠들이 생산되고 있기에 대화검색과 같이 이를 제대로 검색할 수 있는 새로운 시도가 계속되어야 할 듯 합니다.


 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독하세요~
(아래 손가락을 눌러주셔도 PC에 아무런 이상이 없습니다.)

저작자 표시 비영리 변경 금지

TRACKBACK :: http://ithelink.net/trackback/621 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon 라이브K  수정/삭제  댓글쓰기

    국내최초 실시간검색 - 라이브K (http://www.livek.com)

    2010/01/28 15:48
  2. BlogIcon 라이브K  수정/삭제  댓글쓰기

    멋진 글 잘보았습니다. 라이브K 공식블로그(http://blog.livek.com)에서도 많은 이야기를 나누어요...

    2010/01/28 15:58

인기검색어의 유혹

정보검색 2009/10/06 18:37 Posted by 마루날
정보 수용의 한계

검색엔진에서 가장 유용한 통계 중 하나는 질의어 로그입니다. 말 그대로 검색어 입력 창에 사용자가 직접 입력한 질의어들이 시간순서 별로 로그에 남게 되는데, 이 데이터를 분석해서 검색엔진 운영차원에서 어떤 컨텐츠를 보완해야 할지, 검색결과의 품질은 어떠한지 등을 검토합니다.

roads and railways series #4
roads and railways series #4 by woodleywonderworks 저작자 표시

인터넷 공간에 생산되어 유통되는 컨텐츠의 량이 폭발적으로 늘어나서 한 사람이 가지고 있는 인지능력 및 시간의 제약으로 소화해 낼 수 있는 정보의 량이 한계가 있기 때문에 검색엔진을 통해서 자신이 원하는 정보나 컨텐츠를 찾아서 소비하게 되고, 사용자들이 검색엔진에서 사용한 질의어가 로그로 남게 되면서 새로운 상황이 전개됩니다.

이 질의어 로그가 인기검색어라는 이름으로 가공[각주:1]되어서 공개되면서 소비자이자 사용자인 일반 대중의 관심을 알 수 있게 되었습니다. 인기검색어가 순식간에 주목을 받을 수 있었던 것은 사용자들의 관심사가 무엇인지 아는 것이 기업의 마케팅과 판매의 핵심 이슈인데, 사용자들이 직접 자신의 관심사를 들어내어 표현한 검색어만큼 신뢰할 수 있고 확실한 자료는 없기 때문입니다.


자신의 니즈 표출

아무리 사람들의 자기 표현이 적극적이고 자유로운 시대가 되었다고 해도 정말 알 수 없는 것이 사람들의 관심사이고 그들의 니즈이고 그들의 욕구입니다. 사실 사람이 자신의 욕구를 명확하게 니즈로 드러내는 것 자체가 불가능한 일이기 때문에 자신의 욕구를 니즈로 구체화해서 ‘키워드’라는 실체로 드러낸다는 것 자체가 너무나 놀라운 현상이기도 합니다.

(제가 생각하는 니즈와 욕구의 차이는 목이 말라서 뭘 좀 마시고 싶다는 것은 ‘욕구’이고 그래서 콜라를 마시고 싶다고 하는 것은 ‘니즈’라고 생각합니다.)

bookshelf spectrum, revisited
bookshelf spectrum, revisited by chotda 저작자 표시비영리변경 금지


인기검색어의 문제점

우선 인기검색어의 문제점은 데이터의 표현이 키워드라는 점입니다. 위에서 잠깐 설명을 드렸지만, 자신의 니즈를 키워드로 명확하게 드러낸 것이 아니라, 자신의 욕구가 생겨나고 니즈가 불확실한 상황에서 적당한 키워드를 이리 저리 넣게 되면서 키워드만으로 알 수 있는 정보가 한계가 있고 또한 키워드 자체가 중의성을 가지고 있는 상태라면 해석의 문제가 불거지게 됩니다. (물론 인기검색어를 깊이 있게 해석하지 않으면 됩니다만)

또 하나는 가공의 문제입니다. 모든 포털 업체들이 일체 인위적인 가공은 없다고 하지만, 실제로 공개되는 인기검색어가 실제로 가장 많이 입력된 검색어는 아니고 또한 상시적으로 관리하는 블랙 키워드류의 관리를 통해서 가공이 되기에 언제나 공급자의 의지가 반영될 수 있습니다.

이 놈의 인기검색어의 또 다른 문제점은 지금의 포털이 있게된 동력이기도 합니다만, 자신의 욕구와 니즈로 명확하지 않은 상태에서 이러 저러한 키워드를 계속 질의어로 입력하다가 어느 순간 추천검색어나 인기검색어를 통해서 의도하지는 않았다고 주장하는 특정한 컨텐츠로 쏠릴 수 있는 지점이 될 수 있습니다.
아마도 가장 많이 경험한 일이겠지만, 검색엔진에 뭔가를 찾으러 갔다가 실시간 인기검색어에 올라오는 특정 인기검색어를 누르다가 웹서핑을 하고 있는 자신을 발견하는 경우가 많습니다.


그렇다면

인기검색어의 태동은 순수한 의도였겠지만, 결국 인기검색어 순위는 피리부는 아저씨의 피리소리 같이 양날의 검[각주:2]이 된 것이 사실입니다. 어떤 쪽으로든지 포털 업체에서는 손해 볼 일은 없지만, 사용자 입장에서는 가공이라는 측면에서든 인기검색어 조작이라는 측면에서든 언제나 왜곡된 정보에 노출될 수 있는 상황이라는 겁니다.

단순히 검색엔진이 정보를 찾아주는 도구에서 특정한 컨텐츠를 몰고 갈 수 있는 피리가 되면서 이런 문제를 안고 가게 되었는데요. 이런 왜곡이 내/외부적으로 가능한 상황에서 어떤 해결책을 고려해야 할까요?

결국 사용자의 관심사가 무엇인지를 알고 싶다는 점인 것 같습니다. 사용자의 관심사가 무엇이고 어떤 이야기를 하는지를 알아야 하는데, 이를 위해서 제일 좋은 것은 인터넷을 꾸준히 모니터링하는 일이겠죠?

인기검색어라는 키워드가 주는 한계를 넘어서 사용자들이 이야기하고 있는 스토리에 관심을 가져야 하는 시점이 된 것 같습니다.



 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독하세요~
(아래 손가락을 눌러주셔도 PC에 아무런 이상이 없습니다.)

  1. 가공이 될 수 밖에 없는 것이, 실제로 질의어 로그를 보면 스팸성이나 성인용 질의어 등 걸러져야 하는 질의어가 상당수 포함이 되기 때문에 1차적인 필터링이 필요합니다. [본문으로]
  2. 사용자들의 관심사를 알려주는 순기능과 함께 언제라도 특정한 이슈로 몰아갈 수 있는 역기능이 존재합니다. [본문으로]
저작자 표시 비영리 변경 금지

TRACKBACK :: http://ithelink.net/trackback/605 관련글 쓰기

  1. 태터앤미디어의

    Tracked from tattermedia's me2DAY  삭제

    클릭하는 순간 시간을 내다버리게 되는, 인기검색어의 문제점.

    2009/10/06 23:33
  2. 정직해서 속이기 쉬운 기계

    Tracked from 링블로그-그만의 아이디어  삭제

    얼마 전 화제가 되었던 검색어 순위 조작 이야기는 아시죠? 특정 IP에서 동일한 검색어가 집중적으로 반복될 경우 이를 1로 처리하지만 한꺼번에 여러대의 PC에서 검색어가 반복될 경우엔 이를 걸러내기가 거의 불가능한 시스템을 악용한 것이다.반복되는 검색어 순위 조작[임원기의 인터넷 人사이드]오늘 오전에 올블로그에 접속해보니 아래 영역에 있는 자기 자랑하기 영역이 이렇게 되어 있군요.기본적으로 올블로그의 [자랑하기] 코너는 자발적으로 자신의 글이나 자...

    2009/10/07 00:19
  3. [본문스크랩] 검색 조작은 범죄 행위입니다

    Tracked from 숲속얘기의 조용한 카페  삭제

    이번 사건 역시 안티 네이버 진영측에서는 역시 네이버~ 라고는 말하지만, 개인 PC 보안의심각성도, 그리고 그것을 근절하기 위한 노력을 하는 사업자도 눈에 들어오지 않는듯. 실시간 검색어가 아닌, 실시간 급상승 검색어에 대한 개념은 아직도 유저들은 이해를 못하고 있는 듯 합니다. 마치 그냥 재밌는 게임정도나, 여론의 순위정도로만 여기기 때문에 "이명박

    2009/10/12 10:17

댓글을 달아 주세요

  1. BlogIcon 파파스멀프  수정/삭제  댓글쓰기

    그래서 결국은 누군가의 개입의 여지가 없는 순수한 버즈이 측정이 중요한 요소로 부각되겠죠.
    객관적이고 좋은 데이터로 좋은 서비스 만들어 주세요.

    2009/10/07 14:13

FirstRain 아세요? 자주 가는 블로그에 올라온 포스트를 통해서 알게 된 업체 입니다.



요즘처럼 한 사람이 인지하고 처리할 수 있는 한계를 넘어선 정보의 홍수시대에는 검색엔진이 정보를 잘 찾아주는것은 기본이고 정보를 잘 정리해주어야 합니다. 말 그대로 구슬이 서말이어도 꿰어야 보석인 것처럼 넘쳐나는 정보를 잘 정리해서 제공할 수 있는 역량이 매우 중요합니다.

FirstRain은 자신들의 솔루션을 검색엔진이라고 부르지 않고 Research Engine이라고 부릅니다.

[출처 : http://www.firstrain.com/Platform.php]


위의 그림을 보면 FirstRain의 Research Engine은 정보를 찾아서 분류한뒤 비즈니스와 매니지먼트에 필요한 정보를 추출합니다.

FirstRain의 Research Engine을 보면서 눈에 띄는 부분은 Categorize 입니다.

이 부분이 재미있는데요. 위의 링크한 포스트에서도 나오지만, 음악이나 영화 검색과 같이 해당 컨텐츠가 가지고 있는 특성을(예를 들어서 음악의 경우 제목, 가수, 작사, 작곡 등으로 구성된 컨텐츠) 반영해서 검색을 하면 검색결과에서 컨텐츠의 특성을 반영한 형태로 정리된 결과를 제공하면 훨씬 편리하고 직관적인 검색이 가능합니다.

마찬가지로 비즈니스와 관련된 검색을 하는 경우에 있어서도 비즈니스 관련 컨텐츠로 부터 사용자가 원하는 정보를 개별적으로 추출하여 검색에 반영한다면 훨씬 더 정확한 결과를 얻을 수 있을 겁니다.

클릭 : 관련 데모 영상

예를 들어서 위의 검색 데모에서도 나오지만, 애플을 검색어를 입력하면서 사용자는 주가, 상품정보, 스티브 잡스 관련 등 애플이라는 회사의 다양한 특성을 반영한 결과를 얻기를 원하는데, 이를 Multi-faceted Categorization을 통해서 제공합니다.

사실 이 부분은 새로운 기술이라고 불 수는 없습니다만, 사용자들이 입력하는 검색 질의어는 기본적으로 중의적인 특성이 있고 사용자들이 알고자 하는 정보에 대해서 구체적으로 질의어를 입력하지 못합니다.

따라서 이를 위해서 애매하고 단순하게 입력한 검색어에 대해서 관련된 정보를 다방면으로 정리(분류)하여 제공하는 것은 매우 효과적으로 검색 결과를 좋게 만들 수 있습니다.

여전히 우리나라에서 네이버가 1등을 놓치지 않는 것은 비유를 들자면 목마른 사람들에게 물은 주는데, 소방호스를 사람들에 입에 갖다 대는 것이 아니라 먹기 좋게 예쁜 잔에 담아서 내는 것이기 때문입니다.

결국 검색의 미래의 승자는 정확한 검색결과가 아니라 수 많은 정보를 잘 꿰어서 인사이트를 줄 수 있어야 합니다. 검색결과를 단순하게 제공하는 것이 아니라 정답을 제공하고 정보의 의미를 뽑아 낼 수 있어야 할 것 같습니다.

그런점에서 FirstRain의 Research Engine은 이름 하나는 제대로 지은 것 같습니다.



 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독하세요~
(아래 손가락을 눌러주셔도 PC에 아무런 이상이 없습니다.)

저작자 표시 비영리 변경 금지

TRACKBACK :: http://ithelink.net/trackback/601 관련글 쓰기

댓글을 달아 주세요

VIZOOO를 아세요?

e-Business 2009/09/10 08:30 Posted by 마루날
패션검색 VIZOOO를 아십니까?

저는 이 서비스를 비주얼 서치분야의 모범답안이라는 생각이 들어서 꾸준히 관심을 갖고 지켜보고 있습니다. 우리나라처럼 네이놈의 일방적인 독주체재에서 새로운 시도가 계속되려면 크고 작은 성공사례가 계속 나와야 하는데요. 그런점에서 저는 VIZOOO를 기대주로 보고 있습니다.



보시면 아시겠지만, 현재 VIZOOO는 패션 카테고리에 한정되어 비주얼 서치를 제공하고 있습니다. 다들 짐작하시다시피 패션이야 말로 비주얼이 가장 중요한 요소이기 때문인 것으로 보여집니다.

아직까지 텍스트(text)의 한계를 가지고 있는 검색서비스가 멀티미디어 검색으로 나아가려면 결국 어떤식으로 든지 돈을 벌 수 있어야 하고 돈이 된다는 것이 증명되어야 너도 나도 뛰어들거라고 생각합니다.

작년에는 엔써즈를 비롯한 동영상 검색 서비스들이 눈에 띄더니 올해는 비주얼 서치를 표방한 회사들이 보여지고 있습니다. 인터넷 컨텐츠들이 텍스트에서 이미지나 동영상으로 변화하는 상황에서 보자면 자연스러운 모습입니다.

새롭게 비즈니스를 하는 사람 입장에서 일반 사용자들에게 서비스에 대한 피드백을 받는 것은 쉬운 일이 아닙니다. 비즈니스라는 것이 항상 경쟁상황에 놓여 있기 때문에 기획의도나 사업에 대한 비전을 100% 오픈하지 못합니다.

그러다보니 일반 사용자를 대상으로 서비스에 대한 의견을 듣다 보면 전혀 다른 방향에서 이야기를 하거나 피드백을 주는 경우[각주:1]에는 안하니만 못하다는 내부적인 생각이 들기도 합니다. 그러면에서 이렇게 같이 이야기를 해보자고 하는 것은 그만큼 자신이 있다는 것인가 봅니다. ^^;;



아직 시간도 많이 남았고 자리도 많이 남았으니 한번 신청해 보세요. 새로운 검색 응용 트랜드를 볼 수 있지 않을까 기대가 되구요. 무엇보다 요즘처럼 어려운 시절에 어떻게 돈을 버실 건지 궁금하지 않나요? ^___^

무엇보다 이런 스타트업들이 많은 격려와 충고를 받아서 성공해야 우리나라 인터넷 비즈니스 생태계가 더 성장하고 건강해 질 거라고 생각합니다.

뱀다리) 저는 VIZOOO와 이해관계가 전혀없습니다. 아직은요 ^^



 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독하세요~
(아래 손가락을 눌러주셔도 PC에 아무런 이상이 없습니다.)

  1. 물론, 사업자가 잘못된 기획이나 사업방향을 잡았을 수도 있습니다. 하지만 이미 부어놓은 돈이 있어서 쉽게 방향을 돌리기 어렵기에 .. 이 경우 더더욱 듣고 싶은 것만 듣고 싶고, 보고 싶은 것만 보게 됩니다. [본문으로]
저작자 표시 비영리 변경 금지

TRACKBACK :: http://ithelink.net/trackback/597 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon 파파스멀프  수정/삭제  댓글쓰기

    허거걱... 이렇게 저희 간담회 공지까지 해주시니 몸둘바를 모르겠습니다.
    관심 가지고 지켜봐 주시는 만큼 새로운 시도가 의미있게 살아남아야 할텐데...
    아직도 갈 길이 멉니다. 잘 준비해서 즐겁고 유익한 시간이 되도록 하겠습니다. 감사합니다.

    2009/09/10 12:24

hakia vs. Google 결과는?

정보검색 2009/07/15 10:02 Posted by 마루날
hakia

Semantic search를 한다고 하는 업체가 몇개 있는데, 작년에 MS에 인수된 PowersetHakia가 대표적이다. Semantic search라고 하면, 사용자의 질문의 의도와 뜻을 이해하여 검색결과를 제공하는 검색이라고 할 수 있다.

2007/06/18 - [검색엔진]Hakia

하지만, 사용자의 질문의 의도와 뜻을 이해하기보다는 질문과 의도를 문장으로 받아서 처리하는 수준이지, 의도와 뜻을 이해하지는 못하고 있다. 개인적으로 의도와 뜻을 파악하는 것은 최소한 추론이라는 과정이 있어야 그나마 뜻과 의도를 이해한다고 이야기할 수 있는 것 아닌가 생각된다.

어찌되었든 Powerset이나 hakia 모두 구글에 대한 대항마라기 보다는 구글이 제대로 하지 못하는 문장단위의 질의를 처리하여 검색하는 '자연어 검색'분야의 선두주자라고 할 수 있다.


hakia vs. Google

그런데 재미있게도 Hakia는 자신들과 구글( + 야후, MS)을 비교해서 자신들이 훨씬 낫다는 서비스를 제공하고 있다. (hakia와 비교 말고도 구글, 야후, MS가 간접비교를 할 수 있으니 테스트해보시기를)


접속을 하면 자동으로 'penguins'라는 질의어가 입력되고 위의 이미지처럼 검색결과가 비교가 된다. 확실히 hakia의 검색결과가 구글에 비해서 연관도(relevancy)가 높아 보인다.

몇가지를 더 테스트해보면 알겠지만, 내가 입력한 질의어와 연관있는 결과가 나와서 정확하게 보이는데, 결국 자연어 검색이라는 것을 통해서 단순히 문서에서 질의어가 많이 나온 순서대로 결과를 보여주는 것이 아니라 구문 관계나 의미 관계까지 고려를 해서 결과가 나오기에 훨씬 더 정확해 보이는 것 같다.

자연어 검색

그럼 다시 자연어 검색이 대세가 될까? 위에서도 잠깐 언급했었지만, hakia나 Powerset 모두 구글의 대항마라기 보다는 구글의 부족한 부분을 파고드는 니치 마켓(niche market) 검색이라고 할 수 있겠다.

특히나 우리나라에서는 자연어 검색이라는 것은 한물 지나간 기술로 취급받고 있고, 실제로 대학에서 자연어 검색을 연구하는 곳도 많이 줄어들고 자연어 검색을 전공하는 대학원생도 줄어들고 있다.

자연어 기술과 시장 관련해서 모란소프트의 조영환 대표님이 좋은 말씀을 해주셨는데, 결국 돈이 되지 않는 기술이라고 시장에서 생각하고 있는 것이 현실이기는 한데, 자연어 기술이라는 것은 대단히 중요한 원천기술인데 더 이상 연구개발할만한 새로운 주제가 없어서 그런지 몰라도 투자도 제대로 이루어지지 않고 관련 회사도 많이 없어지는 것이 안타까울 따름이다.

현재 대부분의  자연어처리 기술 관련 인력은 주요 포탈에 흡수되어 있지만 이렇다할 만한 성과를 보여주지 못하고 있는 것도 현실이다.

아무튼 우리나라도 다시 hakia와 같은 새로운 도전을 해 줄 수 있는 검색엔진이 나타나기를 빌어본다.


 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독하세요~



TRACKBACK :: http://ithelink.net/trackback/532 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon namsangboy  수정/삭제  댓글쓰기

    국내에서도 자연어 검색중에서 의견 검색 이라는 분야에 있어서 http://buzzni.com 에서 조용히 서비스를 하고 있습니다. 세계적으로 보았을때에 의견 검색 분야가 앞으로 활발히 연구 개발 될것으로 보이는데, 이 분야에 있어서 세계 최고 업체가 되기 위해 노력중입니다. ^^

    2009/07/16 09:19
    • BlogIcon 마루날  수정/삭제

      아..네 저도 유심히 지켜보고 있습니다. ^^
      혹시 관계자 분이신가봐요?
      잘 되시기를 빕니다.

      2009/07/16 09:35

MS Bing은 왜 이렇게 오픈을 한걸까?

정보검색 2009/06/02 12:51 Posted by 마루날
bing을 오전 내내 사용해 보았다. MS에서 구글과의 정면승부를 위해서 준비한 것이 bing인데 결론부터 이야기하자면 최소한 우리나라 사용자의 기대치에 한참 모자라는 서비스인 것 같다.

요즘 회사에서 사업부원들과 이야기할 때마다 강조하는 것이 세가지 있다. 1. 우리의 고객은 누구인가? (Customer) 2. 목표 고객의 니즈는 무엇인가? (Needs) 3. 목표 고객의 니즈를 채워줄 수 있는 경쟁사와 차별화된 우리가 제공하는 가치는 무엇인가? 이다.

자칭 CNV 프레임워크라고 부르짖고 있는데……

bing에 대해서도 CNV 프레임워크를 적용해보자면,

Customer: 정보를 찾는 사용자
Needs: 자신이 원하는 정보
Value: 음……

우리나라 검색사용자들의 대표적인 니즈는 단순한 검색결과가 아닌 ‘정답’을 원한다. search를 하고 result를 확인하는 것이 아니라, ask하고 answer를 원한다.

네이버를 1등으로 만들어준 지식검색이 뜬 이유가 그리고 최근 블로그가 폭발적인 관심을 받고 있는 것이 바로 한국의 검색엔진들이 원하는 아니, 검색엔진 사용자들이 원하는 answer를 얻기에는 적합한 컨텐츠이기 때문이다.

answer를 원하는 사용자들에게 제공할 수 있는 차별화된 가치는 뭘까? 쉽고 빠르고 정확하게 원하는 답을 찾을 수 있는 결과라고 할 수 있겠다.

트위터 사용법이라고 질의어를 던져보면

MS bing에서의 '트위터 사용법' 검색결과


35000개의 bing의 결과와 359,000개의 구글의 결과는 베타 서비스라고 해도 우선 량의 차이가 10배 이상이 나기 때문에 사용자에게 그만큼 신뢰(모든 정보를 다 찾을 수 있다는)를 주지 못할 것 같다.



구글에서의 '트위터 사용법' 검색결과


첫 페이지의 검색결과를 가지고 검색의 정확도를 실감하는 사용자들이 많은데,(물론 검색결과를 정량적으로 계산해보면 그리 큰 차이가 나지 않을 수 있지만) 대충 살펴봐도 첫 페이지에 트위터 사용법에 대해서 정확하게 나오는 것은 구글인 것 같다.

우리나라 사용자들에게 네이버에 의해 학습된 통합검색 화면은 거의 절대적으로 먹혀 든다. 천하의 구글마저도 흉내 내고 있지 않은가? 최소한 국내에서도 서비스를 보여주려고 한다면 뭔가 차이점이 나는 뭔가를 보여주기를 바라는 것은 나의 너무나 큰 바램일까?

빨강색 부분을 클릭해보면

난데 없는 티스토리 '트위터' 검색 결과가 나온다


중간에 난데 없이 티스토리에서 ‘트위터’를 검색한 링크가 검색결과로 노출이 되는데, 음.. 일종의 메타검색도 하는 건가 싶은데, 난데 없다. 

물론 미국 시장을 겨냥한 서비스이기 때문에 서너 시간의 사용만으로 결론을 내리는 것은 위험한 일이지만, 오픈 전에 동영상으로 보여주었던 새로운 검색 경험이라는 부분은 뭘 말하는 건지 도저히 찾아볼 수가 없다.

아무리 beta라는 딱지를 붙였다고는 하지만, 야후가 맛이 가면서 구글의 대항마로 기대를 모으고 있는 MS가 고작 이정도 밖에 할 수 없나 하는 부분에서 상당히 실망스러운 bing의 첫인상이다.


 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독하세요~

TRACKBACK :: http://ithelink.net/trackback/502 관련글 쓰기

  1. IDG 뉴스레터 | 공개된 ‘빙’, 네티즌들이 반기는 이유는 포르노때문?

    Tracked from Bluesky  삭제

    [MS 빙(Bing)에서 포르노(porn)’라는 검색어를 입력하면, 필터링 되지 않은 검색결과... - 원문보기] '위 운동게임 효과는?'… 전문가가 살펴보니 샌프란시스코 바디 메카닉스 체육관의 조엘 혼스비는 성실하고 공인된 마스터 트레이너다. 그의 도움을 비디오게임으로

    2009/06/04 08:10
  2. MS의 새로운 검색엔진 BING 과 구글의 검색 비교.

    Tracked from Danzy's 色々  삭제

    ms에서 이번에 새롭게 발표한 검색엔진인 http://bing.com 이라는게 있습니다. 자세한 내용은 제가 검색한 이 블로그에서 한번 읽어 보시면 될것입니다. 한마디로 MS가 검색시장에 다시한번 사활을 건 프로젝트 인것도 같군요. 아직 베타 서비스를 붙이고 있긴 하지만 일단 어느정도 만족할만한 수준을 주는지 궁금하여서 평소 이미지 검색을 자주 하는 저에게 필요한 이미지 검색을 통한 구글과의 비교를 진행해 보았습니다. 일단 Bing.com 에서 한국..

    2009/06/08 17:38
  3. MS 빙(Bing)의 도전과 구글, 네이버의 검색 변화

    Tracked from zinicap의 검색엔진 마케팅(SEM)  삭제

    MS 빙(bing) 검색에 관해서는 이미 많은 분들께서 좋은 의견을 올려주고 계시네요. MS에서는 이미 오래 전부터 구글(google) 검색을 잡기 위해 수 많은 노력을 해 왔었고 그 전까지는 사실 검색 분야에서는 큰 관심을 받지 못했던 것이 사실 이기도 합니다. 개인적으로 빙(bing) 검색을 사용해보니 발전 가능성은 보입니다. 물론 아직은 보완해야할 부분도 많이 보입니다. 그 서비스 주체가 MS기 때문에 개인적 기대치가 너무 높은 이유도 있겠지만..

    2009/06/08 18:29

댓글을 달아 주세요

  1. BlogIcon 파파스멀프  수정/삭제  댓글쓰기

    새로운 대항마로는 부족한 모습입니다. 동영상 미리보기 기능도 포르노물 써치의 기능으로 활용되는등 문제가 많다고 하네요. 모든 서비스가 출발 부터 좋지는 않겠지만, 큰 회사가 하는 서비스 치고는 아직 부족한 듯합니다. 아님 우리가 너무 한국적인 정서로 바로보는지도 모르겠지만...

    2009/06/03 12:36
    • BlogIcon 마루날  수정/삭제

      미국에서의 평가는 우호적인것 같더군요.

      원래 MS가 한국시장 그렇게 공들이는 시장도 아니었으니 한국어 버전은 그냥 언어팩정도만 붙어서 나온거로 보이네요

      bing이 오픈되기전에 돌아다니던 동영상은 좀 놀라웠는데, 실제로 사용해보니 아직은 실망입니다.

      2009/06/03 13:27
  2. BlogIcon zinicap  수정/삭제  댓글쓰기

    역시 현장감이 느껴지는 포스팅 입니다^^.

    2009/06/08 18:29
  3. BlogIcon 숲속얘기  수정/삭제  댓글쓰기

    크롤링의 절대량이 아직 부족한게 아닐까 싶습니다.

    2009/06/11 20:01
    • BlogIcon 마루날  수정/삭제

      네.. 그런면도 있는 것 같습니다.
      아쉬운 것은 한글에 대한 색인이나 랭킹 방식에 뭔가
      문제가 있어 보입니다.

      2009/06/12 08:51

문서검색 사이냅과 비주얼검색 루키

정보검색 2009/04/06 13:33 Posted by 마루날
작년말에 우리나라에 있는 대안 검색엔진들에 대해서 포스팅(2008/10/17 - 한국의 대안 검색엔진들)을 한 적이 있었다. 그때 이미 SDOCU에 대해서는 소개한 적이 있었는데, 최근에 정식 오픈을 한 것 같다.

작년에만 해도 SDOCU라는 이름으로 부르던 문서검색 서비스가 사이냅 무료문서검색 서비스로 정식오픈을 하였다.

문서검색에 대해서는 할 이야기가 많지만, 사이냅이 서비스에 대해서는 한가지만 이야기하고 싶다. 사람들이 의외로 문서를 많이 찾는다는 것에서 사용자의 Needs를 정확하게 짚어서 검색해 주는 것은 좋은 것 같다.

다만, 넘쳐나는 유료 문서때문에 정작 활용할 만한 것은 무료문서정도인데, 무료문서를 찾으면서 정확도 순이나 최신순으로 결과를 정렬할 수 있으면 좋겠다.

정말 아쉬운 것은 왜 사람들이 문서를 찾는지에 대해서 사이냅이 줄 수 있는 가치가 무엇인지 고민을 해 보았으면 좋겠다. 문서의 양식을 구하는 것인지, 문서가 담고 있는 정보를 원하는 건지...


또 하나는 이미지로 검색할 수 있다는 이미지 검색쇼핑 LOOKEEY이다.

개인적으로 오픈 하기 전에 핵심 기능이 동작하는 것을 보았는데, 뛰어난 기능을 구현해 놓은 서비스여서 기대가 컸던 것이 사실이다.

그런데.. 조절비율을 어떻게 사용해야 하는지 모르겠고(실제로 조정해봐도 뭐가 바뀌는 건지 알 수 없고), 색상 선택 기능을 사용할 수 없는 것이 아쉽고, 무엇보다 상품정보가 들어 있지도 않은 스포츠용품 카테고리는 상품정보가 들어온 다음에 오픈해도 되지 않았을까 하는 아쉬움이 남는다.

두 서비스 담당자들과 나누고 싶은 이야기가 있어서 옮겨본다.
1) Grab a toe-hold in one area first.

This is easier said than done for fast-growing companies because many times they feel they are excluding some potential market opportunities, but it is critical to stay focused at this point. DeepDyve is focusing on a specific niche in scientific data.  Their brand vision maybe to become the search engine for “serious searchers only.”  Some day they could serve all kinds of scholarly researchers and students, but for now they are aiming to become successful in one niche before moving on.    Furthermore this specialization allows them to “fly under the radar” as not to awaken the giant beast in the market before they are ready.

2) Make sure your processes (and intellectual property) are truly differentiated.

Is your IP easily replicated by a larger competitor?  DeepDyve is focusing on the invisible web, rather than the World-Wide-Web.  They also have a proprietary process for aggregating data, which further differentiates them from other search engines and search services.  Google has a service called “Google Scholar,” but DeepDyve has even differentiated itself from that service.

3) Put your product benefit in the brand name.

When you hear the name DeepDyve Search Engine you have some semblance what they do.  It saves a lot of explaining in your communications.  DeepDyve used to be called Infovell.  Which is more impactful?

DeepDyve has also built credibility by adding Steve Wozniak to their Board of Directors.  Having someone of his stature will help create a buzz in the blogosphere and in the news for some time.  Not to mention his background and experience would be a goldmine to a growing company.

[출처 : How a New Search Engine Entered the Market]

2번째 이야기는 조금 동떨어진 이야기 일 수 있지만, 1번과 3번의 이야기는 한번 생각을 해보면 어떨까 싶다. 시장의 확고한 1등인 네이버로부터 조금이라도 트래픽을 뜯어오고 싶다면, 좀 더 고민하고 완성도를 높여야 하지 않을까 싶다.


 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/480 관련글 쓰기

  1. 비주얼 검색 쇼핑몰

    Tracked from 주하아빠의 잡담  삭제

    지난 3월12일 (주)넥스트서치(www.nextsearch.co.kr) 라는 회사가 3년간 개발해온 차세대 비주얼 검색엔진 <루키>의 기술 발표를 가진다는 얘기를 들었었다. 이날 발표회에서 넥스트서치는 국내 최초로 개발, 상용화 오픈을 앞둔 비주얼 검색쇼핑 사이트 <루키>의 기술 발표 및 고려대 정창덕 교수가 회장으로 있는 한국유비쿼터스 학회와 제휴협약식이 있다고 하였는데, 당일 시간이 안돼서 참석해 보지 못했기에, 실제 어떻게 진행되었는지는 잘 모..

    2009/04/16 00:18

댓글을 달아 주세요

지미 웨일스, 위키아 서치 포기하다

정보검색 2009/04/01 09:31 Posted by 마루날

[출처 : 위키피디아]

집단지성의 대표 서비스인 위키피디아를 설립했던 지미 웨일스(옆에 사진에 자신만만한 아저씨)가 야심차게 도전했던 wikia search를 포기하기로 공식적으로 결정한 것 같다.

관련기사 : Wales giving up on Wikia Search

위키아 서치는 사용자들이 검색결과 랭킹에 참여하게 해서 만드는 소위 user-generated search engine을 지향했었던 서비스였는데, 결국 포기를 선언해 버렸다.

이미 검색서비스들은 대부분 질의어나 사용자들의 click stream 등과 같은 기본적인 정보를 검색결과에 반영하고 있어서 사용자들은 잘 모르지만 어느 정도의 사용자가 참여하는 아니 사용자의 경험이 만들어가는 검색서비스라고 볼 수도 있다.

위키아 서치 검색결과


지미 웨일스가 포기한 이유는 사용자의 수가 너무 미미한 수준이고, 지금처럼 경제상황이 안 좋을때 위키아 서치와 같은 프로젝트를 운영하는 것이 부담이 되었던 것 같다.

여러번 이 블로그를 통해서 이야기 하지만, 검색서비스라는 것은 굉장히 길게 보고 가야하는 프로젝트이다. 어쩌면 네버엔딩 프로젝트 일 수도 있는데, 어느 수준까지 도달하는 것은 매우 쉽지만, 그 이상을 넘어서 검색서비스 마켓 쉐어를 건드릴만큼 되려면 매우 어렵기 때문이다.(돈과 시간의 문제이지)


지미 웨일스가 위키아 서치는 포기하지만 우리나라의 지식검색과 같은 위키아 앤써즈 서비스는 계속해서 운영한다고 한다. 어쩌면 위키아 서치보다는 더 사용자가 참여하기에 직관적이기에 위키아 앤써즈의 폭발적인 성장을 기대하는지도 모르겠다.

이런 외국의 서비스를 볼때마다 네이버 지식in이 경이롭다.


결국 트래픽이 돈이 되는 인터네 서비스 비즈니스에서 위키피디아라는 역사적인 성과를 거둔 지미 웨일스도 경제 위기의 직격탄을 맞은 것 같다.

이 시점에서 궁금한 것은, 구글에서도 서치위키라고 하는 사용자 참여형 검색서비스가 제공되고 있는데, 위키아 서치가 이렇게 포기해버린 마당에 과연 구글이 계속 서치위키를 서비스할 지 궁금하다.

 [정보검색] - 검색의 Collective Filtering + SN = 구글 서치위키

어째거나 지미 웨일스가 새롭고 놀라운 서비스로 우리를 놀라게 해주었던 것처럼 우리나라에도 이렇게 경기가 안좋은 상황에서도 우리를 놀라게 하는 도전과 시도가 계속되었으면 좋겠다.


 마루날의 雜學辭典|잡학사전을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/478 관련글 쓰기

  1. 위키아 서치(Wikia Search)의 핵심 기술로 드러난 너치(Nutch)

    Tracked from 하테나  삭제

    검색 제국 구글에 대항하고자 만들어진 위키아 서치(Wikia Search)가 드디어 모습을 드러냈다. 아직은 테스트 단계이고 한국어와 일본어로는 검색이 안 되고 있는 상황에서 무어라고 거론하기는 이르지만 위키아 서치의 핵심 검색 기술로 너치(Nutch)가 들어 있다는 점은 오랫동안 오픈소스 검색엔진 너치의 성장하는 모습을 지켜본 나라서는 무척 흥분되는 일이 아닐 수 없다. 위키아 서치의 cached를 누르면 나오는 너치 캐쉬 화면 특히 너치는 구글과..

    2009/04/02 10:46

댓글을 달아 주세요

새로운 네이트 검색을 사용해보니

정보검색 2009/03/09 13:46 Posted by 마루날
검색이라는 것이 어느 수준까지는 아주 쉽게 접근하고 구축하고 서비스가 가능하지만, 어느 수준을 넘어서면 그때부터는 넘을 수 없는 사차원의 벽 같은 것이 느껴진다.

보통 서비스나 솔루션이든 제품이든지 간에 소비자나 사용자의 '니즈'를 알고 그 니즈를 채워 줄 수 있는 '가치'가 우리의 서비스, 솔루션 또는 제품에 있다면 소비자나 사용자는 소비하고 사용하게 된다. (물론 여러가지 예외나 고려사항을 무시하고 단순화해서 말하면 그렇다는 것이다.)

이번에 개편된 네이트 검색을 살펴보니, 2009/02/16 - [정보검색] - 네이트의 도전에서 걱정했던 대로 찻잔속의 태풍으로 그칠 것 같아 보인다.

사실 네이트를 볼 때마다 느끼는 것은 '답답함'이다. SKT와의 시너지효과를 내지 못하는 것의 답답함이 그것인데, 반대로 SKT를 볼 때마다 역시, 답답함을 느낀다. 이번 네이트의 개편에서 '네이버와 이름만 비슷한 게 아니라 이제는 화면도 비슷하다'는 소리를 듣고 있지만, 개인적으로 이번에 개편된 네이트의 검색은 '뭔가 포스팅할 거리 조차도 없다'

검색의 질을 떠나서 검색결과에 왜 그렇게 광고가 많은지.. 좀 적당히 해서 원래 내가 찾고자 하는 정보를 찾을 수 있도록 조금만 신경써주면 안될까 하는 생각만 든다.


네이트는 유무선 연동이 가능한 개인화 검색을 가장 잘 할 수 있을 가능성이 높은 회사이다. (솔직하게는 '줘도 못 먹는' 상황이 벌어질 가능성이 그만큼 높아 보이기도 한다)

무선 컨텐츠 활용정보를 통해서 사용자의 Profile, Location, Preference를 엮은 개인화의 중요한 기본 데이터를 모아서 웹 사용자를 위해 활용한다면, 진정한 의미의 개인화 검색은 아니어도, Collective Filtering이 기반이 되는 검색을 통해서 사용자들의 '공감'을 얻어낼 수 있을 텐데...

이리 저리 주워 들은 바에 의하면 제각각 시도 하고 있다니.. 배가 산으로 갈 가능성이 그만큼 높아 보인다.

개인적으로 메타 검색 위젯을 활용해서 구글, 다음, 야후를 주로 사용하고 가끔 네이버와 엠파스를 이용하는데, 이번 개편이후 1주일 넘게 네이트 검색을 사용해보면서 내가 내린 결론은 아마도 네이트와 합쳐진 엠파스 보다는 파란을 더 사용할 것 같다는 느낌이다.


 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~


TRACKBACK :: http://ithelink.net/trackback/469 관련글 쓰기

댓글을 달아 주세요

  1. 흠~  수정/삭제  댓글쓰기

    네이트 검색 개편됐다고 해서 검색했다가 우연히 들릅니다.
    예전 네이트 검색은 없잖아 불편한 점이 있었으나 개편하고 난 후는 확실히 달라진 모습을 보이네요.
    물론 사용자마다 느끼는 차이가 있겠지만,
    늘 검색하는 범위를 설정해주어야했던 (블로그/카페 등) 기존 포털과 달리
    주제별로 빠르게 원하는 정보를 캐치하게 해줄 수 있는 점은 무척 고무적인 것 같습니다.
    인물검색도 꽤 좋아진 듯 하구요.
    (여담이지만 검색만 하다보니 꽤 재밌더라는ㅋㅋ시간가는 줄 모르겠더군요)

    여튼 전 요즘 X이버보다는 네이트 많이 쓰게 되네요
    의외로 편리합니다.

    2010/08/31 14:05
    • BlogIcon 마루날  수정/삭제

      저도 새롭게 바뀐 네이트를 가끔 사용해보는데요.
      솔직히는 얼마나 좋아졌는지 잘 모르겠습니다.

      검색 대상 데이터가 충분히 많아야지 검색기술에 따른
      품질 차이가 느껴지는데요.

      검색해 보면 량에서는 우선 부족함을 느끼거든요. ^^

      2010/08/31 15:04

포털의 승부처는 블로그 검색이다.

정보검색 2009/02/26 11:44 Posted by 마루날
인터넷의 발달로 한 사람이 인지 가능한 정보의 량을 넘어선 정보의 폭주가 시작되면서 사람들은 선별적으로 정보를 얻고 사용한다. 그래서 더 '검색'이 중요한 것이 되어버린 것이다.

'검색'은 뭔가를 찾는 '도구'였지만, 검색을 하는 행위가 사람들의 한정된 자원인 'attention'을 분배하고 활용하는 행위가 되면서, 미디어가 이슈를 제기해서 사회적인 관심을 이끌고 거기에 대한 공감대를 만들어내는 등의 역할을 '검색'이 대신하는 말 그대로 검색이 미디어가 되어버리는 상황이 된 것이다.

인터넷 초기만 해도 주요 웹사이트로 이어지는 허브로서 말그대로 관문역할을 했던 포털이 검색으로 사용자들의 'attetion'을 유통할 수 있게 되면서 포털의 승승장구는 계속되었다.

사용자의 'attention'에 대해서는 김국현님의 책을 꼭 읽어보기 바란다.

웹 2.0 경제학 - 10점
김국현 지음/황금부엉이

사람들이 검색을 하는 이유는 정보를 '찾기'위해서가 아니라 정보를 '알기'위해서이다. 한마디로 '해답'을 원한다는 것이다. 검색엔진은 구조적으로 '해답'을 줄 수 없다. 단지 '해답'이 있을 것 같은 '장소'를 알려줄 뿐이다.

그런데, '해답'이 있을 것 같은 '장소'를 인위적으로 만들면 어떻게 될까?

그 결과가 1등 네이버의 '지식인'이다.

하지만, 지식인류의 서비스가 한계에 봉착한 것은 다름 아닌 신뢰할 수 없는 답변들과 광고성 답변들 때문이다. 사람들 스스로 묻고 답하기를 원했지만 누구나 답변을 달 수 있다는 지점에서 언제나 왜곡과 오답의 가능성이 존재하게 되었다.

그렇다면 왜 '블로그 검색'인가?

1. 블로그는 거대한 컨텐츠 유통단지이다.

작년에 네이버 블로거 간담회에 다녀오면서 느낀거지만,

2008/08/13 - [eBiz] - 네이버 블로거 간담회 후기 : 네이버 제국은 이상무~

네이버 블로그의 여러 기능 중에서 다른 블로그와 가장 큰 차이점은 '퍼가기' 기능이다. 네이버는 (컨텐츠의 저작권에 대한 이야기는 제외하더라도) '퍼가기'를 좋아하는 사용자들을 통해서 거대한 컨텐츠 유통단지를 만들려고 하는 것 같다.

[출처 : 지민아빠의 해처리, http://ypshin.com/2690517]


실제로 네이버 블로그 개설수는 800만개에 달하는데, 이 사용자들 중 많은 수의 사용자가 퍼가기 기능을 많이 사용하는데, '많이 퍼간 자료가 좋은 자료'이다라는 기준에서 보자면, 엄청난 컨텐츠 유통단지가 만들어지게 되고, 자연스럽게 스팸성 컨텐츠가 걸러진다.

즉, 네이버 '지식인'의 한계를 자연스럽게 극복하고 치고 나갈 수 있도록 해주는 것은 네이버 '블로그'가 될 것이다.

2. 블로그는 Long tail 기반의 컨텐츠 생산단지이다.

위에 표에서 아주 유의미한 수치가 있는데, 티스트리 블로그의 방문자수이다. 개설수는 800만 vs 21만이지만, 방문자수는 2500만 vs. 1700만.. 말도 안되는 수치를 티스토리가 보여준다.

티스토리 블로그를 통해서 얼마나 유용하고 사람들이 관심을 가질만한 컨텐츠들이 왕성하게 생성되는지를 보여주고 있는 것이다.

한 사람의 블로거가 생산하는 컨텐츠는 비록 얼마되지 않지만, 롱테일하게 깔리는 컨텐츠를 '검색'으로 모으면, 말 그대로 '티끌모아 태산'이 되는 형국인 것이다.

위에서 말 했듯이 검색을 통해서 '해답'을 찾기 원하는 것이 현재 검색사용자의 가장 큰 'Needs'이고, 이 Needs를 채워줄 수 있는 정보들이 '블로그'에 롱테일하게 깔리고 있다.

그래서 1등이 되고 싶은 포털이라면, 다른 어떤 것보다 '블로그 검색'으로 승부를 걸어보아야 한다.




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/463 관련글 쓰기

댓글을 달아 주세요

네이트의 도전

정보검색 2009/02/16 17:02 Posted by 마루날
네이트가 엠파스와 합병하면서, 검색분야에 대하여 도전을 선언했다. 네이트 현재 국내 3대 포털(네이버, 다음, 야후)의 하나로 자리잡으려면, 검색이 핵심이 될 수 밖에 없다.

이번 목표는 검색점유율을 5% ->15%로 늘리기라고 한다.



결론은 네이트 검색을 많이 사용하도록 하는 것인데...

많이 사용하도록 해야 한다는 것

대부분의 검색엔진 사용자들은 적어도 2,3군데에서 검색을 하게 되는데, 첫 번째 사용하는 검색엔진은 네이버니까

적어도 2번째나 3번째 검색을 하는, 그것도 서너 번에 한번씩 사용하는 검색엔진이 되겠다는 것이 소박한 목표가 될 것 같다.

어떻게 하면 많이 사용하도록 해야 할까

원칙적으로야 사용자들의 검색의도에 맞는 검색UI와 검색결과를 제공하는 것이 되지만,

 현실적으로 보자면 검색이 단순히 정보를 찾는 도구만이 아니고 놀이 도구이자 정보의 소비 및 유통방식이 되어버린 지금의 검색엔진은 기본적인 것 이외에 디테일한 검색에서의 차별화를 제공하는 것이 사용자들이 서너 번에 한번씩 2번째 또는 3번째로 검색을 하게 할 수 있을 것이다.

이번에 강화된 검색서비스들을 보면

얼굴사진
모양인식 검색
배경음악 인식검색
시멘틱 검색
기간별 이미지 검색

멀티미디어에 대한 검색을 강화하겠다는 것 같은데

결론적으로 이번 네이트 검색개편의 전략은 틈새시장을 노려서 차별화된 사용자의 니즈를 채워주겠다는 것 같다.

사실 이미지나 동영상에 대한 검색은 네이버나 다음 모두 조금은 아쉬운 수준이기는 하다. 그래서 이 전략이 먹힐 것 같은 느낌도 드는데, 점유율을 10%이상 늘려줄 수 있는 수준이 될까 하는 의구심은 사라지지 않는다.

차라리 요즘 지식인보다 더 사용자들에게 각광받고 있는 블로그 검색을 강화해서 기존 3사(네이버, 다음, 야후)보다
강력한 블로그 검색을 제공했으면 어땠을까 하는 생각도 든다.

싸이월드에 사진 말고 다른 컨텐츠도 많았다면 유용한 전략이 되었을 텐데 결국은 남의 블로그를 열심히 모아서
검색을 해야 하니 그것도 여의치 않아 보인다.

그리고 기본적으로 멀티미디어를 강화한다고 하면서 동영상이 빠진 것을 보면 동영상 검색의 지존인 엔써미의
효과인지도 모르겠다.

다만, 멀티미디어 하면 이제는 모두 동영상을 떠올리는데, 마치 팥소 없는 찐빵 같아서 조금 아쉬울 뿐이다.

아직 실체를 접하지 못해서 섣부른 판다는 금물이지만, 큰 꿈을 품었으니 꼭 이루어서 검색엔진 시장의
새로운 변화의 바람이 되시기를 바란다.




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/367 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon 검둥개  수정/삭제  댓글쓰기

    몇번 눈팅만 하다가 글을 남기네요.
    이미지검색 관련하여 링크 걸어놓고 갑니다...^^

    http://scartissue.egloos.com/4178291

    2009/02/24 17:49
    • BlogIcon 마루날  수정/삭제

      링크 걸어주신 글 잘 보았습니다.

      소덕질이 뭔가요?
      소녀시대 오덕후 질인가요? ^^

      개인적으로 이미지 검색이
      성공(주류검색으로 자리)하려면
      사람 얼굴을 찾는 것말고 상품이나 상황을 인식할 수
      있어야 한다고 생각합니다.

      눈팅만 하지마시고 댓글과 트랙백도 자주 부탁드려요^^

      2009/02/25 08:46

사용자 참여형 검색서비스

지난번 검색서비스의 미래 포스팅에서 언급했던 검색에서의 사용자 참여형 서비스가 구글의 서치위키이다. 우리나라도 사용자 참여라는 측면에서 꽤 성공한 서비스가 있다.

검색서비스라고 우기는 네이넘의 지식in인데, 사용자참여형 서비스는 맞지만, 검색서비스가 아니라 검색을 위한 컨텐츠 구축 시스템일 뿐이다.


구글(영문)에서 VOC라고 검색을 하면 다음과 같이 검색결과가 보여진다.


구글코리아의 검색결과와 달리 SearchWiki라는 것이 보인다.

구글의 SearchWiki 서비스는 크게 3가지 기능이 제공되고 있다.
  1. 검색결과 랭킹 조정
  2. 검색결과 코멘트 추가
  3. 검색결과 리스트에 추가/삭제

구글 SearchWiki

1. 검색결과 랭킹조정


검색결과 리스트에서 특정 결과의 순위를 조정하려면, 검색결과 리스트의 제목 오른쪽 ↑버튼을 클릭하면 해당 결과가 검색결과 리스트 최상위에 위치하게 되고 다음과 같은 화면이 나온다.


이 상태에서 ↓버튼을 클릭하면 결과가 한개씩 아래로 움직인다.

2. 검색결과 코멘트 추가

검색결과에서 Similar pages 옆의 말풍선 모양의 버튼을 클릭하거나 랭킹조정 버튼을 클릭하면 아래와 같이 코멘트를 추가할 수 있는 화면이 보여지고 여기에 적절한 코멘트를 남길 수 있도록 되어 있다.


3. 검색결과 추가/삭제

검색결과의 삭제는 검색결과 랭킹조정을 위한 ↑ 버튼 옆의 X버튼을 누르면 되고, 검색결과의 추가의 화면 하단에 Add a result를 누르면 URL을 등록할 수 있도록 되어 있다.



사용해보니

검색결과에 대하여 사용자들이 랭킹을 조정하거나 검색결과를 추가/삭제할 수 있도록 한 것은 자연스럽게 사용자들의 참여를 유도하게 한 것으로 보여진다.

한두사람에 의해서 검색결과가 조작될 가능성도 없지는 않지만 아마도 비정상적인 랭킹조정 시도에 대하여 적절한 대응책이 있을 것 같고, 말 그대로 사용자들에 의해 검색결과가 걸러지는 Collective Filtering이 검색서비스에 적용이 된다면 지금보다 더 정확한 결과가 제공될 것 같다.

또한, 내가 던진 VOC라는 질의어는 Voice of Customer의 약자인데, 실제로는 휘발성 유기화합물 [Volatile Organic Compounds : VOC]로 더 많이 사용되어 진다.

그래서 써치위키와 같은 서비스가 있다면 VOC와 같이 서로 다른 의미로 사용되는 질의어를 걸러내는데도 매우 효과적일 것으로 보여지고 무엇보다 개인화 검색과 이를 바탕으로 비슷한 프로파일을 가지고 있는 사람들의 검색결과를 공유하는 등의 SN 역시 가능할 것으로 보여진다.

여러번 언급했었지만, 검색이라는 것이 정보의 소비와 유통의 도구가 되어버린 지금 구글이 검색결과에 개인화와 SN까지 품게 된다면 지금보다 더 독보적인 위치를 차지할 것으로 보여진다.

아.. 물론 이런 번거로운 작업을 누가할 것인지 궁금하겠지만, 위키피디아를 보라!
내가 보기에는 이 서비스의 활성화는 시간문제인 것 같다.

SearchWiki라는 서비스명은 정말 잘 지은 것 같다.





 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/360 관련글 쓰기

  1. 맞춤 검색을 원하십니까? 정보를 좀 주세요... by 구글

    Tracked from 학주니닷컴  삭제

    어떤 검색엔진이든 그 검색결과가 검색하는 사람에게 있어서 효과적이고 효율적이기를 바라는 것은 당연한 것이다. 전세계 검색엔진 시장을 독주하고 있는 구글 역시 자신들의 검색엔진 점유율을 유지하고 더 늘리기 위해 사용자에 맞는 맞춤 검색결과를 내놓을려고 노력하고 있는 모습이 여러군데서 보이고 있다. 구글은 구글 검색엔진을 통해서 검색결과를 내놓을 때 검색어에 대한 검색결과와 함께 그 검색어에 대한 광고도 함께 내놓는다. 광고 역시 정보의 하나라고 생각하..

    2009/01/22 14:21

댓글을 달아 주세요

  1. BlogIcon montreal flower delivery  수정/삭제  댓글쓰기

    검색결과의 퀄리티도 좋아진겠네여

    2009/07/13 02:06
    • BlogIcon 마루날  수정/삭제

      네.. 사용자들의 참여가 더 나은 결과를 보장할 수 있는 컨셉인 것 같습니다.

      2009/07/13 11:21

2009년 검색서비스의 미래

정보검색 2009/01/16 14:24 Posted by 마루날
검색은 더 이상 정보를 찾는 도구가 아니다.

검색의 미래에 대해서 이야기 하기에 앞서서 컨텐츠(정보+서비스)에 대해서 먼저 정리를 해보아야 할 것 같다.

단순히 검색이라는 것은 정보를 찾는 수단이 아니라 이제는 정보를 유통하고 소비하는 방식이 된 것 같다.

한국형 통합검색이라는 괴물을 통해서 업계의 압도적인 1위가 되어버린 네이버는 항상 신뢰할 수 있는 컨텐츠의 확보에 회사의 사활을 걸었다.

그냥 검색포털이였다면 검색기술 자체에만 집중해도 되지만[각주:1], 통합검색이라는 이름을 걸고 자신들이 가지고 있는 정보와 컨텐츠의 유통/소비를 통해서 트래픽을 독점하여(나쁘다고 할 수 없다. 누구나 트래픽을 독점하고 싶을 테니까) 지금의 1등이 된 네이버에게 컨텐츠의 확보는 무엇보다 중요하다고 할 수 있다.


네이버의 방식

정보가 어디에 있다는 것은 관심 없고 사용자들이 관심을 가질 만한 컨텐츠를 쌓아야만 하는 것이 네이버의 운명이기 때문에 항상 컨텐츠의 생산 및 유통에 대하여 관심을 갖고 있었다.

그러다 보니 네이버 블로그의 펌질에 대해서 네이버가 미온적인 태도를 보이는 것은 네이버는 800만개에 달하는 네이버 블로그들의 펌질을 통하여(모든 네이버 블로그가 펌질을 한다고 할 수 없지만, 그 비율이 매우 높은 것을 사실이다.) 지식인에 이어 새로운 컨텐츠 생산, 유통단지의 역할을 하게 하려고 하는 것 같다

그리고 최근의 오픈캐스트 또한 사용자들이 자발적으로 캐스터가 되어 어쩌면 또 다른 방식의 컨텐츠 소비 및 유통방식이 되어주기를 바라는지도 모르겠다.

더 이상 검색이 정보가 어디에 있는지를 알려주는 서비스가 아니라 검색이 정보의 소비와 유통의 도구인 지금과 같은 검색만능시대에는 얼추 네이버의 시도가 소 뒷걸음질에 쥐 잡는 것 같은 형국이지만, 적절한 전략인 것 같기도 하다.


검색서비스의 미래

그렇다면 앞으로 더 나은 검색을 위해서는 정보를 잘 찾는 것이 아니라 정보의 유통과 소비를 위해서 네이버 펌로거와 오픈캐스트 발행인과 같은 개미떼가 필요한 것일까?

컨텐츠를 유통하고 소비한다는 입장에서 앞으로의 검색엔진의 변화될 모습에 대해서 생각을 해보자

정보의 위치가 아닌 정보자체를 알려주는 검색

검색결과는 아웃링크(지극히 한국적인 표현 아닌가? -_-)의 모임일 뿐이어서 원하는 컨텐츠를 찾기 위해서 사용자들은 클릭 & 브라우징을 여러 번 해야 한다.
지식in과 같은 Q&A류의 검색인 인기를 끄는 것은 컨텐츠를 소비하는 사용자들은 단지 정보가 필요한 것이 정보가 있는 곳을 가리키는 정보는(검색결과) 그다지 관심이 없다.

아마도 앞으로는 검색결과 페이지에서 해당 페이지를 직접 열어보지 않고도 해당 페이지의 주제와 요약 내용(지금처럼 단순히 질의어가 위치한 단락이 아닌)이 보여지는 형태로 발전할 것이다.

개인화와 Social Networking

그리고 개인화 부분이 가장 강력하게 작용할 수 있는 영역이 검색엔진을 통한 컨텐츠 소비가 아닐까 생각이 된다. 검색결과에서 사용자와 연관된 정보만을 제공하도록 될 것이다.

현실적으로 보았을 때 검색엔진과 Social Networking의 결합은 이미 시작되었다고 해도 과언이 아니다. 인기검색어류의 서비스가 검색엔진에서 던지는 미끼역할이 주이지만, 이 서비스는 사용자들의 관심사를 반영한다는 것에서 시작해서 질의어를 기준으로 자신과 비슷한 관심사를 가진 사람들이 클릭하여 열어본 검색결과를 일종의 Collective Filtering 형태로 조합을 할 수 있게 된다.

참고기사 : 구글, 개인 맞춤형 검색 서비스 준비중

느슨한 형태의 SN이 질의어와 검색결과를 통해서 만들어지지만, 여기에 검색결과에 대한 사용자들의 판단과 선호가 결합이 되면 말 그대로 정보를 재구성할 수 있게 되는 단계까지 가능할 것으로 보여진다.

유비쿼터스 & 모바일 검색

언제, 어디서나, 어떤 디바이스에 관계없이 정보를 소비하자면, 시공간 및 디바이스에 종속되지 않는 형태의 검색서비스는 필수적이다.

일요일 저녁마다 챙겨보는 패밀리가 떳다를 보면 최근에 재미있는 모습이 보이는데, 요리법을 찾기 위해서 모바일 검색을 한다. TV쇼에서조차 모바일 검색이 낯선 풍경이 아닌 시대가 된 것이다.

지난번에 이찬희가 사용하는 검색을 보니 구글 검색이었는데, 시공간 및 디바이스에 종속되지 않은 형태의 검색은 광고와 같은 가비지 없는 정제된 형태의 정확한 검색결과가 필요하고 지금으로서는 구글이 그나마 그 니즈에 가장 가깝지 않나 생각된다.

무엇보다 검색의 입출력 방식에 대한 새로운 시도들이 계속될 것 같은데, 예를 들면 음성 인식에 의한 질의어 입력이나 사진이나 동영상과 같은 멀티미디어 정보도 큰 어려움 없이 검색결과로 제공되어야 할 것이다.

메타검색과 전문검색

작년 한 해를 돌아보면 블로그, 동영상이나 이미지, 문서, 상품 등과 컨텐츠 별 검색이 가능하도록 포털의 검색결과를 조합해서 보여주는 메타검색이나 특정 컨텐츠에 특화된 검색서비스들이 등장하기 시작했다.

이제까지 한자리에 모든 정보를 보여주어서 편리했다면 이제는 사용자들이 선별적으로 자신이 원하는 정보만을 찾기 원하는 검색서비스를 원하는 시대로 접어든 것 같다.

단순 텍스트문서에 이미지를 거쳐 동영상에 이르기까지 다양한 형태의 컨텐츠들이 기하급수적으로 쌓여가는 인터넷 공간에서 검색의 존재는 이제 단순한 찾는 도구가 아닌 컨텐츠의 유통과 소비에 채널이 되어버렸다.

그에 비해서 국내의 검색서비스들은 갈길 이 멀어 보이기만 하다. 어쩌면 2009년도는 구글코리아의 약진이 두드러지는 한 해가 될지도 모르겠다.




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

  1. 물론 네이버가 검색기술 연구개발을 소홀히 한다고 볼 수 없다. 지금까지 확보한 인력 풀만 해도 그 인력으로 지금 수준밖에 못하는 것이 더 놀라울 뿐이다 [본문으로]

TRACKBACK :: http://ithelink.net/trackback/358 관련글 쓰기

  1. Next Google을 찾아서

    Tracked from Change The Web  삭제

    도전과 혁신 지금 웹 비즈니스를 사실상 주도하고 있는 기업은 Google이다. Google이 가져온 여러 혁신에 우리가 마냥 감탄하는 동안, 어느새 Google도 10년을 넘는 중견 기업이 되었다. 혁신의 선...

    2009/01/25 15:27
  2. 검색 서비스 DAUM 이 1% 부족하다??

    Tracked from KIDORY = Kid + Story  삭제

    DAUM 과 NAVER 를 비교하다 무심코 DAUM 검색창에 "야후"를 입력하고있었다. 인터넷을 사용하는 사람이면 누구나 검색창에 한글자만 입력해도, 비슷한 검색어들이 아래로 나열되는것을 보았을 것이다. 이를 두고 DAUM 에선 "검색어 서제스트"라 부른다. 같은 서비스를 NAVER에선 "네이버 자동완성 서비스"라고 부른다. (이하, 연관검색어라 통칭) 다음과 네이버의 같은 서비스인 연관검색어에서 소소한 차이가 있다는것을 알았다. 처음으로 돌아가 다..

    2009/02/09 12:45

댓글을 달아 주세요

Conversational Search, artiklz

정보검색 2008/12/09 15:37 Posted by 마루날
Artilklz

Conversational search라고 부르는 검색서비스이다. URL은 http://artiklz.com이다.

요즘 해외의 스타트업 홈페이지는 대부분 이렇게 단순하더라


도대체 conversational search라는 것이 무엇인지 궁금해서 홈페이지에 소개된 내용을 참고해보니, 블로그와 같은 소셜미디어를 통해서 언제, 어디서, 누가, 왜, 무엇에 대하여 이야기가 되고 있는지를 검색해주는 서비스이다.

Artiklz 소개 동영상인데, 영어라서 뛰엄 뛰엄 알아듣겠다. -_-;;



소셜미디어 검색의 미래

Artilkz는 단순히 웹문서를 검색하는 기존의 웹 검색과 달리 소셜미디어를 검색하되 소셜미디어는 사람들의 생각과 소통의 장소이기 때문에,

단순히 웹 문서만을 검색하는 것이 아니라 블로그, article, 사람에 대해서 댓글까지 검색한다는 컨셉인데, 검색이라기 보다는 일종의 모니터링 같아 보인다.

artiklz는 검색해보려고 하는 블로그, article, 사람을 설정해 놓고 변화되는 모습을 알려준다. 그런데 한글에는 적용이 안되는지 모르겠지만 결과를 볼 수가 없었다. -_-;;;

openID도 지원하기 때문에 별도의 가입없이 사용가능하다.


검색이라는 측면에서 Artiklz를 살펴보면, 앞으로 검색의 대상이 되는 정보는 정적인 형태가 아닌 동적으로 변화되는 형태가 되지 않을까 하는 생각을 해보게 된다.

블로그에 어떤 사람이 어떤 제품에 대한 이용후기를 올리면, 단순히 사람들이 찾아와서 보고 가는 것뿐만 아니라, 댓글을 남기고 트랙백을 걸면서 처음에 포스팅된 컨텐츠가 진화하여 또 다른 컨텐츠가 되어버리는 경우가 많다.

현재의 검색은 비유하자면, 스냅사진같은 검색이라고 할 수 있다. 소셜미디어를 통한 컨텐츠의 진화를 반영하지 못하고 단면만을 검색하는 것이다.

앞으로 소셜미디어를 대상으로 하는 검색은 소셜미디어를 통하여 사람들간의 소통이 만들어내는 컨텐츠의 진화된 모습을 그대로 담아낼 수 있는 동영상 같은 검색이 필요할 것 같다.

지금처럼 검색을 한다면 단순히 질의어에 대한 색인 결과(특정 문서에 키워드의 출현 위치 및 횟수를 반영한)로 문서리스트를 제공하는 것이 아니라, 검색결과에서 문서리스트와 함께 댓글과 트랙백, 조회수와 같은 context 정보도 같이 제공해야 할 것이다.

어떤 면에서는 artiklz는 지금까지 블로그 검색이 보여주지 못했던 기존 검색과의 차별화에 대한 새로운 통찰력 있는 모습이 아닌가 생각된다.



 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/349 관련글 쓰기

댓글을 달아 주세요

솔트룩스의 새로운 서비스, 아울림

정보검색 2008/11/05 11:38 Posted by 마루날
솔트룩스

개인적으로 회사이름이 좋다고 생각하는 회사이다.

성경에 나오는 '빛'과 '소금'에서 따온 것 같은데, 이 세상의 어두운 곳을 비추는 '빛'이 되고, 썩어져 가는 곳의 '소금'이 되는 회사가 되겠다는 의지인지는 모르겠지만, 이름이 입에 짝짝 붙는다. ^^


아울림

http://www.owlim.com

이 회사는 의미기반의 그중에서도 '온톨로지'를 기반으로 하는 검색엔진 회사이다. 그러다보니 이번에 나오는 서비스의 이름도 '아울림'이다.

아는 사람은 다 알겠지만, 온톨로지를 표현하는 언어 중 하나가 'owl'이기 때문이다.

우선 아울림이 소개 동영상 하나를 보자.. 그런데 너무 내용이 빠르다. 좀 천천히 돌아가게 만들어 주면 좋으련만 나이가 들어서 그런가 몇 번을 돌려보았다. -_-



아울림을 사용해보자

온톨로지라는 것이 한 마리로 설명을 하자면 용어와 용어간의 관계를 용어와 함께 표현하는 것이라고 할 수 있겠다. 아울림의 첫 화면 역시 '정보의 시각화'에 촛점을 맞추어 보여주고 있다.

[아울림 메인 화면]


질의어를 입력하면,

검색결과 리스트와 검색결과를 시각화하여 검색결과와 연관성 있는 토픽을 방사형으로 함께 보여주는 토글이 함께 보여진다.

[검색결과 화면]


검색을 하면서 어려운 것은 사용자가 자신이 찾고자 하는 정보를 검색엔진이 이해할 수 있는 질의어로 표현하기가 매우 어렵다는 것이다. 그러다보니 사용자가 느끼기에는 질의어와 영 관계없는 검색결과가 나오는 것처럼 느껴지는데,

아울림의 경우 연관성을 따져서 토픽을 시각화해서 한 눈에 보여주니까, 사용자로 하여금 검색엔진이 이해할 수 있는 질의어를 입력할 수 있도록 도와주는 것 같다.

검색결과의 시각화 부분인데 아울림에서 주장하듯이 '정보를 찾고, 정보의 관계를 분석하고, 정보를 연결해서 이해하기 쉽도록 시각화'하는 것은 사용자들에게 매우 유용한 기능임에 틀림없다.

[토글을 크게 보기를 클릭했을 때]


아울림에서 검색결과를 시각화(토글)하기 위해서 온톨로지를 사용하는 듯 보이는데, 온톨로지라는 것이 잘 구축하면 정말 정교한 검색결과를 제공할 수 있지만, 제대로 리얼월드를 모두 매핑하기에는 너무나 많은 비용과 리소스가 필요하기 때문에 쉽지 않다.

그래서 검색을 몇 번 해보면 아울림의 의도와 관계없이 아쉬운 결과가 보여지기도 한다.


그렇다면...

사용해보면 큐로보와 정말 비슷하다.

뭐 두 회사 모두 'Semantic'을 하는 회사이고, 당연히 '온톨로지'도 사용하기 때문에 비슷하게 보이는 것이 당연하다. 큐로보의 경우는 시각화 부분이 표현되지 않았다 뿐이지 결과가 비슷해 보인다.

어느쪽의 온톨로지가 더 정교한가에 대한 이슈만이 남는 것 같은데..

아무튼 본인이 자주 하는 소리이지만, 국내에서 이렇게 다양한 시도가 계속되기를 바란다. 그리고 무엇보다 돈을 벌어서 살아남기를 빈다.

물론 솔트룩스의 경우 아울림 이외에 회사의 매출구조가 다양하고 탄탄하니까 아울림이 당장 수익이 발생되지 않더라도 계속 서비스가 가능할 것으로 보여진다.

다만, 지식인에 길들여져 있는 사용자들에게 이 서비스를 어떻게 접근시킬지가 관건일 것 같다.
사실 '정보의 시각화'는 공급자의 마인드에서 나오는 캐치프레이즈로 느껴지니까...

참, '아울림'은 '어울림'과 너무 헷갈린다. -_-;;;




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~


TRACKBACK :: http://ithelink.net/trackback/338 관련글 쓰기

  1. 솔트룩스, 의미검색, 아울림(owlim)

    Tracked from computational linguistics  삭제

    시맨틱스의 큐로보와 비슷하게 이번에는 솔트룩스에서 의미검색 서비스를 오픈했다. 그 이름은 아울림(www.owlim.com) 시맨틱 필이 나도록 온톨로지 기술 언어중의 하나인 owl 을 넣을 것 같은데... 일단 기본 방식은 1. 배치 방식 키워드 클러스터링 ( 토글 ) - 미리 단어(혹은 구) 간의 연관도를 통계적으로 계산해서 랭킹을 매겨둠 2. 실시간 문서 클러스터링 ( 클러스터링 ) - 쿼리에 의해서 검색된 결과에 대해서 실시간으로 문서 클러스터..

    2008/11/09 20:17

댓글을 달아 주세요

패션전문 쇼핑검색, 고르다~

정보검색 2008/10/29 11:44 Posted by 마루날
사이냅소프트

이전 포스트에서 소개했던 문서검색서비스 스도쿠를 운영중인 사이냅소프트에서 새롭게 쇼핑검색을 론칭하였다. 아직은 pre open beta라서(open beta 직전이라는 뜻인가? 헷갈리네) 여러 가지 시도가 진행중인 것 같다.

심지어 어젯밤에 캡쳐했던 화면이 회의를 다녀오니 이렇게 바뀌어있다. ^^;;

[어제 캡쳐한 화면]

[오늘 오전에 바뀐 화면]



패션 쇼핑검색, 고르다(gorda)

 http://www.gorda.co.kr/

검색으로 돈을 버는 방법 중에서 안정적인 방법 중 하나가 쇼핑몰 검색을 통한 중계수수료가 아닐까 싶다. 물론 일종의 트래픽 기반의 어필리에이트 프로그램이라는 예전부터 있었던 수익모델이지만..

'고르다'는 여러 쇼핑몰의 패션 상품을 전문으로 검색해 주는 서비스라고 한다. 가격비교 검색과 메타검색을 주요 서비스로 론칭하였다.

[화살표 부분 : 쇼핑검색 + 메타검색]


가격비교 검색이라는 것은 동일한 상품에 대하여 서로 다른 쇼핑몰의 가격을 비교 해주는 검색서비스이다.

가격 비교를 위해서는 서로 다른 쇼핑몰에 있는 상품이 검색대상이 되는 동일한 상품인지 판단하는 것이 필요한데, 이 부분을 대부분의 가격비교 검색사이트는 사람의 손을 통해서 하거나 아니면 약간의 기계의 도움을 받아 사람이 처리한다.

그런데, ‘고르다’의 경우 ‘동일/유사 상품의 판단 알고리즘’을 통해서 단순히 상품의 메타 데이터(상품명, 모델명, 상품설명 등)뿐만 아니라 이미지간의 유사도까지 반영하여 자동으로 동일 상품인지를 판단해서 가격비교를 해준다고 한다.

실제로 몇 개의 케이스를 살펴 보니 ‘고르다’의 경우도 엔써미의 동영상 검색에 대한 포스트에서 이야기했던 메타데이터를 얼마나 잘 검색하느냐가 관건이 되는 것 같다.

쇼핑검색을 하다 보면 우선 상품명과 상품설명에 일반적으로 사용하지 않는 단어들이 많이 존재한다. 그래서 검색결과의 정확도를 개선하기 위해서 상품명 또는 상품설명과 관련된 사전들이 많이 잘 구축되어야 한다.

또한, 숫자나 도량형 등과 관련된 처리가 잘 되어야 한다. 기본적으로 대부분의 검색엔진에서 색인을 하기 전에는 형태소분석기를 사용하게 되는데, 대부분의 형태소분석기는 숫자나 도량형에 대해서 처리하지 않기 때문에 별도로 이러한 분석이 가능하도록 해야 한다.

아직은 pre open beta라서 그런지 몰라도 몇 개의 케이스를 봐서는 ‘고르다’에서 이야기 하고 있는 ‘동일/유사 상품의 판단 알고리즘’이 얼마나 우수한지 잘 모르겠다. 상품명 중에서도 모델명의 명확하게 일치하는 경우만을 볼 수 있어서 가늠하기 어렵다.

더욱이 이미지의 유사도까지 판단한다고 하는데, 오전 내내 조물 딱 거리고 있는데 도무지 찾을 수가 없다. -_-

어쨌거나 범용 검색서비스인 포털의 검색서비스에 비해서 이런 전문적인 검색이 더욱이 수익모델까지 잘 갖추어서 시도한다는 것은 반가운 소식임에 틀림없다.

전 사장님 대박 나세요~ ^^




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/336 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon 전경헌  수정/삭제  댓글쓰기

    마루날님, 관심있게 봐주셔서 고맙습니다. 쇼핑검색에 관련한 비지니스적인 문제나 기술적인 문제 모두 올바르게 지적하셨습니다. 뜨끔합니다. 새 UI는 개발중이던 버전이 실수로 공개된 건데, 기능적인 문제가 있는 채로 공개돼서 저도 깜짝 놀랐답니다. 이왕 공개되었으니 기능적인 문제만 빠르게 해결해서 동작할 수 있도록 했습니다. 이미지 유사도 기술은 아직 적용되어있지 않고요. 다음 버전에는 적용되어 있을 겁니다. 혁신기능이 아닌 기본기능만 구현하는데도 시간과 노력이 많이드네요. 앞으로도 좋은 글 부탁드립니다.

    2008/11/05 12:51
    • BlogIcon 마루날  수정/삭제

      아이쿠, 사장님이 직접 댓글을 남겨주시다니요 ^^

      지금보다는 앞으로의 행보가 더 기대됩니다. 지금보다 더 완성도 있는 서비스 기다리고 있겠습니다.

      언제 블로거 간담회 같은 거 하시면 찾아뵙겠습니다.

      2008/11/05 13:56

국내 검색서비스의 Niche는 포털?

정보검색 2008/10/28 18:28 Posted by 마루날
어제 올린 포스트를 되새김질하다 보니 다음 그림같은 메모를 하게 되었다.
사용자 삽입 이미지

일러스트 by 마루날


물론 그림에 빠져있는 사용자의 니즈를 채워주는 니치 검색서비스도 분명히 존재하겠지만, 아직까지 나의 레이더망에 포착되지 못하였고, 나머지 검색서비스들은 랭킹이나 UI와 관련된 새로운 시도들이기에 빼놓았다.

용자의 검색의도라는 것은 결국 사용자의 니즈에서 비롯되는 것이고, 이 사용자의 니즈를 쪼개어 보면 여러가지 검색서비스들이 존재하고 있음을 알게된다.

그리고, 다음으로 등장하는 서비스는 뭐가 될까 궁금한 마음도 들 수 있는데, 안타깝게도 이 세그멘트들의 합이 대충 포털의 내부 DB와 맞아 떨어진다.

결국 포털들이 지금까지 자신들의 내부에 컨텐츠를 열심히 쌓아놓은 것이 전략적으로 올바른 접근이라고 볼 수도 있는 것인가? 젠장

그나마 나은 것은 기존의 포털의 검색서비스가 범용성을 지향하고 있다면, 개별 니즈별로 등장한 검색서비스들은 각각의 분야에서 전문적인 검색기술을 적용하고 최적의 검색결과를 제공할 수 있도록  구축했다는 장점이 있다.

분히 겨루어 볼 만한 서비스들임에 분명하지만, 수익구조를 생각한다면 암담하다.

사실 트래픽을 기반으로 하는 광고 외에는 뚜렷한 수익모델을 가져가기 힘들고, 대부분의 검색엔진 사용자들이 2~3개의 검색엔진을 번갈아 사용하는 것을 감안한다고 해도 수익모델이라고 내세울 만큼 트래픽이 몰리지는 않을 것이다.

결국 검색서비스의 니치를 노리고 있는 서비스라면, 사이냅의 스토쿠처럼 포털과 제휴를 통해서 풀어야 할까? 솔직히 잘 모르겠다. 포털과의 제휴가 윈윈 모델이라고 보기에는 좀 아쉬운 부분이 있기때문이다.

사이냅처럼 기존의 안정적인 수익원이 있는 경우에야 포털과의 제휴를 통해서 만들어지는 수익이 작더라도 당분간은 전혀 문제 없지만, 서비스의 생존을 걸어야 하는 정도라면 심각하게 고민이 된다. 결국 국내 검색시장이 작기때문에 생기는 일일까?

검색분야 역시 다양한 서비스들이 시도되고 뜨고 사라지는 가운데 발전이 가능하기 때문에 더 많은 시도들이 있었으면 하지만, 실제 현실은 가혹하다.

과연 다음에 우리를 놀라게 할 것은 뭐가 나올까?




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/335 관련글 쓰기

  1. enswer.me 한국 인터넷 업계에 세가지 답을 주다

    Tracked from 땅속 깊은 블로그  삭제

    어제 동영상 검색 서비스 엔써(enswer.me)의 블로거 간담회에 다녀왔다. 시간이 부족해 중요한 비즈니스 모델 쪽을 제대로 보지 못하고 나왔지만 짦은 시간 속에서도 이 서비스가 얼마나 엄청난 기술력을 가지고 있는지 느낄 수 있는 좋은 시간이었다. 솔직히 대표의 설명이나 프리젠테이션의 모양새는 요즘 높아진 눈을 감안하면(스티브잡스의 본좌급 프리젠테이션만 봐서 그런지) 좀 허접해 보였다.. 하지만 이번 간담회를 통해 그것은 다 나같은 문과생 펜대들이..

    2008/11/20 21:08

댓글을 달아 주세요

  1. BlogIcon Steve박  수정/삭제  댓글쓰기

    안녕하세요? 데모데이에서 뵈었던 넥스트서치입니다.
    쇼핑몰 분야에서도 이미지 내용검색 기술을 응용한 비주얼 상품검색 서비스를 준비하고 있습니다.
    미국의 Like.com이나 Picitup.com이 유사한 모델의 서비스입니다.
    현재 엔진과 베타서비스 마무리단계에 있어 조만간 오픈할 예정입니다... 감사합니다..

    2008/11/17 18:10

Search Startup

자주 가는 해외 사이트에 재미있는 글이 올라와서 읽다가 생각나는 것을 옮겨본다.

새롭게 검색을 시작하는 벤처에게 해주는 충고의 이야기이다.

이전 포스트에서 소개했던 인물 검색사이트 Spock.com의 창업자들의 이야기인데, 검색서비스를 막 시작했거나 시작하려고 하는 사람들이 새겨들을만한 내용이다.

물론 내용은 이미 다 알고 있는 이야기이다. -_- 결국 이런 모든 좋은 얘기는 실행의 문제이기는 하지만.

그런데, 의외로 많은 벤처들이 사업을 시작하면서 열정이 앞서다 보니 다음에 소개하는 내용에 대해서 신경을 거의 쓰지 못하고 시작한다는 것이다.


고려해야 하는 것

구글의 사용자 경험에 버금갈 만한 차별화된 경험을 제공할 수 있어야 한다.

검색서비스에서 사용자 경험이라고 한다면, 단순히 검색결과[각주:1]만을 말하는 것은 아니다.  검색서비스의 전반에 걸친 사용자 인터페이스와 사용자에게 제공하는 여러 가지 편리한 기능들이 결합되어 사용자에게 검색 서비스를 경험할 것이다.

사용자는 편리하고 친절한 경험을 하려고 할 것이다. 불편하고 친절하지 않은 서비스를 힘들게 사용할 이유는 없다.

국내의 경우 네이버 검색서비스에 익숙한 사용자를 대상으로 한다면, 네이버와 비슷한 사용자 경험을 제공하면서 뭔가 좀 더 나은 사용자 경험을 제공할 수 있어야 한다.

안타깝게도 보통 사용자의 눈높이 맞추어서 그들의 니즈에서 반 발자국 앞선 사용자 경험을 제공하는 쪽으로는 네이버가 정말 잘 한다. 이쪽에서는 타짜이고 선수들이다.

[출처 : http://bighugelabs.com/flickr/onblack.php?id=505658689]

검색서비스의 니치 시장을 목표로... 여전히 검색에는 혁신적인 아이디어로 도전할 수 있는 시장이 남아있다.


꼭 미국시장의 이야기라고만 할 수 없다. 모든 서비스가 그러하듯이 검색 사용자들의 니즈는 항상 변화한다. 당장 동영상 검색만 해도 2년 전만 해도 일반 사용자들은 동영상을 찾는 것들이 대부분 불법으로 업로드된 영화나 드라마 동영상들이다.

지금도 여전히 그런 니즈는 남아있지만, TV의 쇼의 일부 장면이나 이승엽 선수의 3점 홈런 장면이나 유행하는 동영상 UCC에 대한 니즈가 훨씬 커진 것이 사실이다.

앞으로 어떤 니즈가 시장을 끌어갈지 아니면 어떤 기술이 시장을 열어갈지 알 수 없지만, 분명한 것은 마치 더 이상의 변화는 필요 없을 것 같은 지금과 같은 상황이야말로 폭풍 전야의 고요함이랄까 더 큰 변화의 전조가 될 수 있다고 본다.

무엇보다 기술과 비즈니스 모델의 결합이 필요하다.

결국 검색으로 새로운 사업을 시작한다면, 이미 검증된 비즈니스 모델인 검색광고에 가장 관심이 많이 갈 것이다.

검색광고라는 것이 굉장히 새로운 비즈니스 모델인 것 같지만, 결국 광고일 뿐이다.  무슨 이야기냐 하면 절대적으로 트래픽에 의존도가 높다는 것이고, 타겟팅이 가능했기에 더 열광을 하고 있는 것이다.

기존의 기술보다 훨씬 나은 기술을 개발해 냈다면, 기존의 비즈니스 모델이든지 아니면 새로운 비즈니스 모델을 함께 준비해야 한다.

그냥 간단하게 이렇게 생각해 보면 된다.

'이 서비스가 기존의 서비스보다 뭐가 좋은지?',
'왜 사용자들이 이것을 사용해야 하는지?',
'돈은 어떻게 벌건지?'

이 3가지 질문은 똑같은 이야기일 수도 있지만, 이 질문들에 대답을 할 수 있고, 듣는 사람이 추가적인 질의응답 없이도 이해하고 동의할 수 있다면 감히 장담하지만, '대박'은 시간문제일 뿐이다.


결국

위에서 언급한 이야기들은 모든 사업에 동일하게 적용할 수 있을 것이다.

혁신적인 기술을 개발해서 사용자들에게 기존의 서비스보다 더 나은 사용자 경험을 제공하면서 돈을 벌 수 있는 방법이 없다면... 사업 시작을 처음부터 다시 생각해 봐야 할 것이다.

막연한 기대만으로는 10원도 벌 수 없으니까..



 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

  1. 가장 중요한 요소임에 분명하다. 단, 공급자의 관점이 아니라 사용자의 관점에서 검색결과는 정확해야 한다. [본문으로]

TRACKBACK :: http://ithelink.net/trackback/334 관련글 쓰기

댓글을 달아 주세요

한국의 대안 검색엔진들

정보검색 2008/10/17 15:00 Posted by 마루날
시장은 변화를 원한다.

[출처 : flickr.com]

마켓의 크기가 달라서일까? 미국과 비교했을 때 우리나라에는 새로운 검색서비스가 출현하는 것이 거의 연례행사 수준이라고 할 수 있다.

그래도 작년에는 꽤나 유명한 플레이어들이 등장했었는데, 올해는 내가 잘 몰라서 그런지 몰라도 찾아볼래야 찾아볼 수가 없다.

소프트뱅크 미디어랩의 류한석 소장님 말씀대로 지금의 불경기를 헤쳐나갈 방법 중 하나는 아니, 두개인가? 아무튼.. 벤처의 활성화와 인터넷 생태계의 발전을 가능하게 하는 새로운 서비스들의 등장이다.


Alternative Search Engine이란

국내는 너무나 비정상적이게도 신뢰할 만한 웹 컨텐츠가 없다는 핑계를 대면서[각주:1]자신의 사이트에 열심히 컨텐츠를 쌓아서 자신의 컨텐츠를 검색하는 기형적인 모습이다 보니 모든 종류의 컨텐츠를 포털에서 검색할 수 있다.

그러다 보니 외국처럼 사용자들의 검색요구의 니치를 담당하는 Alternative Search Engine이라는 것이 국내에서는 찾아보기가 너무 어렵다.

해외의 경우를 살펴보면, 블로그, Social, Health, Visual, Meta Search 등 다양한 Alternative Search Engine들이 존재하는데 반해 국내의 경우 검색을 해보면, 그나마 무슨 무슨 검색사이트라는 곳을 가보면 대부분 자신들의 DB를 쌓아놓고 기업용 검색엔진 패키지를 사다가 설치를 해놓고 서비스를 제공하는 곳이 대부분이다.

물론 어떻게 구축했느냐에 관계없이 유의미한 시도들이기는 하지만, Alternative Search Engine이라고 하기에는 적절하지 않아 보인다.


한국의 Alt Search Engine

나루 검색
  - http://www.naaroo.com/
  - 블로그검색
  - 블로그 포스팅과 블로그 자체를 검색해줌
  - 최근에 리뉴얼이 되면서 심플해짐

위스푼
  - http://www.wispoon.com/
  - Q&A 검색 or Human-powered Search
  - 서울대 박근수 교수님의 위스폰과 전혀 관계없는 곳이다. 심지어 먼저 나왔을걸?
  - 지식in의 미투서비스?
  - 나름 폐인들이 생겨나고 있는 곳
  - 예전의 디비딕을 기대하면 너무 무리한 요구일까?

큐로보
  - http://www.qrobo.com
  - 의미검색
  - 한뼘 키워드나 한뼘 요약은 매우 유용하다.
  - 왜 검색결과가 비어보이지? 수집을 다하지 않나?
  - 그런데 왜 이렇게 초기화면이 복잡해졌지?

스도쿠
  - http://sdocu.synap.co.kr
  - 문서 검색
  - 문서필터로 알짜배기 회사가 된 사이냅소프트의 서비스
  - 문서를 찾아준다는 점에서 야후의 비즈니스 검색과 조금 중첩되는 부분이 있지?
  - 다음과의 제휴를 통해서(수익을  낸다면) Alt Search Engine이 국내에서 살아남는 법을 보여줄건가?

내일검색
  - http://naeil.incruit.com/
  - Job Search
  - 오픈API로 돌파구를 열어내다. 굿 아이디어!
  - 다만, 다른 곳에 있는 채용정보는 어떻게?

앤써즈
  - http://www.enswer.net
  - 동영상 검색
  - 검색결과 클러스터링이 놀랍고, 메타 데이터 검색의 한계가 안타깝다.
  - 그래도 가장 큰 기대주


이외에도

묻지마 검색이나 DABOT과 같은 개인이 만든 검색서비스도 있고, 인물사진을 검색을 할 수 있는 곳도 있고, 사고싶다 같은 오픈마켓 메타 검색엔진도 있고 노란북과 같은 책 가격비교 사이트들도 있다.

워낙 검색엔진 인력도 한정되어 있고, 국내의 인터넷 시장규모도 크지 않기에 새로운 시도들이 검색엔진에서도 쉽지 않음을 알 수 있다.

검색서비스를 제공하기 위해서는 꼭 A~Z를 직접 구현해야 할 필요는 없다. 훌륭한 서비스 아이디어만 있다면 구글의 맞춤검색 같은 것을 이용해서 제공할 수 있기 때문이다.

이미 기존의 포털 검색에서 제공하다고 해도 더 나은 검색결과를 제공할 수 있다면 그리고 사람들의 검색 요구의 니치라면 충분히 승산이 있다고 본다.

혹시, 이외에도 우리나라의 대안 검색엔진을 아시면, 댓글로 남겨주세요 ^^ 확 파헤쳐 보겠습니다.




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

  1. 한때 실제로 부족하기는 했다만.. [본문으로]

TRACKBACK :: http://ithelink.net/trackback/332 관련글 쓰기

  1. 큐로보 안에 새로운 검색 경험 있다

    Tracked from Read & Lead  삭제

    요즘 큐로보에서 종종 검색을 하게 된다. http://www.qrobo.com/큐로보는 기존 포털검색과는 다른 렌즈로 유저의 검색 질의를 바라본다.빅뱅으로 검색을 해보면 포털검색 결과는 통합검색이 디폴트로 로딩되고 카페,블로그,뉴스, 지식인 등의 서비스별 버티컬 검색을 유도하는 반면에,큐로보는 음악,문화,과학, IT, 경제 등의 주제별 세부 검색 기능을 제공한다.난 빅뱅의 멋진 노래도 좋아하고 요즘 물리학계 최대 화제인 LHC 실험 결과도 궁금하고..

    2008/10/18 23:24

댓글을 달아 주세요

  1. BlogIcon Read&Lead  수정/삭제  댓글쓰기

    신규 검색엔진을 체계적으로 소개한 포스트를 보지 못했는데 마루날님께서 멋지게 정리해 주셨네요. 감사히 잘 보았습니다. ^^

    2008/10/18 23:26
    • BlogIcon 마루날  수정/삭제

      잘 보아주셔서 감사합니다. ^^;;;
      트랙백 걸어주신 글 잘 보았습니다.

      2008/10/19 00:11
  2. BlogIcon Steve박  수정/삭제  댓글쓰기

    안녕하세요? 9월말에 데모데이에서 뵈었던 넥스트서치입니다.
    내용기반검색기술로 쇼핑몰 상품검색 엔진을 상용화 마무리단계에 있습니다.
    저희가 아직 베타서비스 오픈 직전이라 저희 소개를 않하신듯 하네요.
    유사서비스로는 미국의 Like.com,Picitup.com과 일본의 Gazopa.com 등이 있습니다.
    가격비교와는 차별화되는, 비주얼 상품검색을 타겟으로 합니다...

    2008/11/17 18:32
  3. BlogIcon 로로롱  수정/삭제  댓글쓰기

    이 말에 동감합니다 ^^ 다양한 검색 엔진들이 나오고
    많은 사용자들이 그것들에 익숙해졌음 좋겠어요

    2008/11/24 00:45
    • BlogIcon 마루날  수정/삭제

      네 맞습니다. ^^

      네이버 몰빵은 네이버에게도 인터넷 생태계 전체에도 도움이 되지 않을 것 같습니다.

      2008/11/24 14:29

메타데이터 검색

정보검색 2008/10/06 19:12 Posted by 마루날
메타데이터

[출처 : flickr.com]

메타데이터는 데이터의 데이터라고 정의할 수 있다. 말장난 같지만 데이터를 구조화하기 위하여 필요한 정보를 메타데이터라고 부른다.

메타데이터의 정의나 포맷은 사용하는 분야에 따라서 천차만별이라고 할 수 있다. 가장 대표적인 메타데이터라고 한다면 서지정보라고 할 수 있다.

보통 서지정보는 도서명, 저자, 출판사 등의 책에 대한 기본적인 정보를 제공해 주어서 사용자들이 책의 내용을 보지 않고 우선 책의 도서명이나 저자 등의 정보를 통해서 원하는 책을 찾을 수 있도록 하는데 주로 활용된다.


동영상 검색과 메타데이터

동영상 자체를 보는 것과 메타데이터는 크게 상관이 없지만, 무수히 많은 동영상 중에서 내가 원하는 동영상을 찾으려면, 현재의 기술수준으로는 영상의 내용을 사람이 직접 보지 않으면 어떤 내용인지 알 수 없기 때문에 동영상의 메타데이터가 매우 중요한 정보가 된다.

그러나 이 메타데이터라는 것이 주로 제목, 만든 사람, 날짜 등의 정보가 대부분이어서 검색엔진 입장에서는 단지 키워드 몇 개에 불과한 정보이기 때문에 동영상의 메타데이터를 대상으로 검색을 하게 되면 검색결과의 품질이(특히, 정확도) 매우 떨어지게 된다.

왜냐하면 검색방식 중에서 가장 정확도가 떨어지는 것이 질의어로 입력된 키워드와 색인어 키워드의 매칭의 의한 검색이기 때문이다.


제대로 메타데이터를 검색하려면

결론부터 말하자면 키워드로부터 가능한 많은 정보를 뽑아내야 한다. 그러자면 질의어의 경우 질의어 확장을 해야 하고, 색인어의 경우 동의어 관리를 통해서 좀 더 많은 정보를 검색에 반영되도록 해야 한다.

질의어든 색인어든 간에 키워드가 속한 도메인 정보, 키워드의 의미, 타 키워드와의 관계 등을 통해서 키워드를 확장한 개념(?)을 질의어 처리와 색인에 반영을 해야 할 것이다.

질의어 처리와 색인 관리를 위해서는 언어자원(e.g. 사전)을 늘려야 하는데 대표적으로 시소러스나 토픽맵, 온톨로지 등을 구축해야 한다. 뭐 거창한 사전이 안되면 최소한 동의어와 관련 용어 등의 정보를 담은 사전이라도 구축해야 한다.

문제는 대규모의 언어 자원을 구축하는 이런 방법은 결국 비용이 많이 들기 때문에 현실적으로 상용화 서비스에서 구축하기 쉽지 않다는 것에 있다.


Enswer.net

동영상 검색을 위해서 몇 개 안 되는 키워드로 구성된 메타데이터를 활용하는 것은 검색 정확도 측면에서는 근본적인 한계를 갖게 된다.



그래도 Enswer.net처럼 검색결과를 비슷한 동영상끼리 클러스터링해서 제공한다면 키워드 매칭 검색결과에 의해서 만들어지는 중복 검색결과를 제거하는 효과가 있기 때문에 다소 정확해 보인다.

하지만, 이마저도 방법이 되지 못하는 것은 클러스터링을 통해서 중복데이터만을 걸러냈을 뿐 키워드 매칭이라는 근본적인 방식의 변화는 아니기 때문이다.

예를 들어서 질의어로 n개의 키워드(e.g. 이승엽 한신전 히어로 인터뷰)로 된 질의어에 대해서는 중복을 배제한다면 제대로 된 검색결과를 제공하기 쉽지 않기 때문이다.

갑자기 해답도 내기 어려운 메타데이터 검색을 이야기한 것은 지난 제7회 Demo Day 즈음부터 Enswer.net을 사용해 보면서 들었던 생각은 누구나 잘 알듯이 결국 검색성능이 향후 Enswer.net의 성공여부를 좌우할 것이기 때문이다.

한때 국가지식통합검색시스템 이나 특허정보와 같은 대규모의 메타데이터가 쌓여있는 데이터에 대한 검색에 대한 고민이 있었으나 현재는 거의 시도조차 되지 않고 있는데, 앞으로 Enswer.net에서 메타데이터 검색에 대한 획기적인 기술이 개발되기를 바란다.



 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/324 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon enswer  수정/삭제  댓글쓰기

    마루날님. ENSWER입니다. 저희가 중복을 제거한다고 해서 메타데이터가 적어지지는 않습니다. 1개 동영상의 메타데이터 보다는 클러스터된 후의 메타데이터가 더 많아집니다. 말씀하신 '이승엽 한신전 히어로 인터뷰'의 검색결과가 안나온 이유는 현재 저희 알고리즘 업데이트 관계로 최신동영상이 인덱싱에 반영안되고 있기 때문입니다. 동영상의 경우 오히려 SPAM성 메타데이터가 많아서 이를 검색에 반영하면 결과가 더 않좋아지는 문제가 있습니다. 말씀하신대로 장면검색을 위한 연구는 멀티미디어 검색 연구자들의 꿈인데 가는 길이 간단치 않아서 문제네요. ^^ 지속적인 관심 감사드립니다.

    2008/10/07 18:04
    • BlogIcon 마루날  수정/삭제

      아. 저는 중복데이터를 제거한다고 메타데이터가 적다는 이야기를 한게 아니구요(그렇게 적었나요 ^^)

      중복데이터 제거와 메타데이터를 검색하는 것은 전혀 다른 차원의 일이라는 것을 이야기하고 싶었습니다.

      중복데이터 제거를 통해서 검색결과가 좋아졌지만
      여전히 키워드 몇 개뿐인 메타데이터는 검색하기에 쉽지 않은 데이터셑이니까요.

      물론 ENSWER에서도 노력하고 계시겠죠? ^^

      아무튼, 꼭 성공해주세요 ~~

      2008/10/07 18:55

동영상검색서비스, Enswer.net

정보검색 2008/09/29 10:42 Posted by 마루날
Enswer.net

지난 토요일(9/27) 보라매공원 앞 KTH 대회의실에서 스마트플레이스에서 주관하고 KTH가 스폰서한 7회 데모데이 행사가 있었다. 원래 IT업계의 블로거들의 네트워킹과 이슈에 대한 토론을 위한 IT난상토론회가 새로운 모습으로 업그레이드한 행사였다.

개인적으로 검색과 SNS에 관심이 있어서 참가를 하게 되었는데, 동영상 검색에 대한 새로운 가능성과 함께 기술의 한계를 함께 느낄 수 있는 시간이었다.

이름은 Entertatiinment + search의 의미로 Enswer라고 지었다고 한다.
사용자 삽입 이미지

[엔써즈의 과거]

사용자 삽입 이미지

[엔써즈의 현재]

서버를 조립PC써서 사용하는 거 보니.. 옛날 생각난다. T.T

Enswer.net은 현재 클로즈드 베타 서비스 중이다. 신청하고 한 3일정도 있으면 컨펌메일이 오더라

구글 비디오 검색과 경쟁하겠다는 엔써즈의 인력구성을 보면서 요즘처럼 인력 구하기 힘든 시기에 정말 대단한 분들이 모였구나 하는 생각을 하게 된다.
사용자 삽입 이미지

[앤써즈 목표]

사용자 삽입 이미지

[앤써즈 ]



동영상 검색의 한계

UCC라는 것은 동영상과 동의어로 여겨질 만큼 앞으로 생산되는 컨텐츠에서 동영상이 가지고 있는 비중은 계속해서 높아질 것이다. 데이터가 쌓이면 검색을 해야 하는 것이 당연하기때문에 동영상 검색에 대한 필요성은 두말하면 잔소리이다.

이렇게 중요한 동영상 검색에도 몇 가지 치명적인 문제점이 있는데, 1)중복, 2)제목과 내용이 일치하지 않음, 3)저작권 침해 등이다.


Enswer.net의 해결방안

앤써즈의 해결방안은 한마디로 동영상 클러스터링이다.

텍스트 문서의 클러스터링과 달리 앤써즈는 동영상이라는 것이 결국 30프레임이나 10프레임 등으로 구성된 스틸이미지의 연속에 불과하기 때문에, 스틸이미지를 비교해서 중복여부를 판단한다고 한다.

기존의 이미지 비교는 원본과 사본의 차이를 구분하는 방식의 기술이 대부분이었는데, 앤써즈에서는 서로 다른 두 이미지의 유사도여부를 판단하는 식으로 기술을 개발하여서 그 정확도가 매우 높다고 한다.

위에서 언급했던 동영상 검색의 문제를 어떻게 해결했냐 하면

10초이상 겹치는 영상을 묶어서 클러스터를 만든다음 중복되거나 겹치는 동영상을 업로드된 시간을 기준으로 해서 가장 최초의 올라온 동영상을 원본으로 가정하고 나머지를 시간순으로 보여준다.

단순히 업로드된 시간 순으로만 보여지는 것이 아니라 해당 동영상의 어느 부분부터 겹치는지를 같이 제공하고 있어서 사용자에게 편리한 검색결과를 제공하고 있다.

또한, 클러스터링된 동영상의 메타 정보를 모두 활용하여 정확한 동영상 정보를 색인하여 검색결과의 정확도를 제고하고 있다.

이렇게 해서 기본적으로 중복문제를 해결 할 수 있고, 제목과 영상이 일치하지 않는 것도 걸러내기 쉽고, 무엇보다 시간순으로 정렬이 되고 장면단위로 구분이 가능하기에 저작권이 걸려있는 시리즈물에 대한 모니터링도 가능하다.


앤써즈의 수익모델은?

아직은 뚜렷한 수익모델은 없다. 동영상 검색서비스가 활성화되어 트래픽이 일어나면 이를 가지고 광고 플랫폼으로 활용하려고 하는 것이 전부인데 사용자들이 굳이 'Enswer.net'에서 동영상 검색을 해야 하는 이유가 명확하다면 그만한 트래픽을 보장하겠지만 현재까지 사용해 본 서비스에 대해서는 조금 의구심이 남아있다.


그렇다면...

우선 동영상 검색의 당장의 문제점들인 중보이나 겹치는 문제를 해결한 것은 매우 뛰어난 기술력 때문이라고 보여진다. 하지만, 동영상 검색이라고 하는 서비스의 목표를 생각해보면 검색에 대해서는 그다지 차이점을 볼 수 없었다.

1) 정확도

만약에 구글이나 네이버에서 동영상에 대한 클러스터링을 적용해서 중복 영상에 대하여 해결하면 결국은 동영상의 메타정보를 활용하는 것은 똑같은데 베타서비스를 이용해보면 검색결과를 뽑아내는 랭킹에 대한 부분은 아직 메타 정보에 최적화된 방식이라고 보여지지 않는다.

처음 사용해보면 매우 정확해 보이지만, 자꾸 사용하다보면 깔끔하기는 하지만 여전히 키워드 검색에 불과하다는 것이다.

2) 재현율?

현재 3500만건의 동영상을 색인하고 있다고 하는데, 인터넷에 올라오는 모든 동영상까지는 아니라고 해도 얼마나 많은 동영상을 색인 할 수 있을지에 대해서 의구심이 든다.

스틸이미지 자체에 대한 의미를 검색할 수 있기에는 현존하는 기술로는 상용화하기에 거의 불가능하다고 알고 있는데, 또 한번 확인했던 자리인것 같다.

그렇지만, 100대 정도의 조립 PC를 가지고 이정도의 서비스를 제공할 수 있는 앤써즈의 기술력을 높이 평가하고 앞으로는 '검색'이라는 부분도 좀 더 신경써서 더 나은 서비스가 되기를 바란다.

검색은 사용자의 Mind를 Read하는 것이라는 사장님의 말씀이 귀에 남는다. ^^



 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

TRACKBACK :: http://ithelink.net/trackback/321 관련글 쓰기

  1. DEMO DAY - 누리엔, 엔써즈

    Tracked from 젊은영과 태터앤미디어  삭제

    지난 토요일(27일) DEMO DAY에 다녀왔습니다. TNC에서 함께 일했던 꼬날님이 새로 옮긴 직장이 엔써즈라서 어떤 회사인지 궁금해 토요일 오후 잠의 유혹을 뿌리치고 다녀왔습니다. 매번 그렇듯 스마트플레이스에서 주최한 행사에는 많은 분들이 참여해서 두 회사의 서비스에 대해 관심을 가지고 지켜보시더군요. 동영상검색 엔써즈 - http://enswer.net/ 현재 클로즈베타 테스트중으로 메일을 통해 베타테스터를 모집중입니다. 지난번에 오픈베타를 잠..

    2008/09/29 18:17
  2. 동영상 검색 Enswer.me의 Demo Day 참가기 [후기 이벤트 中]

    Tracked from 동영상검색 Enswer.me - Official Project Blog  삭제

    여러분 Demo Day라는 행사를 아시나요? IT 전문 팀블로그인 스마트플레이스가 주최하는 행사로, 새롭게 창업했거나 창업을 준비 중인 회사가 대중에게 회사와 서비스를 소개할 수 있는 자리입니다. 말하자면 신인들의 데뷔무대인 셈이죠. 지난주 토요일 개최된 제 7회 Demo Day에는 동영상 검색 Enswer.me 와 3D SNS 누리엔이 여러분 앞에서 데뷔 무대를 가졌습니다. 저희 Enswer.me Team은 여러분 앞에 훌륭한 데뷔 무대를 선보이고..

    2008/09/29 21:45
  3. 내가 쓰고 싶은 멀티미디어 검색 - 입력창에 이미지를 넣게 해줘!

    Tracked from Roess' 127.0.0.1  삭제

    EnswerMe 엔서미(EnswerMe)는 새로 떠오르고 있는 국산 동영상 검색 엔진입니다. 현재 클로즈 베타 상태에 들어가 있고&nbsp; 최근 스마트플레이스 주관의 Demo Day 행사에서 시연과 전략 브리핑을 해서 뉴스도 탔는데 그 내용은 마루날님의 블로그에서 자세히 볼 수 있습니다. 메인 페이지에서 이메일 주소로 테스트 계정 신청하면 하루이틀 안에 금방 계정을 만들 수 있습니다. 처음 이 동영상 검색의 소식과 데모를 보...

    2008/09/29 23:30
  4. [엔써즈] 동영상 검색, 이쯤은 돼야지

    Tracked from 링블로그-그만의 아이디어  삭제

    정말 오랜만에 '물건' 하나 발견한 느낌입니다. 요즘 포스팅을 쉬고 다른 일에 몰두해 있을 때쯤 제 7회 데모데이(Demo Day) 에 어렵사리 참가할 수 있었습니다. 아이를 맡길 곳이 없어서 전전긍긍하다가 다행스럽게도 가족들의 배려로 데모데이에 참가했죠.(스마트플레이스 멤버이긴 하지만 활동이 너무나 없는 '죽은' 멤버인지라 제대로 돕지도 못했네요. ^^) 데모데이에서 두 곳의 데모가 있었죠. 뒤늦게 후기 겸 날림 포스팅합니다. ▶ 3D 소셜 네트워..

    2008/09/30 13:28
  5. 제 7회 Demo Day 후기 및 정리

    Tracked from 스마트플레이스  삭제

    안녕하세요. 네오비스입니다. 토요일에도 불구하고 많은 분들의 참여와 성원에 힘입어 제 7회 Demo Day를 잘 마무리 할 수 있었습니다. 근래 진행하였던 행사 중에서 가장 반응이 좋았고, 이를 증명하듯 새벽까지 이어지는 뒷풀이에도 불구하고 20명 가량의 인원이 끝까지 남아서 강철체력을 자랑해 주셨습니다. 매일 컴퓨터를 보고 계실 텐데 체력 하나는 정말 대...

    2008/10/01 18:22
  6. 제7회 Demo Day 후기

    Tracked from 전산쟁이 wizmusa의 IT 이야기  삭제

    2008년 9월 29일 스마트플레이스 주관 하에 파란 본사의 대회의실에서 열린 제7회 데모 데이에 참가했습니다. 이젠 익숙해진 난상토론회입니다. 파란의 대회의장도 한결 눈에 익었습니다. 자원봉사자가 좀 늘어난 느낌이었어요. 2시가 되니 회의장이 얼추 찼습니다. Demo day로 바뀐 이후로는 처음이라 어떻게 진행할지 궁금했습니다. 아이스 브레이크 때 파란 관계자 분이 말씀하신 게 인상적이었습니다. 알고 보니 풍선 장식을 파란에서 해 준 것이었네요...

    2008/10/02 09:07
  7. Enswer.me 트랙백 이벤트 당첨자 발표~ (두둥~)

    Tracked from 동영상검색 Enswer.me - Official Project Blog  삭제

    안녕하세요~ 동영상 검색 Enswer.me 홍보팀의 꼬날입니다. ^^V 화창한 가을날이었습니다. 낮에는 햇볕이 쨍쨍, 살짝 여름 느낌마저 나더군요. 모두들 즐거운 월요일 하루를 보내셨나요? 무려 3주 전에 걸었던 Enswer.me 데모데이 후기 트랙백 이벤트 당첨자를 발표하겠습니다. 마루날님 / Roess'님 / Kong님 / 작은인장님 / Promise4u 님 / 젊은영님 / David.C님 그만님 / wizmusa님 / 학주니님 / 열이아빠님 /..

    2008/10/21 09:27

댓글을 달아 주세요

큐로보 아이폰 버전 사용해보니..

정보검색 2008/09/09 13:43 Posted by 마루날
큐로보 아이폰 버전

시멘틱 기반으로 개발되었다고 해서 평소에 눈여겨 보고 있는 검색서비스 업체인 시멘틱스의 큐로보에서 아이폰 버전이 나왔다는 기사를 보고 직접 실행해 보았다.

관련기사 : 시맨틱스, 세계 최초 모바일 비쥬얼 검색 '큐로보 아이폰버전' 공개

비쥬얼 검색이라고 하는 것은 검색결과를 비쥬얼하게 보여주어서 사용자가 편리하게 자신이 원하는 정보를 찾을 수 있도록 도와주는 검색서비스이다.

검색결과 리스트를 일일이 클릭하고 브라우징하면서 검색결과의 내용을 확인해야 하는데, 비주얼 검색을 활용하면 일일이 클릭하지 않아도 웹 페이지가 이미지 형태로 보여지기 때문에 바로 원하는 정보인지 여부를 확인할 수 있기 때문이다.

1. iPod Touch에서 Safari로 www.qrobo.com/i 로 접속
사용자 삽입 이미지

2. 우선 요즘 블로그스피어에서 대유행인 크롬을 검색해 봄
사용자 삽입 이미지

사용자 삽입 이미지

크롬바커라는 맥주 관련 검색결과에 이어
사용자 삽입 이미지

크롬에 대한 검색결과가 나온다.

앞서도 말했지만, 비쥬얼 검색의 특성은 검색결과 내용을 미리 보여준다는 것인데, '크롬'이라고 검색했을 때 결과는 당연히 비쥬얼 보다는 텍스트 기반의 정보가 더 유용할 테니 검색어 선정에서 적절하지 못했던 것 같다.

그래서 다시 기아에서 새롭게 나온다는 '쏘울'이라는 차를 검색해 보았다.
사용자 삽입 이미지

사용자 삽입 이미지

쏘울에 이미지를 보자고 검색을 했기 때문에 3번째에 나온 검색결과만으로도 만족할 수 있지만, 첫번째 검색결과의 경우 (9/9, 오후 1시 30분 현재) 이미지가 보이지 않았고, 상위 검색결과 모두 본문의 윗부분에 '쏘울'이 포함되어 있어서 상위에 랭크된 것으로 보여진다.


사용해보니


1. 속도가 너무 느리다

아직은 초기 버전이어서 그런지 생각보다 매우 느리다. 아마도 검색엔진 자체의 문제라기 보다는 시범적으로 서비스를 제공하기 때문에 내부에 시스템을 넉넉하게 준비하지 않아서 그러지 않나 싶다.

쏘울이라고 검색어를 입력하고 2분이 지나서야 검색결과가 나온다. OTL



참고로 구글 검색을 해보면 7초가 안되서 검색결과가 나온다. 물론 큐로보의 경우 이미지를 로딩해야 하는 이유도 있기 때문에 단순비교는 곤란하지만, 모바일 검색이라는 특성상 사용자가 이동중이거나 즉시 필요한 정보를 검색할 때 사용하다보니 검색결과가 느리게 나오면, 사용자는 당연히 다른 검색을 사용하게 된다.



지금(9/9, 오후 2시 20분)은 빨라졌다. -_-;;;


2. 사용자 설정 기능 아쉽다.


모든 질의어에 대해서 비쥬얼 검색이 편리한 것은 아니다. 특히나 모바일 검색에서는 단말기가 가지고 있는 액정 사이즈의 제약을 고려한다면 검색어 중에서 이미지를 보여주는 것이 적합한 검색어와 아닌 검색어에 대한 옵션을 제공하면 좋을 듯 하다.


3. 웹 버전의 큐로보에 비해서 정확도가 떨어진다?

개인적인 착각일 수도 있지만, 10여개의 질의어를 넣어봤는데, 검색결과가 웹 버전에 비해서 덜 정확해 보인다. 정확도를 정성적으로 판단하면 안되지만, 10여개의 검색결과 중에서 상위 5개의 결과가 썩 만족스럽지 못하다.

다른 글
에서도 이야기한 적이 있지만, 모바일 검색에서는 정확도가 매우 중요한 요소로 작용할 것이기 때문에 이부분에 대한 보완도 필요해 보인다.


그럼에도 불구하고

몇 가지 아쉬운 점이 눈에 띄지만, 큐로보의 이런 도전에 박수를 보낸다.

첫눈이 흔적도 없이 녹아 없어져 버린 이후 국내 검색서비스에서 이렇다할 새로운 모습이나 도전이 눈에 띄지 않는데, 시멘틱을 가지고 이렇게 다양한 도전을 하는 시멘틱스와 큐로보가 앞으로 더 많은 성과를 내기 바란다.




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~


TRACKBACK :: http://ithelink.net/trackback/318 관련글 쓰기

댓글을 달아 주세요

구글과 버리이존의 제휴

오늘 뉴스를 보니 구글과 미국의 2위 이동통신사업자인 버라이존커뮤니케이션이 휴대폰 검색서비스분야에서 조만간 제휴할 것이라는 뉴스가 나왔다.

우리나라만 해도 풀브라우징으로 소수의 어얼리어답터 뿐만 아니라 일반 사용자에게 까지 핸드폰을 이용한 인터넷이 이제 할 만하다는 인식을 주었는데,

인터넷에서 가장 중요하고 기본적인 서비스가 검색이기 때문에 당연히 기존 유선 검색엔진의 주요 플레이어들도 모바일 검색(적절하지는 않지만, 이 포스팅에서 핸드폰을 이용한 검색을 모바일 검색이라고 부르겠음)으로 진출하고 있다.

지금까지는 유선 검색을 모바일 플랫폼에 포팅하는 수준이라면 미국에서 우리나라로 치면 KTF쯤 되는 버라이존과 제휴를 통해서 구글이 본격적으로 모바일 검색을 제공하려고 하는 것 같은데 과연 성공할 수 있을지 궁금하다.


모바일 검색의 특성

개인적으로 올 초에 올린 포스팅에서도 밝힌 얘기지만, 무선검색을 실제로 사용하는 사용자들에게 필요한 것은 검색결과 리스트가 아닌 ‘정확한 답변’이다.

모바일 검색은 유선 검색과 다른 2가지 특성이 있는데, 우선은 Mobile이라는 말 그대로 이동성이는 특성과 또 하나는 PC나 노트북에 비해 모바일 검색을 사용하는 기기의 입력장치는 불편하고 출력장치는 액정 사이즈의 제약으로 표시될 수 있는 텍스트나 이미지에 큰 제약이 있다는 기기의 특성이 있다.

모바일 검색에서 이동성이라는 특성은 모바일 검색결과에 현재 사용자의 위치나 시간과 관련된 Context 정보가 반영되어야 한다는 뜻이다. 단순한 상황인식 수준이 아니라 사용자 개인의 선호나 취향을 반영한 일종의 개인화의 성격까지 띠어야 한다는 것이다.

기기의 특성으로 보자면 유선 검색도 마찬가지이지만, 질의어의 단어는 1개를 넘지 않고 단어의 철자수도 많지 않을 것이다. 또한 검색결과를 보여줄 때도 유선 검색에서처럼 검색결과를 리스트를 보여주고 click & browsing을 통해서 검색결과에서 정보를 얻으라고 할 수 없다.

결국 모바일 검색은 정확한 답변(가능하다면 80바이트 이내의)을 해 줄 수 있어야 한다.

사용자 삽입 이미지
실제로 위키피디아에서 무선검색 항목을 살펴보면 꽤 많은 검색업체들이 있는데, 재미있는 것은 Q&A 형태의(대표적으로 AskMeNow같이 SMS로 질문을 보내면 SMS로 답을 해주는) 서비스 업체들이 많다.

그럼 이동성과 기기특성이라는 큰 난제를 품고 있는 무선검색을 구글이 잘 해 낼 수 있을까?
결론부터 말하자면, ‘아마도’이다.


구글이 가능한 이유

사용자 삽입 이미지
모바일 검색의 가장 큰 난제이자 특성인, 이동성과 기기특성을 해결하기 위해서 ‘정확한 답변’이 필요하다고 얘기했는데,

우선 ‘정확성’에 대해서는 검색엔진 자체의 정확성도 물론 필요하지만, 잠깐 언급했었던 개인화, 상황인지, LBS 등의 기술도 필요하다.

개인화, 상황인지, LBS는 장시간에 걸쳐서 대량의 데이터를 가지고 연구개발을 해야 상용적으로 적용 가능한 엔진이 나오기에 웬만한 기업에서는 이 기술적인 난제들에 대해서 엄두도 내지 못하지만,

이미 구글은 지도나 개인화 등의 서비스로 축적된 경험을 가지고 있고 구글 정도의 리소스라면 충분히 리소스(돈+시간+사람)을 투여해서 유용한 성과를 가지고 있지 않을까 하는 추측에서이다.

그리고 ‘답변’이라는 부분에서는 아마 구글은 기존의 검색결과 UI를 거의 그대로 사용할 것으로 보여진다.

‘답변’이라고 하는 것은 ‘요약’을 통해서 제공할 수도 있지만, 검색엔진 입장에서 가장 적합하다고 보여지는 결과 (e.g. 구글의 I’m Feeling Lucky)를 제공해도 되기에 어느 정도 사용자의 요구를 맞출 수 있을 것으로 보여지기 때문이다.

아직은 미국이라는 시장에서의 움직임이지만, 필요한 기술이나 서비스에 대한 넓은 경험을 쌓게 되면 꽤나 완성도 높은 무선검색이 나오지 않을까 생각된다.

IT 인프라의 패러다임이 점점 모바일로 움직이고 있는 마당에 승자 ‘구글’의 움직임은 매우 부담스러운 모습이다.



 마루날의 雜學辭典(잡학사전)을 편하게 구독해서 보세요~


TRACKBACK :: http://ithelink.net/trackback/305 관련글 쓰기

  1. 구글, 모바일 검색시장마저 휩쓸고 다니고 있다..

    Tracked from 학주니닷컴  삭제

    모바일 검색시장에서 구글의 독주가 쭉 계속되고 있는 상황이다. comScore는 구글의 모바일 검색이 미국에 이어 영국에서까지 타 검색서비스를 제치고 독주하고 있다고 밝혔다. 전체 모바일 검색시장에서 구글이 차지하는 점유율은 무려 60%고 미국에서는 63%, 영국에서는 무려 74%나 차지하고 있다고 한다. 야후는 미국에서 34.6%를 차지하고 있다고 한다. 가히 구글의 독주나 다름없다고 봐야 할 듯 싶다. 이전 포스트에서 MS가 RIM의 블랙베리에..

    2008/09/16 18:05
  2. 구글 모바일 소개/아이폰과 안드로이드용 지메일,캘린더 업데이트 소식

    Tracked from 아라의 글로벌 마인드 칼럼..think globally  삭제

    국내에 지메일 사용자가 많지는 않겠지만, 해외에서는 상당히 많은 사람이 사용하고 있어서 보통 야후 메일, 핫메일 다음으로 지메일을 꼽고 있다. 또한, 가장 발 빠르게 구글 모바일을 서비스했을 뿐만 아니라 아이폰이 나오자마자 바로 서비스를 했던 걸로 기억한다. 구글 모바일 소개 구글의 거의 모든 서비스가 모바일로 서비스된다. 구글 모바일의 제품 페이지를 보면 구글 검색, 지도, 지메일, 유투브, 캘린더, 노트, 뉴스, 리더, 아이구글, 문서, 블로거,..

    2009/04/14 01:08

댓글을 달아 주세요

  1. BlogIcon Wyatt  수정/삭제  댓글쓰기

    트랙백 주셔서 감사합니다. 좋은 글 잘 읽었습니다. 자주 방문하겠습니다.

    2008/08/26 23:09
    • BlogIcon 마루날  수정/삭제

      아이쿠 무슨 과찬의 말씀을요 ^^
      찾아주셔서 감사합니다.

      2008/08/27 00:16
  2. BlogIcon vermouth  수정/삭제  댓글쓰기

    트랙백해주셨네요^^

    2008/08/27 07:49

편리한 블로그 검색창 - Live Search!

정보검색 2008/08/19 17:46 Posted by 마루날
블로그에 글이 늘어나면서 검색이 제대로 되었으면 좋겠다는 생각을 해서 구글 검색창을 붙여 놓았는데, 검색창에 검색어를 넣게 되면, 검색결과가 새창으로 뜨게 되면서 사용하기에 불편하다고 생각했다.

그러다가 구독하고 있는 LEEGH.COM의 지인우인님의 글을 보고 바로 붙여 보았다.
사용자 삽입 이미지

오옷.. 생각보다 편하다.

우선 지인우인님 말씀처럼
블로그 위에 레이어를 띄워 검색 결과를 나타내주고 검색한 글을 클릭하면 새탭으로 띄워주므로 블로그 내에서 이동하지 않고 바로바로 알고자 하는 정보를 쉽게 찾을 수 있습니다.

[출처 : [Tip] MS live search 검색창 블로그에 달기]

블로그에 포스팅 되는 글이 늘어나고 찾아오는 방문객이 조금씩 늘면서 검색을 자주 사용하게 되는데, 검색 대상이 되는 데이터의 량이 많지 않기에 키워드 매칭 결과만으로도 충분히 만족할 만한 검색결과를 얻을 수 있다.

따라서, 사용자에게 이용하기 편리한 UI를 제공하는 것이 필요한데 그 부분에서 MS Live Search는 매우 유용하다.

MS Live Search 검색창 달기



 마루날의 雜學辭典을 구독하세요~

TRACKBACK :: http://ithelink.net/trackback/302 관련글 쓰기

  1. [Tip] MS live search 검색창 블로그에 달기

    Tracked from LEEGH.COM  삭제

    웹초보님 블로그 검색창을 보고 알게됬습니다. 요 검색창 좋군요. 블로그 위에 레이어를 띄워 검색 결과를 나타내주고 검색한 글을 클릭하면 새탭으로 띄워주므로 블로그 내에서 이동하지 않고 바로바로 알고자 하는 정보를 쉽게 찾을 수 있습니다. 요런 것이지요. (클릭하면 확대됩니다.)바로 설명 들어갑니다.1. 라이브 서치 검색창 웹서비스에 접속해서 고급검색창 '시작'을 클릭합니다.2. 아래 그림처럼 '웹사이트 검색'에 블로그 이름과 블로그 주소를 넣어줍니...

    2008/08/20 11:49

댓글을 달아 주세요

  1. BlogIcon 지인우인  수정/삭제  댓글쓰기

    제 글이 발췌되어 있는 것을 보니 많이 쑥쓰럽군요. ^_^;;;
    저도 블로그 내 검색에 대해 평소에 부족한 점이 많다고 생각했는데 요 라이브서치가 가려운 데를 제대로 긁어주었습니다. ^_^

    2008/08/20 11:51
    • BlogIcon 마루날  수정/삭제

      제가 하고 싶은 딱 그 느낌이어서 인용했습니다. ^^

      항상 좋은 글 잘 보고 있습니다.
      찾아주셔서 감사합니다. ^^

      2008/08/20 15:59

검색엔진에 대한 아내의 바램?

정보검색 2008/08/12 08:45 Posted by 마루날
어제 아내 검색에 대해서 몇 가지를 물어봤다. 얘기를 하는 중에 흥미로운 것이 몇 가지 있었다.

아내는 박사과정 중이라서 연구나 공부를 위해서 자주 검색엔진을 사용하는데, 주변에 검색엔진을 사용하는 사람들을 보면, 사람들마다 정보를 찾을 때 동일한 시간에 동일한 검색엔진을 사용해도 정보를 찾는 사람과 못 찾는 사람이 나뉜다고 한다.

검색을 잘 하는 사람과 못하는 사람에 대한 아내의 설명은 검색결과는 일종의 퍼즐과 같아서 자신이 정보를 - 알게 모르게 - 구조화할 수 있어야 검색결과가 유용하게 사용될 수 있다고 얘기한다. 

사용자마다 사용자의 수준에 맞는 검색엔진이 있다는 얘기인데..흥미 있는 지적이었다.

또한, 사용자가 검색결과를 일일이 확인하는 일 말고도 사용자 스스로가 검색결과를 퍼즐 맞추듯이 구조화해야 검색결과를 제대로 활용하는 거라는 이야기는 꽤 재미있었다.

사용자 삽입 이미지

[출처 : flickr.com]

네이버와 구글을 직접적으로 비교해보면 구글이 네이버에 비해 쓸데없는 정보가 적다고 한다. 논문과 관련된 국내외의 정보를 찾을 때 구글이 훨씬 빠르고 정확하게 찾을 수 있다고 한다.

검색엔진 결과가 정확하다고 사용자가 느끼는 것은 사용자가 자신이 찾고자 하는 정보를 질의어로 표현하고, 표현된 질의어로부터 중의성, 분야의 특성 등과 같은 요소를 검색엔진이 잘 이해하여 사용자의 의도에 맞는 검색결과를 제공할 때인 것 같다.

그래서 정확도(Precision)라는 요소보다는 적합도(Relevancy)라는 요소가 검색엔진에서 더 중요할 수 있을 것이다.

사용자 삽입 이미지

[출처 : flickr.com]

또한 질의어와 관련된 개인화에 대한 아이디어도 궁금해했다. 어떤 사람은 정보를 찾을 때 한두 단어만 입력하는 사람도 있고, 어떤 사람은 문장을 입력하는 경우도 있고, 어떤 사람은 연관된 정보를 찾기 위해(아마도 결과 내 검색을 말하는 듯 했다) 연속해서 질의어를 사용하는데, 검색엔진이 이러한 사람마다의 특성을 반영하여 최적화(즉, 개인화 검색) 되었으면 좋겠다고 말했다.

아내와 이야기를 하면서 검색엔진은 대부분 검색 대상 데이터의 특성만을 고려하여 서비스를 구성한다는 사실을 깨달았다. 정작 검색엔진 사용자에 대한 관심이나 사용자의 특성을 반영한 검색엔진은 아직도 실용화되지 못한 것 같다.

사실 개인화나 검색 UI(User Interface)로 대표되는 Usability나 User Behavior 분석은 검색엔진의 데이터를 어떻게 사용하는지에 대한 해석이기 때문에, 정작 사용자인 사람에 대한 고민이나 철학은 아직 없다고 봐도 무방할 것 같다. 이제는 검색엔진 사용자의 요구나 특성에 대한 연구나 검색엔진에 반영한 이제 시작되어야 하지 않나 하는 생각이 들었다.

아무튼, 모든 공부가 그러하듯이 논리적인 사고의 틀을 가지고 계속 들여다보면, 통찰력이 생기나보다. 가끔 뜬금없는 얘기를 할 때마다 그건 이래서 안되고, 저건 저래서 안된다고 받아주었는데, 어제 얘기를 나누면서 '경청'이라는 것이 참 중요하구나 하는 생각이 들었다.



 마루날의 雜學辭典을 구독하세요~

TRACKBACK :: http://ithelink.net/trackback/299 관련글 쓰기

  1. 검색의 성능 지표 - 체류시간과 재방문율

    Tracked from Effortless - 上善若水 - 상선약수  삭제

    검색의 성능 지표 - 체류시간과 재방문율 새로운 검색을 만드는 것은 흥미로운 일이면서도 도전적인 일입니다. 검색이라는 것이 필수불가결한 공공재의 성격을 띠고 있어서, 공익추구의 목표가 있어서 좋습니다....

    2008/10/07 06:37

댓글을 달아 주세요

야후 블로그 검색 미워요~ T.T

정보검색 2008/07/31 18:51 Posted by 마루날
열심히 하는 야후

야후코리아에서 포털 1위라는 옛 명성을 되살리기 위해서 다양한 노력을 하고 있다. 검색서비스도 정말 열심히 하고 있는데, 비즈니스 검색에 이어 블로그 검색이라는 검색서비스를 선보이고 있다.

블로그 검색은 크게 2가지의 특징이 있다. 하나는 블로그 명을 검색할 수 있고, 또 하나는 블로그 글을 따로 검색할 수 있다.

블로그는 앞으로 네이버의 지식인이나 다음의 카페를 따라잡을 수 있는 꽤 괜찮은 컨텐츠의 보고가 될 것으로 보여진다.

제대로 된 블로그 검색을 하자면 블로그의 구조상 기존의 웹 크롤러가 제대로 동작하지 않으니 완벽한 블로그 수집과 그에 앞서 블로그의 주소의 확보(이번 이벤트의 큰 목적 중 하나가 될 것이다.),

포스팅된 문서의 색인(중복문서를 체크하면서 검색의 결과를 정제하는 것은 좋은 것 같다.)을 위한 기존 색인구조와는 다른 색인시스템의 구축 등이 필요한 것이다.

포스팅된 문서를 가지고 clustering 또는 Classification 등을 통해서 또 다른 유의미한 내용을 찾아 낼 수 있을 텐데.. 열심히 노력하면 좋은 결과가 있겠지만, 이미 블로그 검색은 나루라는 걸출한 신인이 자리를 잡으려고 하고 있지만, 실제로 크게 활성화되지는 못했다.

그래서 그런지 야후에서는 블로그 랭킹이라는 것을 들고 나와서 마케팅 차원에서도 노력을 기울이고 있는데, 블로그의 글의 수나 포스팅 횟수, 댓글수, 트랙백수와 같은 정량적인 요소를 가지고 랭킹을 정하는 것 같다. 블로거들은 이런 류의 뱃지를 다는 것을 좋아하니까..

지민아빠님의 '야후 블로그랭킹 정말 믿을만 한 건가?' 포스팅에 의하면 '링크'도 중요한 요소 중 하나라고 한다.

어차피 블로그의 포스트를 수집해야 하고 수집하다 보면 블로그의 글의 수, 포스팅횟수, 댓글수, 트랙백수는 자연스럽게 확보가 되니까 블로거들의 관심을 유도하기 위해서 시행한 것 같은데 꽤 재미있는 시도이다.


하지만… 난 별로다!!!

올해의 블로거 TOP100에는 속하지 못해도 적어도 상위 1000등 안에는 들어갈 거라고 스스로 대견스러워했는데.. 이거 뭐냐.. 5천등도 아니고 5만등!!!

그런데, 자세히 보니 약간 오류가 있다.

내 블로그는 총 2개이지만 메인 블로그에 글이 167개가 공개되어 있는데, 실제로 수집된 글은67개라고 한다. 나머지 100개는 어쩐거냐? T.T
사용자 삽입 이미지

[증거화면 1]


사용자 삽입 이미지

[증거화면 2]


그러면서 전체글을 최신순으로 검색한 결과라는 이야기를 할 수 있는거야~~

이건 다 무효다.. 무효 OTL

학창시절에 이렇게 등수에 목을 메었으면 벌써 SKY를 갔을 텐데…
아무튼 야후 검색팀의 님들하.. 이거 좀 수정해주라
수정하면 못해도 몇 백 등은 올라갈 것 같아

에혀~




 마루날의 雜學辭典을 구독하세요~

TRACKBACK :: http://ithelink.net/trackback/295 관련글 쓰기

  1. 야후 블로그랭킹 정말 믿을만 한 건가?

    Tracked from 지민아빠의 해처리  삭제

    야후 블로그 랭킹이 7월 29일 날짜로 업데이트가 되었습니다. 랭킹이 많이 바뀌었는데요.. 제 블로그 랭킹도 바뀌었습니다. 6월 버전에서는 보도자료등이 펌글로 잡히더니 이제 이걸 빼버리는 듯 합니다. (와~ 이런건 생각보다 쉽지 않을 듯 한데요 ^^) 자아 그래서 업데이트 된 자료를 다시 분석해 보았습니다. 야후 블로그 랭킹 TOP 1000 !!! 분류 야후 블로그 랭킹 한RSS 인기 RSS 비고 네이버 블로그 179 -> 166 (16.6%) 71..

    2008/08/01 11:49
  2. 블로그코리아 개편 1주년 잔치 단상 및 연상들 : 야후의 이상한 블로그랭킹

    Tracked from 민노씨.네  삭제

    * 사소한 거 하나. 나는 1주년 잔치라고 할까, 1주년 파티라고 할까 잠시, 약 5초 동안 갈등하다가, 결국 잔치라고 쓰고 나서, 그냥 파티라고 쓸걸 그랬나, 이러고 있다(스스로 뭐하고 있는거냐... 이런 마음이 드는데...). 글쓰는 과정에서는 이런 사소한 변수들이 항상 존재한다. 이런게 나에겐 정말 미묘한 건데... 이게 잘 풀리면 생각도 덩달아 잘 풀리고, 여기서 막히면 생각들도 꼬인다. 그냥 그렇다는거다... : )* 동아리 창립기념 파티...

    2008/08/01 15:05
  3. 야후에서도 블로그 랭킹이란게 있구나;

    Tracked from UNLIMITED RENEWAL WORKS  삭제

    야후라는 사이트.. 제가 인터넷 세계에 처음 손을 댈때를 제외하곤 안중에도 없었던 사이트입니다.. 라기보다는 야후에서 검색하기보다 차라리 네이버나 다음에서 검색하는게 더 낫더라..라는 생각이 들었기때문에 알타비스타를 안쓰게 될 쯔음에 야후도 같이 안쓰게되었달까.. 조금 알게되고난 지금은 네이버도 다음도 안쓰고 구글을 쓴달까.. 그런 이유로 야후를 멀리 해왔습니다만.. 물론 일본쪽이나 미국쪽 자료를 찾을땐 구글보다도 조금 더 설명이 잘되어있는 야후를..

    2008/08/01 17:30
  4. 야후 블로그랭킹에 대한 강팀장 생각

    Tracked from 강팀장의 WEB E.Y.G (웹 이야기)  삭제

    강팀장은 블로그는 그래도 아직까지 자유로운 공간이라고 생각합니다. 1인 매체다… 어떻다…. 이제는 순수 블로그의 기능만으로는 그 재미를 다한건지… 몇년동안 블로그를 사용해오면서 아직도 "블로그 너의 정체는 뭐야?" 반문하고 있는 강팀장에게는 순수 재미의 블로그 재미를 다 느끼기도 전에 순위를 매기는 서비스가 나왔습니다. 강팀장 넌 몇 위나 되는거야? 하는 호기심에… 등록하고, 확인을 해 봤지만,…. 보면 볼수록… 왠지 모를 씁쓸한 생각까지 들게 합...

    2008/09/05 13:02

댓글을 달아 주세요

  1. BlogIcon Ashley  수정/삭제  댓글쓰기

    seal 타고 왔습니다 ㅎ 안그래도 저도 해봤는데 은근 오류가 많은 거 같더군요 -_-..
    제꺼 등록을 하고
    분명 등록했다고 메일도 왔는데
    찾아보니 안쓰는 다른 사이트에 등록된 블로그는 다 등록되어있는데 정작 제가 신청한 블로그는 등록이 안되어있는 이런 뭥미한 상황-_-
    따지기도 귀찮아서 그냥 안쓰기로 ;;;

    2008/08/01 02:52
    • BlogIcon 마루날  수정/삭제

      아직은 완성도가 미흡한 부분도 있습니다만, 재미있는 시도인 것 같아서 보기에는 좋습니다. ^^

      그런데, 실타래를 타고 다닐수 있나보군요?

      찾아주셔서 감사합니다. ^^

      2008/08/01 10:25
  2. BlogIcon 지민아빠  수정/삭제  댓글쓰기

    야후랭킹은 링크를 중요시 하는 것 같습니다. 꼭 1000등 안에 올라가시길 기원해 봅니다. ^^

    2008/08/01 11:50
    • BlogIcon 마루날  수정/삭제

      좋은 글 트랙백 걸어주셔서 잘 보았습니다. 본문에도 참조로 내용을 삽입하고 링크도 걸었습니다.

      찾아주셔서 감사합니다. ^^

      2008/08/01 13:43
  3. BlogIcon 야후! 서치지기  수정/삭제  댓글쓰기

    마루날님, 안녕하세요~ 잘 지내셨나요? ^^ 비즈니스 검색 간담회때 뵙고 이렇게 온라인에서 인사드리게 됐네요. 항상 야후! 검색에 대한 관심과 좋은 의견 감사드립니다. 미움 받지 않도록 열심히 잘 하겠습니다;;;

    야후! 블로그 랭킹의 상세정보에 있는 전체글 수는 이미 잘 아시겠지만, 야후! 블로그 검색에 색인된 문서 숫자 입니다. 일부 블로그의 경우, RSS를 통해 해당 블로그의 문서를 수집합니다. 마루날님의 블로그를 RSS로 불러와 색인한 시점에서 누락됐던 과거 데이터가 그대로 빠져있는 것으로 보이며, 다른 블로그에서도 동일한 문제가 있기 때문에 RSS로 데이터를 수집한 블로그의 경우 다시 전체 크롤하는 근본적인 해결책을 마련 중에 있습니다. 당장 된다고 말씀은 못 드리겠지만, 반드시 해결해서 미움 받지 않도록 하겠습니다.

    말씀하셨던 clustering 등도 다양한 아이디어를 내면서 고민 중에 있습니다. 바쁘시겠지만, 조만간 오프라인 등에서 뵐 수 있으면 말씀 드릴 기회가 있을 듯 합니다. 좋은 피드백 감사합니다.

    2008/08/01 16:30
    • BlogIcon 마루날  수정/삭제

      넷.. 그렇군요

      순위에 눈이 멀어서 그만...^^;;;
      늘 새로운 도전에 기대가 됩니다.

      수고하세요

      2008/08/01 17:05
  4. BlogIcon 카르사마  수정/삭제  댓글쓰기

    제 641개의 글들도 270개를 제외하곤 수집되지 않았더군요.;;
    하긴 네이버에서도 다음에서도..야후보다 숫자만 좀 많을뿐 모두 수집된건 아니니까요.
    수집이 안됐다고 해도 될런지 모르겠지만 위의 세개의 포털에선 그 글들이 검색조차 안되더라구요.
    단 하나 구글만 제외하고.. 구글은 626페이지에 있는 글의 단어 하나를 넣어서 검색해도
    뜨더군요. 그것도 맨 위에.;

    2008/08/01 17:30
    • BlogIcon 마루날  수정/삭제

      야후 서치지기님의 댓글이 조금은 설명이 되지 않았나 싶습니다.

      실제로 블로그를 수집해오는 것은 기존의 웹문서와는 달리 조금 까다로운 것 같더군요 ^^

      찾아주셔서 감사합니다.

      2008/08/01 17:45
    • BlogIcon 카르사마  수정/삭제

      아..그러고보니 위에 그 댓글이 있었군요.;;
      현재 랜카드가 맛이 간 상황이라 간당간당해서
      다른글을 더 읽어볼 기회가 없답니다.ㅋ

      2008/08/01 17:58
  5. BlogIcon Mr.번뜩맨  수정/삭제  댓글쓰기

    컴퓨터 시스템이 측정하는 이상 세부적으로 파악은 한계가 있기 때문에 모두 정확한 건 아니라고 봐요..^^;

    2008/08/03 16:38
  6.  수정/삭제  댓글쓰기

    비밀댓글 입니다

    2008/08/25 10:19

정보의 Long Tail

예전에는 사람들이 원하는 정보는 상위 20%에 몰려있다고 생각했다. 하지만, 검색엔진을 운영하면서 사용자들의 질의어를 보면 확실히 아래의 그래프(?)와 비슷한 Long Tail 형태로 정보가 소비된다.

정보의 생산이라는 측면에서 보자면 전문적인 업자들이 대부분의 정보를 만들어내겠지만, 아주 얇게 좌악 퍼져나가는 생산량은 얼마되지 않은 수 많은 정보생산자들이 존재하고 있다.
사용자 삽입 이미지

[출처 : flickr.com]


정보의 생산과 소비라는 측면에서 검색엔진은 주요한 역할을 담당하고 있다.

정보의 생산자들에게는 미지의 소비자들에게 검색엔진 검색결과를 통해서 알려진다는 의미가 있고, 정보의 소비자들에게는 자신이 원하는 정보를 검색결과에서 찾게 된다.

하지만, 실상은 Long Tail이 존재하지 않는다.


친절한 검색엔진씨

국내 검색 트래픽의 대부분의 차지하고 있는 네이버와 다음의 검색결과이다. 정보의 Long Tail이라는 측면에서는 포탈 자체의 컨텐츠 보다는 블로그와 웹 문서처럼 포탈 외부(?)의 검색결과를 확인해 보았다.

1) 네이버의 블로그와 웹 검색결과
사용자 삽입 이미지사용자 삽입 이미지

놀랍게도, 1000개의 검색결과만 보여준다. 사실 1000개 정도를 넘어서면 단순히 검색 질의어와 매칭하는 단어가 존재할 뿐 정보로서는 무의미하다고 볼 수도 있다. 하지만 정보의 유용성을 누가 판단하느냐가 문제가 된다.

친절한 네이버씨라고 생각할 수도 있지만,1000개의 검색결과만 보여주는 것은 웹의 형평성에 너무나 어긋나는 행동이다. 실제로 검색결과 12만개를 다 흝어보지는 않겠지만, 12만개 중 상위 1000개에 사용자가 원하는 모든 정보가 다 있다고 확신할 수 있나?

어차피 사용자는 자신의 정보 요구를 '질의어'로 표현하지만, 제대로 표현하지 못할 것이고 무엇보다 해당 검색시스템에 적합한 형태의 질의어가 어떤 형태인지 모르기때문에 더더욱 질의어에 대한 검색결과를 보여주는 것은 신중해야 한다.


2) 다음의 검색결과
사용자 삽입 이미지




다음의 블로그 검색결과를 보면서.. 당연히 검색은 이렇게 공정해야지 하다가 웹 문서 검색결과를 보면서 완전 당황했다. 이거 뭡니까?

아무리 불친절하고 거칠기로 유명한 다음이라지만, 네이버에 비해서 왜 이렇게 매끄럽지 못할까?  보여주려면 다 보여주든지, 아니면 친절한 네이버씨처럼 적절하게 클로징을 해야 하는데.. 이거 뭐하는 시츄에이션?

다음은 한국축구의 현실을 보여주는 듯 하다. 골문 앞에서 마무리 부족... OTL


아무튼...

트래픽이 돈이 되면서 포털사이트가 관문이 아니라 섬으로 변하게 되고, 한명의 사용자도 섬 밖으로 못나가게 하는 포털의 전략에서는 당연히 검색결과를 제한하는 것이 맞다고 보겠지만,

무엇보다 검색해서 나오지 않는 것은 존재하지 않는다고 단언할 수 있는 시대에 이렇게 무 자르듯 검색결과를 잘라내는 것은 친절한 행동이 아니라, 교묘하게 정보를 통제하는 행동이라고 밖에 볼 수 없다.

정보의 유용성 판단과 볼지 말지에 대한 판단은 사용자들 한 사람 한 사람의 몫이고 책임이다.

검색결과에 대해서 손대는 행동은 어떤 이유에서도 용납되어서는 안된다.






 마루날의 雜學辭典을 구독하세요~

TRACKBACK :: http://ithelink.net/trackback/292 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon Krang  수정/삭제  댓글쓰기

    보통 어떤 결정을 얻을때 검색해서 판단하는 것이 최선이라고 생각하지만
    내가 그 결정을 하게끔 누군가가 이미 경로를 만들어 놓은게 아닌가 생각해본적이 있습니다.
    1000개의 검색결과만이 최상의 검색임을 자신하는 포털의 근거는 무엇인지 궁금하군용..

    2008/07/24 00:37
    • BlogIcon 마루날  수정/삭제

      아마 근거를 대라고 하면 검색 로그를 기반으로 한 통계데이터를 댈 것 같습니다.

      어찌되었든지 사용자들이 설령 클릭을 한번도 하지 않은 데이터도 공정하게 검색결과에 나와야 하고, 검색결과를 이용하는 것은 사용자에 의지에 의해 결정되어야 한다고 생각합니다.

      친절한 척 하지만, 결코 친절하지 않은 포털들의 모습입니다.

      2008/07/24 08:43
  2. BlogIcon 아톰  수정/삭제  댓글쓰기

    정보 검색 정말 어려워요...
    난 지금 포기상태...
    그래서 그나마 네이버나 구글이 존경스럽죠...
    그냥 뭔가 재밌는 꿈을 꾸었었던것 같은 느낌

    2008/08/03 03:12
    • BlogIcon 마루날  수정/삭제

      사실 검색엔진 자체는 만들기가 그렇게 어렵지 않습니다.^^;;

      다만, 만들어 놓은 시스템에 여러 가지 아이디어를 반영하는 것이 쉽지 않을 뿐입니다.

      달리는 기차의 엔진을 바꾼다는 이야기가 딱 맞는 것이 검색서비스이구요. 따라서 노하우도 정말 중요합니다. ^^

      찾아주셔서 감사합니다.

      2008/08/04 08:49

evri : Search less, understand more

정보검색 2008/07/22 16:27 Posted by 마루날
www.evri.com

어떻게 이곳을 알게 되었는지 도무지 기억이 나지를 않는다.

처음에는 스팸인줄 알고 지우려고 하다가 내용을 보니.. 그런 메일이 아니었다 .소위 closed best service에 대한 초대장이었다.

www.evri.com에 가서 이메일을 등록하면 며칠 있다가 오니까 한번씩 사용해 보셔도 되지만, 실제로 제공되고 있는 것은 서비스 소개 형태의 데모뿐이어서 실제로 볼 내용은 이 포스팅에서 소개하는 것이 전부이다.

이 검색엔진은 click & browsing을 최소화하면서 원하는 정보를 구조화하여 보여준다. 예를 들어서 미국의 유력한 민주당 대선 후보인 버락 오바마를 클릭하면(현재는 검색결과에 대해서만 보여주고 있다. 실제로 원하는 정보를 찾을 수 있는 검색 창은 beta test에서 제공하고 있지 않다.) 다음과 같은 결과를 보여주면서 최근 버락 오바바와 관련된 정보를 연결하여 한 눈에 볼 수 있는 형태이다.

사용자 삽입 이미지

그리고 검색결과 리스트에서 내가 원하는 정보를 찾기 위해 click & browsing을 하지 않아도 될 만큼 원하는 정보를 구조화하여 보여준다.

현재 evri에서 제공되고 있는 검색서비스는 Most popular people, Most popular places, Most popular things이다.

사용자 삽입 이미지사용자 삽입 이미지


사용해보니


실제로 내용을 보게 되면 크게 도움이 되는 내용이라고 할 수 없어 보인다. 하지만, 내가 거의 모르는 분야에 대해서라면 상당히 유용한 검색결과가 될 수 있을 것 같다.

검색에 있어서 사용자가 어려워하는 것은 사용자 본인의 정보요구를 명확한 검색 질의어로 표현하는 것을 잘못한다는 것인데, 더욱이 사용자가 익숙하지 않은 분야에 대한 정보검색에 있어서는 이런 식으로 관련된 정보를 연결시켜 보여주는 것은 매우 유용해 보인다.


그렇다면...

검색엔진은 사용자가 원하는 정보를 찾아주는 것이라고 알고 있지만, 이제는 원하는 정보를 '알려'주는 것으로 변하고 있다. 이것이 '진화'인지, '변이'가 되는지는 알 수 없지만, 결국 사용자들이 원하는 정보를 '찾아'주든지, '알려'주어야 한다는 점에서는 원하는 정보에 대한 대응이라는 대명제는 변한 것이 없지만, 원하는 정보를 어떻게 제공할 것인지에 대해서는 정말 다양한 시도들이 이루어지고 있는 것 같다.

외국의 다양한 검색서비스를 살펴 보면서 항상 느끼는 것이지만 아무리 우리나라 시장이 작다고 해도 좀 더 다양한 시도들이 여러 곳에서 있었으면 좋겠다.



 마루날의 雜學辭典을 구독하세요~

TRACKBACK :: http://ithelink.net/trackback/291 관련글 쓰기

댓글을 달아 주세요

스마트플레이스 Demo Day

IT난상토론회라는 언컨퍼런스를 호스팅했던 스마트플레이스가 새로운 버전의 모임을 최근에 호스팅했는데, 이름하여 Demo Day인데요.

우리나라에서 새롭게 인터넷 서비스를 준비하는 창업자 및 예비창업자 분들을 모시고, 서비스에 대한 여러 이야기들을 들어보는 시간이였는데 최근에 태어난 아들넘때문에 가지는 못하고 후기를 보다가 재미있는 서비스를 보았다.


DABOT(dabot.net)

사용자 삽입 이미지

이미지와 UCC와 같은 멀티미디어 정보를 찾아주는 서비스인데, 생각보다 꽤나 쓸만하다.

예를 들어서 조선일보에 대한 MBC 뉴스후의 내용을 담고 있는 동영상을 내가 찾고자 한다면, 보통은 검색엔진에서 '뉴스후'와 '조선일보'를 질의어로 입력하여 정보를 찾게 된다.
사용자 삽입 이미지

조선일보의 거짓보도를 까발린 뉴스후 보도 : 꼭 보세요~


사용자 삽입 이미지

구글 검색결과 : 원하는 정보를 찾기 쉽지 않다.



검색엔진으로는 원하는 정보 - 특별히 UCC나 이미지 - 를 찾는 것이 쉬운 일이 아니다.

기본적으로 검색엔진은 텍스트 기반의 컨텐츠/정보를 찾는 목적으로 연구/개발되었기 때문에, 이미지나 동영상을 검색할 때도 이미지나 동영상의 캡션이 태그 정보를 색인하여 검색하는 것이 대부분이다.

DABOT 역시 이미지나 동영상의 캡션이나 태그 정보를 기반으로 검색결과를 젝공하는 것으로 보여진다.

아직 포털에서 제공하는 이미지나 동영상 검색은 대부분 자신들이 가지고 있는 내부 정보(?)에 대한 검색이라서 DABOT처럼 인터넷에 올라와 있는 정보에 대하여 검색결과를 제공하고 있지 않기때문에 이미지나 동영상을 검색할 때 꽤나 유용한 서비스이다.

사용자 삽입 이미지

DABOT의 '뉴스후 조선일보'질의어에 대한 검색결과


검색결과를 확인해 보면 대부분의 정보가 내가 의도했던 동영상 정보를 담고 있는 블로그 등의 결과를 제공하고 있어서 쉽고 빠르게 원하는 정보를 찾을 수 있었다.


그렇다면...

하지만, 1인 개발 서비스여서 그런지 몰라도 질의어나 색인어 파싱에 사용하고 있는 형태소분석기 또는 파서가 단어의 중의성이나 동음이의어나 동의어 처리에서 부족해 보이고 이부분은 아직은 좀 더 튜닝해야 할 것 같아 보였다.

사실 튜닝이라기 보다는 관련된 사전 등이 보완되면 되는데, 이 작업은 대부분 수작업을 통해서 시간이 많이 걸리는 일인지라...현재의 1인 개발 서비스에서는 쉽지 않아 보인다.

그래도 블로그/뉴스에서 이미지/UCC 검색이라는 아이디어는 매우 기발해 보이고, 실제로 사용자들이 가려운 부분이 아닐까 생각이 된다.

사용자 삽입 이미지

http://krauthammerlab.med.yale.edu/imagefinder/

이미 외국에서도 실무차원은 아니지만, Yale 대학교 연구실에서 특정 분야(의학)에 대하여 관련 논문 SET에서 이미지만 찾아주는 서비스를 파일럿 형태로 제공하고 있는데 실제 사용하는 대상은 소수일 수 있지만, 매우 유용한 서비스인 것 같다.

DABOT도 역시 국내에서 점점 늘어나고 있는 이미지와 동영상에 대한 전문 검색을 더 개선하고 강화하여 제공한다면 사용자들에게 어필 할 수 있는 경쟁력있는 서비스가 될 것으로 보여진다.



 마루날의 雜學辭典을 구독하세요~


TRACKBACK :: http://ithelink.net/trackback/289 관련글 쓰기

댓글을 달아 주세요

  1. BlogIcon 나란트  수정/삭제  댓글쓰기

    안녕하세요. 다봇 개발자 나란트입니다.
    이렇게 좋게 리뷰를 써주셔서 진심으로 감사합니다.
    아직은 모자란 부분이 너무 많습니다. 마루날님과 더불어 같이 발전하는 다봇이 되도록
    하겠습니다. 더위 조심하시길...

    2008/07/24 14:47
    • BlogIcon 마루날  수정/삭제

      아이쿠.. 찾아주셔서 감사합니다.
      좋은 검색엔진이라서 자주 이용하고 있습니다.
      더 많은 발전있으시기를 바랍니다. ^^

      2008/07/24 15:50

MS 파워셋 인수

정보검색 2008/06/27 14:19 Posted by 마루날
MS가 파워셋을 인수한다고?

관련기사 : "MS, 자연어 검색 '파워셋' 인수 추진"

한참 야후에 추파를 던지던 MS가 파워셋을 인수한다는 보도가 나왔다. MS가 몇년전부터 인터넷 사업전략을 수정하면서 북유럽 출신의 검색엔진 전문업체였던 'FAST'를 인수하는 등 검색기술 확보에 사운을 걸었다 싶을 만큼 인수합병에 적극 나서고 있다.

검색엔진 기술이라는 것은 일정수준까지는 진입장벽이 거의 없다 싶을 만큼 기술자체가 어렵다기 보다는 축적된 연구개발 성과에서 새롭고 개선된 엔진을 만들 수 있는 성격의 기술이다.

어느날 갑자기 검색엔진의 강자가 되고 싶다면, MS로서는 남아도는 현금을 쏟아부어서 전문기업을 사들이는 것이 어쩌면 해결책이 될 수 있다.


왜 파워셋인가?

잘 알려진대로 파워셋은 자연어검색을 표방하는 업체이다. 이미 ask.com이나 hakia.com과 같은 유사한 성격의 업체가 있는데도 파워셋을 선택한 것은 파워셋의 자산이 큰 영향을 준것은 아닌가 싶다.
사용자 삽입 이미지

파워셋은 2005년에 창립하였고, 2007년 2월, PARC(Palo Alto Research Center, Inc.  - 구 Xerox PARC)로부터 NLP 관련 특허, 원천기술, 인력 추가 확보하였다.[각주:1]

파워셋의 서비스 목표는 다음과 같다.
 - 대량의 컨텐츠로부터 의미 정보를 추출하는 것
 - 추출된 의미정보간의 관계를 매핑(Relation 규명)하는 것
 - 추출된 의미정보의 가치 평가

파워셋이 가지고 있는(있다고 주장하는)기술은 자연언어처리 기술( 형태소/구문/의미 분석 등), 의미사전 구축 기술(Ontology, Topic Map 등), 인공지능 기술(추론, 판단, 학습 등) 등이다.

자연어 질의어 문장 처리 가능 (e.g. Who did IBM acquire in 2003? )한 상태인데, 단순 Term Matching이 아닌 자연어처리로 정확도를 높이는 방식이다.

하지만, 사용자의 질의어로부터 충분한 정보를 얻지 못하면, 검색결과가 기존 검색엔진과 차이가 없다. 기존의 Ask.com 과 같은 자연어 검색엔진과 유사한 성능으로 보여지는데, 상용화 수준의 추론엔진이 결합된다면, 검색엔진의 패러다임을 바꿀 수 있을 것으로 보여진다.


그렇다면...


hakia.com이나 ask.com 같은 사이트처럼 2003년에 IBM이 인수한 회사에 대한 정보를 알고 싶다면 일반적으로 'IBM', '인수', '2003' 정도의 키워드를 묶어서 검색을 해본다. 실제로 이렇게 키워드를 입력한 경우 대부분의 검색엔진에서 정확한 검색결과를 기대하기는 어렵다.

구문관계나 질의어 문장에 대한 이해(?)를 바탕으로 검색을 하다보니, 구글과 같은 키워드 검색보다 정확한 검색결과를 제공할 수 있고, 앞으로는 이러한 자연어검색이 대세가 될 것이라고 파워셋은 주장한다.

자연어검색은 사용자의 정보요구를 명확히 할 수록 정보를 잘 찾아 줄 수 있다고 하는 컨셉에서 출발했다고 볼 수 있다. 자연어검색이라고 하면 우리나라는 이미 엠파스 등에서 써먹은(?) 한물간 기술로 생각할 수 있지만, 국내에서 실제로 자연어검색을 특정 도메인이 아닌 Public Domain을 대상으로 제공하는 서비스는 없다고 해도 과언이 아니다.

앞으로 진부하지만 좀 더 나은 검색엔진을 위해 자연어 질의어를 처리할 수 있는 검색이 등장할 수 있으면 좋겠다.



 마루날의 雜學辭典을 구독하세요~

  1. 개인적으로 이 부분이 MS에게 크게 어필하지 않았을까 싶다. 외국인 투자자들을 만나보면 IP(Intellectual property)에 대해서는 기본적으로 체크를 한다. [본문으로]

TRACKBACK :: http://ithelink.net/trackback/285 관련글 쓰기

댓글을 달아 주세요

BLOG main image
마루날의 雜學辭典(잡학사전)
소셜미디어, 웹 오피스, 클라우드 컴퓨팅, 소셜 서치, 모바일 에 관심 있음. 분석, 화내기 잘해요. 책읽기, 등산 좋아해요. 잠실, 올림픽공원 자주 가요. 모든 비린내 싫어해요. YO~
by 마루날

카테고리

분류 전체보기 (440)
e-Business (104)
Social Web (57)
eBook | office | Cloud (2)
Management (23)
독서일기 (127)
Startup (1)
모바일 (6)
정보검색 (101)
Etc. (19)

당신을 위해 준비한 모임

마루날's Blog is powered by Textcube. Designed by Qwer999. Supported by Tatter & Media.