Search results for '솔트룩스'

솔트룩스의 OMS, 트루스토리

2012.02.16 18:30
U-Story

오늘 "솔트룩스, 정치인 소셜분석 사이트 오픈"이라는 기사를 보면서 묘한 느낌이 들었습니다.

제가 2009년부터 여러 곳에 강의를 다니면서 사용했던 단어 중 하나가 스토리입니다. 최근 SNS를 통해서 온라인 컨텐츠가 폭증하면서 '빅데이터'라는 용어를 사용하기 시작했는데, '빅데이터' 안에 있는 데이터 하나 하나는 사실 '손님'들이 직/간접적으로 경험한 '이야기'이기때문에 스토리라는 용어를 사용했었습니다.

와이즈넛, 오픈베이스, 코난테크놀로지 등 대부분의 검색엔진 업체들이 이미 OMS(Opinion Mining Service)시장에 뛰어들었는데, 시멘틱과 언어처리 관련 기술을 보유하고 있는 솔트룩스도 이제 도전을 시작하는 것 같습니다.

솔트룩스 트루스토리 (http://www.truestory.co.kr)


빅데이터를 모아서 어떻게 분석하는지를 알려면 현재 보여주는 값과 지표를 참고하면 됩니다. 눈에 띠는 지표는 관심지수와 노출수 인데, 나머지는 시계열분석을 하고 값에 따라 정렬해서 보여주고 있는 것 같습니다.


관심지수

제가 추측하기에는 우선 정치인과 관련 키워드로 수집한 컨텐츠의 건수, 조회수(알 수 있다면),  댓글수, 트랙백수, 멘션, RT건수 등의 추가 데이터를 조합하여 만들어내었을 것 같습니다. 랭킹을 보면 관심지수를 만들어내는 수식에서 건수의 영향이 너무 큰 것으로 보여지는데요
 
이 부분은 채널(뉴스, 블로그, 트위터)에 따른 가중치 적용이 되어 있지 않거나 조정이 필요한 부분이 아닌가 생각됩니다.물론 뉴스로 기사화되거나 트위터에 언급이 많이 되는 것도 관심이기는 합니다만  단순히 언론이나 트위터에 많이 나온 것을 지수화하는 것은 큰 의미가 없기 때문입니다.
 
노출수

관심지수를 뽑기 위한 컨텐츠의 건수, 조회수(알 수 있다면),  댓글수, 트랙백수, 멘션, RT건수 등의 데이터에 대한 가중치를 포함한 총합으로 보여집니다.


감성비율

솔트룩스는 시멘틱과 언어처리 관련 기술을 보유하고 있는 회사이기때문에 수준이 어느정도인지는 모르지만 트위터만 대상으로 보여주는 것을 보면 단순한 문장에서 sentiment를 뽑아내는 것은 자동화가 되고 나머지는 여전히 사전작업 등이 필요한 시스템같습니다.

기타

호감지수와 함께 언급된 키워드에 따른 호감지수가 그나마 의미있는 결과인데, 사실 sentiment를 뽑으려면 키워드와 키워드의 관계도 분석할 때 고려해야 하기때문에 자연스럽게 결과가 분석된 것 같습니다.


그렇다면,

사실 모든 이야기에는 긍정/부정/Mixed/일반 등으로 구분할 수 있는 tonality가 있는데, 이를 긍/부정으로 구분하게 되면 노출과 관련된 데이터와 조합하여 실제적인 지지도에 근접한 데이터를 끄집어 낼 수 있습니다. 이 서비스에서는 베타이고 맛보기여서 핵심적인 지표는 보여주고 있지 않은데 그나마 호감지수가 근접한 지표로 보입니다.

OMS 비즈니스를 성공적으로 이끌어 가기 위해서는 빅데이터를 잘 수집해서 분석하여 데이터를 뽑아주는 것이 전부가 아닙니다. 오히려는 데이터를 분석하는 것에 집중하게되면 나무만 잘 그리고 숲을 보지 못하는 우를 범할 수 있습니다.

데이터를 정교하게 뽑는 것은 기본이고 중요하지만, 결론을 내려주고 방향을 잡아 줄 수 있어야 합니다. 물론 분석결과를 해석하는 것은 손님의 몫이라고 할 수 있습니다만, OMS를 통해서 뽑혀지는 데이터는 특성상 개별적으로는 매우 정확하지만 전체 그림을 그리고 맥락을 이해하기에는 어렵습니다.

구슬이 서말이어도 꿰어야 보석이라는 말처럼 왜 관심지수가 높은지 또는 왜 호감지수가 낮은지 등과 같은 이야기를 해 줄 수 있는 총괄적인 지표를 만들어야 할텐데 이 부분은 지금까지 가지고 있는 기술과 조금 다른 분야이기도 합니다.

아무튼 쉽지 않은 비즈니스를 시작하셨는데요.
솔트룩스의 빛나는 보석을 보고 싶습니다.
화이팅!


  마루날의 雜學辭典|잡학사전을 RSS로 편하게 구독하세요~


신고

마루날 Social OMS, 솔트룩스, 정치인분석, 트루스토리

  1. 역시 마루날님이시군요
    자랩 운영 후 빅데이터 사이트를 운영하고 있답니다
    트루스토리 분석 및 소셜분석 또는 OMS에 대한 분석 잘 보았습니다

  2. 잘 보셨다니 다행입니다. ^^
    OMS 관련해서는 할 얘기가 많습니다만...
    정리를 못하고 있네요

솔트룩스의 새로운 서비스, 아울림

2008.11.05 11:38
솔트룩스

개인적으로 회사이름이 좋다고 생각하는 회사이다.

성경에 나오는 '빛'과 '소금'에서 따온 것 같은데, 이 세상의 어두운 곳을 비추는 '빛'이 되고, 썩어져 가는 곳의 '소금'이 되는 회사가 되겠다는 의지인지는 모르겠지만, 이름이 입에 짝짝 붙는다. ^^


아울림

http://www.owlim.com

이 회사는 의미기반의 그중에서도 '온톨로지'를 기반으로 하는 검색엔진 회사이다. 그러다보니 이번에 나오는 서비스의 이름도 '아울림'이다.

아는 사람은 다 알겠지만, 온톨로지를 표현하는 언어 중 하나가 'owl'이기 때문이다.

우선 아울림이 소개 동영상 하나를 보자.. 그런데 너무 내용이 빠르다. 좀 천천히 돌아가게 만들어 주면 좋으련만 나이가 들어서 그런가 몇 번을 돌려보았다. -_-



아울림을 사용해보자

온톨로지라는 것이 한 마리로 설명을 하자면 용어와 용어간의 관계를 용어와 함께 표현하는 것이라고 할 수 있겠다. 아울림의 첫 화면 역시 '정보의 시각화'에 촛점을 맞추어 보여주고 있다.

[아울림 메인 화면]


질의어를 입력하면,

검색결과 리스트와 검색결과를 시각화하여 검색결과와 연관성 있는 토픽을 방사형으로 함께 보여주는 토글이 함께 보여진다.

[검색결과 화면]


검색을 하면서 어려운 것은 사용자가 자신이 찾고자 하는 정보를 검색엔진이 이해할 수 있는 질의어로 표현하기가 매우 어렵다는 것이다. 그러다보니 사용자가 느끼기에는 질의어와 영 관계없는 검색결과가 나오는 것처럼 느껴지는데,

아울림의 경우 연관성을 따져서 토픽을 시각화해서 한 눈에 보여주니까, 사용자로 하여금 검색엔진이 이해할 수 있는 질의어를 입력할 수 있도록 도와주는 것 같다.

검색결과의 시각화 부분인데 아울림에서 주장하듯이 '정보를 찾고, 정보의 관계를 분석하고, 정보를 연결해서 이해하기 쉽도록 시각화'하는 것은 사용자들에게 매우 유용한 기능임에 틀림없다.

[토글을 크게 보기를 클릭했을 때]


아울림에서 검색결과를 시각화(토글)하기 위해서 온톨로지를 사용하는 듯 보이는데, 온톨로지라는 것이 잘 구축하면 정말 정교한 검색결과를 제공할 수 있지만, 제대로 리얼월드를 모두 매핑하기에는 너무나 많은 비용과 리소스가 필요하기 때문에 쉽지 않다.

그래서 검색을 몇 번 해보면 아울림의 의도와 관계없이 아쉬운 결과가 보여지기도 한다.


그렇다면...

사용해보면 큐로보와 정말 비슷하다.

뭐 두 회사 모두 'Semantic'을 하는 회사이고, 당연히 '온톨로지'도 사용하기 때문에 비슷하게 보이는 것이 당연하다. 큐로보의 경우는 시각화 부분이 표현되지 않았다 뿐이지 결과가 비슷해 보인다.

어느쪽의 온톨로지가 더 정교한가에 대한 이슈만이 남는 것 같은데..

아무튼 본인이 자주 하는 소리이지만, 국내에서 이렇게 다양한 시도가 계속되기를 바란다. 그리고 무엇보다 돈을 벌어서 살아남기를 빈다.

물론 솔트룩스의 경우 아울림 이외에 회사의 매출구조가 다양하고 탄탄하니까 아울림이 당장 수익이 발생되지 않더라도 계속 서비스가 가능할 것으로 보여진다.

다만, 지식인에 길들여져 있는 사용자들에게 이 서비스를 어떻게 접근시킬지가 관건일 것 같다.
사실 '정보의 시각화'는 공급자의 마인드에서 나오는 캐치프레이즈로 느껴지니까...

참, '아울림'은 '어울림'과 너무 헷갈린다. -_-;;;




 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

신고

마루날 정보검색 검색 시각화, 검색엔진, 솔트룩스, 아울림, 의미기반 검색