한국어
    • 한국어
    • ENGLISH
    • 日本語
    • 中文-繁體

    2017.07.10 Data Science

    데이터 분석을 이용한 게임 고객 모델링 FAQ

    게임 회사는 고객들의 유형과 특성을 정확히 파악하는 것이 매우 중요합니다.

    이는 고객들을 위한 맞춤형 콘텐츠를 기획하고, 보다 편리한 서비스를 제공하기 위함인데요.

    고객 유형 분석에 쓰이는 다양한 데이터 분석 방법을, 엔씨소프트 데이터분석팀 이은조 님이 소개합니다.  (*´∀`*)


    그 동안 지면 관계 상 혹은 글의 흐름 상 생략했던 기술적인 내용 중에서 연재 도중에 받았던 몇 가지 질문을 FAQ 형식으로 정리해 보았습니다.

    Q1) 여러 가지 군집 유형을 나누는 방법에 대해 소개해 주셨는데 이런 군집 유형이 변하기도 하나요?

    만약 변한다면 시간이 지남에 따라 다시 원래 유형으로 돌아가나요 아니면 바뀐 모습을 유지하게 되나요?

    A1) 군집을 나눌 때는 특정 시점에 수집된 게임 고객 데이터를 이용하기 때문에 수집 시점의 고객 특징만을 반영할 수 밖에 없습니다.

    시간이 지남에 따라 고객의 유형이 달라지기 때문에 유형 분류는 정기적으로 해야 합니다.

    그리고 변화 패턴은 고객마다 다르기 때문에 항상 어떻게 변한다고 단정지을 수 없습니다.

    유형 분류는 계속 해야 한다는 사실

    Q2) 여기서 소개한 클러스터링 방법 말고 다른 방법으로는 어떤 것들이 있나요? 그리고 그 중에서 가장 성능이 뛰어난 방법은 뭔가요?

    A2) 제가 여기서 소개한 방법은 ‘k 평균 군집화’와 ‘계층 군집화’ 인데요, 이것 말고도 굉장히 다양한 알고리즘이 있습니다.

    제가 소개해 드린 기법은 그 중에서 가장 보편적으로 사용되는 방법일 뿐입니다.

    이런 기법들은 모두 저마다의 장단점을 갖고 있기 때문에 어떤 한 가지 가장 뛰어난 방법을 찾기 보다는 각 기법의 특성을 잘 파악하여 클러스터링 대상이 되는 데이터에 적합한 방법을 사용하는 것이 중요합니다.

    여기까지가 이론적인 답변이고 실전에서는 일단 아는 방법 다 동원해서 분류해 보고 그 중에 가장 괜찮아 보이는 결과를 취하는 경우가 대부분입니다……

    Q3) 개인 행동 패턴을 통한 군집화 모델과 소셜 네트워크 분석을 통한 군집화 모델 중 어떤 것이 더 유저를 예측하는데 뛰어난가요?

    A3) 어떤 것이 더 낫다기 보다 이 둘을 적절히 혼합하여 사용하는 것이 좋습니다.

    2편에서 예로 든 다이아몬드와 석탄의 사례를 다시 생각해 보면, 어떤 물체가 다이아몬드가 되려면 입자들의 얽힘 구조뿐만 아니라 그 입자 자체의 특성도 중요합니다.

    이 둘 중에 하나라도 다르면 그 물체는 다이아몬드가 아닌 것이죠.

    따라서 어떤 고객의 특성을 정확히 파악하려면 고객의 행동 유형과 더불어 고객이 속한 커뮤니티의 네트워크 유형까지 같이 파악하여 이 둘을 통합한 유형을 만드는 것이 좋습니다.

    1편 맨 앞에서 소개했던 MBTI 의 경우를 생각해 보면 MBTI는 각기 독립된 네 가지 기준으로 사람의 성향을 나눈 후 이들을 합쳐 최종 유형을 정합니다.

    이와 비슷하게 고객 유형을 나눌 때도 행동 기반의 유형과 커뮤니티 기반의 유형을 각기 분류한 후 이들을 합쳐 최종 유형을 만들면 보다 정확한 고객 특성 파악이 가능하다고 생각합니다.

    Q4) 3편에서 예시로 나온 네트워크 시각화 그림들이 흥미로운데 이런 자료는 어떻게 만들 수 있나요?

    A4) 블로그에서 소개한 네트워크 그림들은 모두 ‘게피(Gephi, https://gephi.org/)’ 라는 툴을 사용해서 그렸습니다.

    이 툴은 누구나 무료로 사용할 수 있는데 다양한 그래프를 그릴 수 있을 뿐만 아니라 기본적인 네트워크 분석 기능도 제공해 줍니다.

    특히 GUI 기반이기 때문에 기본적인 사용법만 알면 초보자도 쉽게 사용할 수 있는 꽤 괜찮은 툴입니다.

    데이터 분석을 이용한 게임 고객 모델링 연재는 이번 FAQ 편으로 마무리됩니다.

    감사합니다.