DataDog은 어떻게 가장 큰 APM (성능 분석 솔루션) 회사가 되었나?

DataDog은 APM(성능 분석 솔루션)의 후발주자
2010년에 만들어진 DataDog은 성능분석 솔루션 (Application Performance Monitoring)의 후발 주자이다. 쟁쟁한 경쟁상대가 포진하는 레드오션 시장에서 어떻게 이렇게 급성장을 했을까?

현재 시점에서 APM 플레이어의 기업가치를 보자.

기업명 기업가치 (Market Cap)
DataDog 34.37B
New Relic 4.13B
Dynatrace 15.13B
Splunk 28.03B
Compuware 2.5B

DataDog이라는 회사가, 데이터 분석 빅마우스인 Splunk보다 1.5배 더 큰 기업가치를 가지고 있고, New Relic 보다 무려 9배의 기업 가치를 가지고 있다. AppDynamics와 같은 경쟁 서비스도 있으나, CISCO에 인수되어 현재 기업가치를 판단하기 어렵다.
2017년 인수 금액은 4조(3.7B)였다.

참고로 필자는 2015년부터 APM 시장에서 제품을 만들어왔고, 이들 간의 제품의 차이를 수시로 체크하였다. 그래서 이들 제품 간의 특성을 제법 잘 알고 있다. 최근 APM 시장에 대해서 설명하겠다.

레드오션인 APM 시장

APM의 시장은 많은 플레이어들이 저 마다의 강점을 내세우며, 치열하게 싸우고 있는 시장이다. 가트너사의 APM 분야의 매직 쿼더런트를 보자.

무려 글로벌하게 15개의 회사들이 글로벌하게 싸우고 있으며, 국내도 무려 APM 제품만 15개 이상이다.
몇 년 전 가트너 보고서에 의하면 2027년 매해 11.7B으로 시장이 성장한다는 자료가 있었으나 COVID-19 사태로 인해 성장 속도가 몇 배나 빨라졌다.

즉 찾는 이도 많고, 원하는 제품의 특색도 다양하다고 말할 수 있다.

또한 한국은 대략 300억 규모의 서버 APM 시장을 가지고 있는 것으로 추정되는데, 제니퍼소프트 APM 점유율이 60%가 넘는 수준이다. (참고로 제니퍼소프트는 모바일 APM 모니터링 IMQA의 전략적 파트너이다.)

기존 APM 강자의 접근 방법

  1. 트랜잭션 처리 유형 (개발자를 위한 APM)

대부분의 전통적인 APM은 트랜잭션을 분석을 하는데 초점이 맞추어져 있다. 사용자가 웹페이지나 모바일 앱에서 특정 액션(로그인)을 취하면 서버에서 트랜잭션이 발생하게 된다. 이 트랜잭션에서 어떠한 함수를 실행하기도 하고, 데이터베이스에 접근하기도 하고, 외부의 서비스 (기상청 서버 호출)를 호출하기도 한다.

Elastic 사의 오픈소스 APM을 보면 개별 트랜잭션을 다음과 같이 프로파일링(트레이스) 한다.

트랜잭션을 처리한다는 것은 다음과 같은 제약들을 가진다.
Java, .NET 플랫폼이 전체 트랜잭션 모니터링에서 60% 이상의 시장을 차지한다.
Python, GO, PHP, Nodejs등 새로운 언어들이 만들어지면 계속해서 추가를 해줘야 한다. 그런데 이러한 언어들은 BCI와 같은 표준화가 잘 되어 있지 않아, 일일이 다양한 라이브러리들을 지원해야 하므로, 많은 비용이 든다.

  1. 인프라 관점의 유형 (운영자를 위한 APM)

운영 중인 서비스가 안정화 되고, 거대해지는 성숙기에 다다르게 되면, 트랜잭션 위주보다는 자원을 관리하는 입장으로 변경되게 된다. 보통 3교대로 운영자가 대응을 하게 되며, 서버의 토폴로지(네트워크 구성도)를 보면서 분석하는 뷰를 핵심 가치(대시보드)로 내세우고 있다

Dynatrace는 시스템의 운영자 관점에서 문제를 찾고 그게 자원의 문제인지, 트랜잭션의 문제인지를 종합적으로 바라볼 수 있게 된다. (물론 트랜잭션을 분석하는 APM도 기능도 있습니다)

DataDog 은 어떻게 시장을 공략했나?

사실 데이터독이 초기 나왔을 때는 그렇게 대단하다고 느끼지 않았다. 장애 분석 및 문제 원인 규명에 집중한 기존 방식에서는 맞지 않았기에 그렇게 큰 관심을 가지지 않았다. 그런데 되돌아보니 서비스 방향성을 잘 잡았다고 판단하게 되었다.

1. MSA 시대에 맞는 새로운 뷰

다양한 언어와 플랫폼의 성능을 측정할 수 있는 뷰를 제공한다는 것이다. 기존의 APM은 시장이 큰 Java, .NET에 초점이 맞추어진 뷰를 제공했다. 물론 다양한 언어도 제공을 했으니 하나의 기술 스택에 집중을 했다. 이건 나름대로 좋은 전략이었다. Java 나 .NET에 특정 에이전트만 설치하면 이미 가치판단이 되는 정제된 뷰에서 바로 데이터가 나왔다. 왜냐면 몇 년 전만 해도 Enterprise 시장에서는 Java와 .NET에 특화되게 집중하는 것이 맞는 방법이었다.

하지만 MSA의 시대가 도래하면서 새로운 니즈가 생겨났다. 단일 플랫폼이 아니라, 다양한 언어와 플랫폼을 사용하게 되다 보니 전혀 다른 뷰를 원했다. DataDog은 처음부터 거기에 초점을 맞추었다.

거기다 마우스로 확대를 하면 이렇게 프로세스와 상세한 정보를 확인할 수 있다.

벌집형 구조를 가진 Hostmap. 이건 DataDog의 상징과도 같다. 많은 분들이 Kubernetes의 벌집 구조 아니냐고 말하겠지만, 사실 그 원조는 DataDog이다. Kubernetes가 대중화되기 전에 이미 이러한 컨셉을 가지고 있었다.

2. 다양한 오픈소스 기술을 지원하는 에이전트, 커스텀마이징한 뷰

앞서 말한 것 처럼 기존의 APM은 쉬운 설치, 이미 가치판단이 반영된 뷰를 보여주었다면 DataDog은 반대 방향으로 흘러갔다.

정말 기본만 주고, 니가 꾸미고 싶은 것은 마음대로 꾸미라는 전략이었다. 심지어 리포트까지도..
시스템을 인하우스로 개발을 했다면 운영 중에 몇 번의 장애를 맞으면 정말 중요한 지표를 잘 알게 된다. 통신사나 게임의 특화된 뷰를 만들고 싶다면 DataDog은 커스터마이징하여 자기 마음대로 꾸밀 수 있다.

즉 경쟁자와 다른 방향으로 갔다는 것이다. Enterprise의 몇몇 언어에 종속되는 아키텍처가 아닌 다양한 플래폼과 언어를 자유도 높게 측정하고 분석할 수 있는 뷰를 제공한 것이다.

3. 결정적 한 방 - 멀티 클라우드 환경도 한 곳에서.. / 빠른 기술 변화를 흡수..

물론 지금은 다른 업체들도 되지만, 멀티 클라우드 (AWS, Azure, GCP) 특화된 기능을 가장 빠르게 제공하고 이걸 통합해서 볼 수 있는 뷰를 누구보다 빠르게 제공했다. 또한 빠른 기술 스택의 변화를 따라가면서 Agent들을 쏟아내고 있다.


정리하며
해매다 88%로 성장하고 있는 DataDog. 어떤 특화된 DataDog의 장점이 처음에는 보이지 않았으나, 지금 되돌아보면 다른 APM 회사들과 차별화된 방향성을 가졌다.

필자는 시장의 크기와 매출을 바라볼 때, 가트너의 APM 회사의 평가 기준이 편향되어 있다고 생각한다. 가트너와 달리, Forrester 리서치에서는 DataDog을 APM의 최고 리더로 보고 있다.

서비스의 장애가 나거나, 출시 전에 장애가 걱정되면
어니컴은 QA 분야의 최고 회사이며, 다양한 부하테스트및 성능 분석을 하는 솔루션과 QA 등을 가지고 있는 회사입니다.

마사회, Tmap, 셀트리온 스킨큐어, 아모레 퍼시픽, 하이닉스등의 다양한 솔루션 /컨설팅 레퍼런스가 있으며, 장애시 불러주시면 언제든 불을 끄러 달려가겠습니다.

여러 기술적인 문의는 정품질 - support@imqa.io / 02-6395-7722 로 주시면 답변드리겠습니다