728x90
반응형

"사람들은 이제 프로젝트 기반 접근 방식에서 기술 플랫폼으로 그래프를 채택하는 방향으로 전환하고 있습니다." 라고 Dan Woods, 수석 분석가가 말했어요. 그는 Early Adopter Research의 수석 분석가이자, Evolved Media의 창립자 겸 CEO이기도 하죠.

기업들은 그래프 기술을 도입하는 데 어려움을 겪고 있는데, 이는 대부분의 조직에게 패러다임 변화를 의미하거든요. 사고방식의 변화로 인해 점점 더 많은 사람들이 그래프로 생각하고 가능성을 구상하기 시작하면서, 그래프 기술에 대한 비즈니스 수요는 계속 증가하고 있어요.

이번 주 5분 인터뷰는 GraphConnect 2018 (뉴욕)에서 진행되었는데요. Dan Woods와 그의 강연, 그리고 Graph Tour를 구현하는 사람들과 이야기를 나눈 그의 경험에 대해 이야기를 나눴어요. 특히 Graph Database를 기업 환경에서 어떻게 활용하는지에 대한 내용이었죠.

Neo4j GraphTour에서 어떤 내용에 대해 이야기하셨나요?

Dan Woods: 제가 강연한 내용은 1억 달러짜리 그래프 `Query`를 찾는 방법이었어요.

결론적으로 그래프를 체계적으로 채택하려면 여러 가지 작업을 수행해야 한다는 거죠. 저는 먼저 초기 사용 사례를 찾고, 점차적으로 CoE (Center of Excellence)를 만들고, 이를 확장해서 운영상 보안을 유지한 다음 운영에 투입하는 일반적인 엔터프라이즈 성숙도 모델을 살펴봤어요. 그리고 이 모든 것을 동시에 생각해야 해요.

그건 모든 기술에 대한 이야기와 거의 같아요. 실험과 스컹크워크에서 생산에 이르기까지 어떻게 기술을 가져갈 수 있을까요?

엔터프라이즈 그래프 기술의 핵심은 무엇이라고 생각하시나요?

Woods: 저는 두 가지가 체계적인 그래프 채택의 핵심이라고 생각해요.

하나는 그래프 `Query`, 그래프 알고리즘, 그래프 분석을 통해 많은 사람들이 그래프에 담긴 사고의 힘을 이해하고 어떤 질문을 할 수 있는지 이해하도록 돕는 방법이에요.

사람들이 분석을 사용해서 질문에 답하고 그래프의 전체 자료를 보고 이에 대한 정보를 찾을 수 있다는 것을 이해한다면, 데이터 작업을 할 때 "와! 그래프가 있으면 이 질문에 답할 수 있겠네요. 정말 멋질 것 같아요!" 라고 말할 거예요. 이는 그래프 작성에 대한 수요를 촉진하고 정말 강력한 애플리케이션으로 가는 길을 보여주죠. 왜냐하면 아이디어의 핵심은 해당 비즈니스에 종사하는 사람에게서 시작되었기 때문이에요.

이것이 첫 번째에요. 최대한 많은 사람들이 그래프로 생각하도록 하려면 어떻게 해야 할까요?

두 번째는 아이디어가 떠오르면 그래프를 작성해야 한다는 것이죠.

관계형 테이블을 가져와서 그래프로 표현하는 예는 많이 있어요. 하지만 5~6개의 정보 소스 또는 10~20개의 정보 소스가 있는 그래프를 만들기 시작하면 그래프 ETL 문제가 발생해요. 관계형 ETL을 사용하면 데이터 소스를 가져와서 표 형식으로 정리한 다음 RDBMS 구조에 덤프하면 작업이 완료되죠. 그런 다음 SQL `Query`에서 함께 발생하는 편직의 모든 복잡성이 발생하고요.

그래프를 사용하면 달라요. 데이터를 가져와 수집한 다음 `Node`나 연결 속성에 넣는 거죠.

여러 개의 `Node`를 덤프한다고 가정해 볼게요. 이제 해당 `Node`를 연결하는 방법과 연결에 속성을 할당하는 방법을 이해하는 프로그램이 있어야 해요. 더 이상 데이터를 덤프한 다음 `Query` 후반부에 복잡성이 발생하는 것이 아니에요. 그것은 복잡한 프로그램인 거죠. 그리고 물론 데이터를 업데이트할 때와 그렇지 않을 때를 이해해야 하고요.

그래프 ETL은 기업이 그래프를 채택할 때 경계가 될 기술이라고 생각해요. 제 생각엔 모피어스와 함께 하면 그 일이 더 쉬워질 거예요. 관계형 테이블에 접근해서 이를 가져온 다음 이를 그래프에 연결하는 체계적인 방법을 갖게 되면 매우 강력해질 것이라고 생각해요.

저는 그래프를 널리 사용하는 분야인 사이버 보안 분야의 사람들과 이러한 거대한 생산 그래프를 생성하는 방법에 대해 이야기할 때 이것을 반복해서 보았어요. 그들이 소비한 대부분의 시간은 그래프 ETL 계층에 있었던 것으로 밝혀졌죠. 그게 가장 어려운 문제이기 때문이에요.

그래프 기술 채택에 어떤 변화가 일어나고 있나요?

우즈: 이제 사람들이 프로젝트 기반 접근 방식에서 기술 플랫폼으로 그래프를 채택하는 쪽으로 바뀌고 있다고 생각해요. 다음 과제는 그래프를 어떻게 체계적으로 도입하느냐 하는 거죠.

Google Kubernetes Enterprise와 Neo4j에 대해 이야기해 주시겠어요?

우즈: 정말 흥미로운 일이 일어나고 있는 것 같아요. Google Kubernetes Enterprise 및 Neo4j에 대해서 말이죠.

Google Kubernetes Enterprise에 접속하면 컨테이너에 코드를 넣을 수 있는 세계로 들어서게 되는데, 컨테이너는 확장이 정말 쉽고 환경 관리도 엄청 편해져요. 그리고 Google Cloud Platform Marketplace에 접속해서 Neo4j 같은 패키지 애플리케이션을 찾아서 Google Kubernetes Enterprise 시스템으로 아주 쉽게 가져올 수도 있고요.

이게 바로 Neo4j가 많은 컨테이너화된 애플리케이션과 관련될 거라고 생각하는 방식이에요. 이걸 가져와서 다양한 마이크로서비스에 있는 모든 데이터를 하나의 통합된 뷰로 만들 수 있는 거죠. 게다가 모든 배관 작업이 훨씬 쉬워질 거예요.

다시 말하지만, 어려운 부분은 모든 것을 가져오는 그래프 ETL이 될 거예요. 하지만 일단 거기에 넣으면, 이전에 분산되어 있던 정보 세트들을 볼 수 있게 돼요. 하나의 통일된 방식으로 볼 수 있다는 건 정말 그래프의 힘이죠!

그래프 기술과 데이터 웨어하우스 사이에 어떤 중복이 있다고 보시나요?

우즈: 그래프가 큰 영향을 미치는 영역 중 하나는 우리가 항상 원했던 것을 데이터 웨어하우스, 그리고 데이터 레이크에서 제공하는 부분이에요. 그 영역에서 우리는 뭘 원했을까요?

데이터 웨어하우스에서는 모든 애플리케이션의 데이터를 통합하고 싶어 했어요. 데이터 웨어하우스는 기본적으로 비즈니스를 설명하는 데 사용할 수 있는 언어인 표준 모델을 만드는 데 꽤 성공적이었죠. 물론 표준 모델은 빠르게 발전하지 못했고, 시스템의 취약성이나 빠른 성능을 위해 해야 하는 작업에 문제가 많았지만요. 그래도 표준 모델을 갖게 되면 가치가 생겨나는 거죠.

이제 데이터 레이크는 "잠깐, 나머지 데이터는 다 어디 있지?"라고 말하는 것과 같아요. 데이터 레이크는 데이터를 통합하는 것보다 저장하는 데 훨씬 더 좋죠. 제 생각에는 특히 Knowledge Graph를 사용하면 데이터 웨어하우스에 있던 모든 정보, 데이터 레이크에서 수집한 모든 정보, 그리고 다른 모든 애플리케이션에 있는 모든 정보를 통합 그래프로 통합해서 최신 상태로 유지할 수 있어요.

Neo4j의 가장 흥미로운 부분은 무엇이라고 생각하시나요?

우즈: Neo4j에서 일어나고 있는 일들이 정말 흥미롭다고 생각해요. 굉장히 야심 찬 회사인데, 애플리케이션을 기록 시스템으로 강화할 수 있는 OLTP 트랜잭션 운영 데이터베이스가 되려고 노력하고 있다는 점이 그중 하나죠. 게다가 일류 분석 플레이어가 될 분석 OLAP 데이터베이스가 되기 위한 기반도 구축하려고 하고 있고요.

관계형 데이터베이스 세계에서는 이런 일이 없었어요. 우리는 OLAP용 Teradata, 그리고 OLTP용 Sybase 등 다양한 범주의 데이터베이스를 가지고 있었죠. 그런데 Neo4j는 "아니, 우리는 둘 중 하나가 아니라 둘 다 될 거야!"라고 말하고 있는 거예요. 정말 야심 찬 일이라고 생각해요. 이걸 해낸다면, 하나의 데이터베이스에서 다른 데이터베이스로 데이터를 옮길 필요가 없기 때문에 엄청난 강점이 될 거예요. 저는 "네, 우리는 Neo4j를 사용해서 운영도 아주 효율적으로 하고 있고, 분석도 엄청 잘 돼요!"라고 말하는 사람을 정말 보고 싶어요.

향후 5분 인터뷰에서 Neo4j 프로젝트에 대해 공유하고 싶으신가요? content@neo4j.com으로 연락 주세요.

여러분의 비즈니스에서 그래프를 어떻게 활용할 수 있을지 궁금하신가요?
이 백서를 다운로드해서그래프 데이터베이스의 상위 5가지 사용 사례를 알아보고, 연결된 기업을 위해 그래프의 힘을 활용하는 방법을 배워보세요.
  • 5분 인터뷰
  • Enterprise Graph
  • ETL
  • 마이크로서비스
  • OLAP
  • OLTP
  • RDBMS

에이치시스템즈LogTree는 Neo4j 기반 GraphRAG 플랫폼으로, 데이터를 자동으로 지식그래프화하고 자연어 질의로 즉시 답을 제공합니다.

👉 에이치시스템즈 홈페이지

728x90
반응형

+ Recent posts