"그래프는 정말 강력하고, 기본적이면서 점점 더 중요해지고 있어요." 스티븐 스키에나 박사님(@StevenSkiena), AI 연구소장님(스토니브룩 대학교)께서 말씀하셨어요.
그래프는 컴퓨터 과학의 기본 요소이고, 그 중요성은 점점 더 커지고 있죠. 특히 Machine Learning을 사용해서 그래프를 분석하는 건 정말 강력하지만, 그러려면 그래프를 숫자 값으로 변환해야 해요. 바로 이럴 때 그래프 알고리즘이 등장하는 거죠!
이번 주 5분 인터뷰에서는 GraphConnect 2018 NYC에서 알고리즘 디자인 매뉴얼과 데이터 과학 디자인 매뉴얼의 저자이신 스티븐 스키에나 박사님과 DeepWalk에 대한 이야기, 그리고 그래프 알고리즘 라이브러리에 대해 이야기를 나눴답니다.
연구의 주요 초점은 무엇인가요?
스티븐 스키에나 박사: 요즘 제 연구는 그래프 임베딩에 집중하고 있어요. 그래프 임베딩은 그래프의 각 vertex를 공간 상의 점으로 표현하는 다차원 표현이라고 할 수 있죠.
이상적으로는 그래프를 가져와서 Machine Learning 모델을 구축하는 데 사용할 수 있는 feature로 축소하고 싶어요. Machine Learning 모델은 일반적으로 숫자 값에 아주 잘 작동하거든요. 선형 회귀, SVM(Support Vector Machine), Neural Network 같은 것들은 수치 표현으로 된 데이터와 궁합이 정말 좋죠. 그래서 저희 목표는 그래프를 가져와서 100차원 공간에 표현하고, 이 100차원이 feature를 나타내도록 하는 거예요.
그래프 임베딩은 단순히 그래프를 시각화하는 것과는 달라요. 100차원 그림을 본다고 해서 그걸 이해할 수는 없겠죠. 하지만 Machine Learning 모델은 100가지 feature를 아주 쉽게 이해할 수 있고, 그래프를 이런 feature로 축소함으로써 흥미롭고 강력한 모델을 쉽게 만들 수 있게 되는 거죠.
두 가지가 서로 얼마나 유사한지에 대한 질문에 쉽게 답할 수 있고, 고차원 공간에서 두 점이 유사한지 테스트하거나, 궁극적으로 가장 유사한 것이 무엇인지 식별할 수도 있어요.
일단 대표자가 있으면 모든 게 훨씬 쉬워지죠. 저희 그래프 임베딩 알고리즘인 DeepWalk는 이런 종류의 임베딩을 얻는 방법 중 하나랍니다.
DeepWalk 알고리즘에 대해 좀 더 자세히 설명해주실 수 있나요?
스키에나: DeepWalk의 많은 기능은 Word Embedding 아이디어에서 왔어요. 많은 분들이 들어보셨을 Word2Vec 말이죠. Word2Vec은 지도 학습 없이 영어 텍스트를 가져와서 단어의 의미를 나타내는 feature로 축소하는 방법이에요. 예를 들어 '녹색', '노란색', '빨간색'처럼 언어에서 비슷한 역할을 하는 단어들이 공간에서 서로 가깝게 위치하도록 단어를 구성하는 방법을 찾는 거죠. 이건 언어 모델을 구축하는 데 정말 강력한 방법이에요.
Word2Vec은 문장에서 단어가 하는 역할에 따라 단어의 표현을 구축하는 아이디어를 사용해요. 비유하자면, DeepWalk에서는 그래프를 vertex의 어휘로 생각하고, 문장을 그래프 위를 걷는 것으로 생각하는 거죠.
한 단어에서 다른 단어로, 또 다른 단어로 이동하는 것이 문장을 설명하죠. 마찬가지로 한 node에서 다른 node로, 또 다른 node로 이동하는 것은 무작위 이동을 설명하고, 이제 이걸 임베딩 구축을 위한 문장으로 취급할 수 있는 거예요.
Word2Vec은 일련의 기호를 가져와서 지도 학습 없이 기호가 실제로 무엇을 의미하는지 학습해요. 저희는 그래프에 대해 비슷한 작업을 수행하기 위해 Word2Vec의 기본 기술을 사용하고 있죠. 이건 많은 애플리케이션에서 강력한 효과를 보여줬고, Neo4j의 그래프 알고리즘 라이브러리에도 적용되고 있어요.
그래프 알고리즘 연구에서 가장 흥미로운 점은 무엇인가요?
스키에나: 그래프 알고리즘은 알고리즘 설계에서 정말 흥미로운 영역이에요. 그래프 알고리즘은 매우 복잡하지만, 실제로 그걸 사용하는 데 그 복잡성에 대한 지식이 꼭 필요한 건 아니거든요.
그래프 알고리즘의 강력함은 기본적으로 수행하려는 작업을 모델링하는 방법을 아는 데서 비롯돼요. 기본적인 알고리즘이나 작동 방식에 대해 잘 몰라도 그래프를 통해 놀라울 정도로 강력한 기능을 구축할 수 있다는 점이 정말 매력적이죠.
그래프가 소셜 네트워크와 모든 곳의 네트워크에 있다는 건, 그래프가 정말 강력한 역할을 한다는 걸 보여주는 거죠.
그래프 기술의 미래에 대해 흥미로운 점은 무엇인가요?
스키에나: 그래프는 컴퓨터 과학의 기본적인 부분이에요. 그래프는 항상 컴퓨터 과학의 기본일 테지만, 점점 더 중요해지고 있는 건 확실하죠. 그래프 데이터의 양과 그래프 표현의 양이 엄청나게 증가하고 있거든요.
소셜 네트워크는 이미 잘 알려져 있고, 그래프가 어디에나 있는 것 같다는 것도 아실 거예요. 그리고 이런 추세는 앞으로 더 심화될 거라고 봐요.
저희는 원래 수백만 개의 Node를 처리하기 위해 DeepWalk를 만들었어요. 그래프가 계속 커지고 있다는 점을 제외하면 정말 흥미로웠죠. 최근 연구에서는 분산 알고리즘을 사용해서 더 큰 그래프에 대한 임베딩을 수행할 수 있게 해주는 HARP라는 계층적 그래프 임베딩에 집중하고 있어요.
또 하고 싶은 말이 있나요?
스키에나: 학자, 특히 그래프 알고리즘을 가르치는 데 평생을 바친 사람으로서, 그래프에 관심을 갖는 사람들이 많아지는 걸 보는 건 정말 즐거운 일이에요. 이 분야에서 활동하는 사람들과 활동량이 정말 놀라울 정도예요.
다시 말하지만, 그래프는 매우 강력하고 기본적인 기술이며, 그 중요성은 점점 더 커지고 있다는 거죠.
향후 5분 인터뷰에서 Neo4j 프로젝트에 대해 공유하고 싶으신가요? 우리에게 전화를 걸어content@neo4j.com
그래프 알고리즘이 궁금하신가요?
다운로드Neo4j의 그래프 알고리즘, 연결된 데이터에 대한 강력한 통찰력을 얻기 위해 그래프의 힘을 활용하는 방법을 알아보세요.
- 5분 인터뷰
- DeepWalk
- 스티븐 스키에나 박사
- Machine Learning
- word2vec
에이치시스템즈의 LogTree는 Neo4j 기반 GraphRAG 플랫폼으로, 데이터를 자동으로 지식그래프화하고 자연어 질의로 즉시 답을 제공합니다.
'GraphRAG' 카테고리의 다른 글
| BigQuery 데이터에서 Neo4j GraphRAG으로 풍부하고 강력한 인사이트 발견하기 (0) | 2026.04.28 |
|---|---|
| 파라다이스 페이퍼 심층 그래프 분석: Neo4j와 GraphRAG로 파헤치다 (0) | 2026.04.27 |
| Cypher 웨비나 후기: Neo4j, GraphRAG 활용 인사이트 (1) | 2026.04.27 |
| 고객 여정, 이제 그래프로 보세요: Neo4j와 GraphRAG 활용법 (1) | 2026.04.26 |
| 전 세계 컨텍스트 그래프와 AI 메모리: GraphRAG의 미래? (0) | 2026.04.26 |
