Large Graph Fraud Detection System LAB / LGFDS LAB
모임 기간
2023.11.04 -
모임 일시
매주 토요일 10:30 ~ 12:30
장 소
강남
모집 기간
2023.10.21 - 2023.11.03
모집 인원
10명
선발 방식
사전 질문 기반 심사
랩 소개
운영 방식
참여 요건
랩장 소개
⭐️ 랩 소개
한 줄 소개
그래프 데이터의 유용성을 탐구하며 이상치 탐지와 현업 응용 역량 강화를 목표로 하는 연구실
분야
ENGINEERING
목표 결과물
BOOK
관계에 특화된 데이터인 그래프 데이터의 장점을 활용해 이상치 탐지 분야에서 유용성을 연구하는 LAB입니다. 특히, 대용량 데이터를 다루기위한 기술을 중점으로 연구합니다. 그렇기에 , 그래프 데이터베이스 , 네트워크 이론 그리고 그래프 딥러닝 3가지 분야를 유연하게 활용하며 이상치 탐지 성능을 향상하기 위한 방안을 구상하고 구현합니다.
LGFDS LAB은 그래프 공부를 지원하고 현업에서의 실제 응용 예시를 공유하는 목적으로 개설되었습니다. 국내에는 그래프 관련 자료가 부족하며, 그래프를 적용하고자 하는 학생 및 전문가들이 부족한 지식으로 어려움을 겪고 있습니다.
이런 어려움을 극복하기 위해 우리 모임은 단순한 튜토리얼로 그래프를 접하는 것을 넘어, 실무 경험과 지식을 공유하고자 합니다. 우리의 목표는 그래프 기술의 깊이와 활용법을 이해하고, 이를 현업에서 적용할 수 있는 능력을 키울 수 있도록 돕는 것입니다.
이 모임은 그래프 기술에 관심을 가진 모든 분들을 위한 것이며, 우리의 결과물은 백서 및 발표회 형태로 공유될 예정입니다. 함께 참여하여 그래프의 가치를 탐구하고, 현업에서의 성공적인 응용을 위한 도움을 드릴 것입니다.
* 논문 , 대회 참가가 주 목적이 아닌 실제 현업에서 적용할 수 있는 역량 향상이 주목적입니다. 최종 결과물은 랩에서 진행한 내용을 대중에게 발표하고 교류하는 1.세미나 그리고 정리하여 문서로 교류할 수 있는 2.백서 두 가지 입니다.
⭐️ 운영 방식
매주마다 각자 맡은 파트(GDB , graph analysis , graph deep learning) 결과물을 교류하며 성장합니다.
활용 데이터셋은 LDBC financial dataset을 활용합니다.
1.대용량 데이터 그리고 2.이상치 탐지가 활발한 산업인 금융 도메인 데이터 두 가지 공통사항에 만족하는 데이터셋이기에 변동사항이 없습니다.
총 12W 진행할 예정입니다.
2W 까지는 LAB 기획에 대해 교류하며 각자 맡을 메인 , 보조 파트를 정합니다.
* LAB 기획이라함은, 가용가능한 자원, 아이디에이션, 설계한 아키텍쳐가 현실적인 아키텍쳐인지, 목표 아웃풋 등등에 대해 고려합니다.
2W ~ 10W 기간은 매주 각자 맡은 역할을 수행하며, 디스커션하는 기간입니다.
10W ~ 12W 기간은 백서를 작성하고 발표회를 준비하는 기간입니다.
⭐️ 커리큘럼
⭐️ 참여 요건
그래프 데이터베이스 - cypher 를 다루어보신분 , Neo4j Composite을 통해 db sharding 을 진행하여 그래프 대용량 데이터를 처리해 본 경험이 있으신분.
네트워크 이론 - transitivity , centrality 등 네트워크 데이터를 정량화하여 분석한 경험이 있으신분.
ex) 특정 노드의 betweenness centrality 가 높을 시, 해당 네트워크에서 병목현상이 발생할 확률이 높으므로 rewiring 진행시 가중적용하여 원활한 network flow 가 가능하게 유도.
그래프 딥러닝 - 커스텀 데이터셋(non benchmark dataset)를 활용해 shallow learning 혹은 graph deep learning 을 통해 문제를 해결해 본 경험이 있으신분.
* 커스텀 데이터셋이란, 본인이 가지고 있는 데이터셋을 node, edge 로 변형하여 training 그리고 inference까지 진행해보신분.
대용량 데이터 관리 및 분석 - distributed learning(pyspark , graphframes , ray), graph sampling strategy customized 등 그래프 엔지니어링 경험이 있으신분.
스터디를 끈기있게 2개이상 마치신분(가장 중요)
⭐️ 사전 질문
그래프 데이터베이스를 활용해 문제를 해결해 본 경험을 공유해주시면 감사하겠습니다.
네트워크 이론을 활용해 문제를 해결해 본 경험을 공유해주시면 감사하겠습니다.
그래프 딥러닝을 활용해 문제를 해결해 본 경험을 공유해주시면 감사하겠습니다.
대용량 데이터 관리 및 분석을 활용해 문제를 해결해 본 경험을 공유해주시면 감사하겠습니다.
스터디를 끈기있게 2개이상 마치신분(가장 중요) , 스터디를 진행하며 어려웠던 점과 어떻게 해결하셨는지에 대해 공유해주시면 감사하겠습니다 :)
⭐️ 랩장 소개
정이태
jeongiitae6@gmail.com
안녕하세요 정이태입니다.
# 커뮤니티
현재 Graph User Group , GUG 라는 커뮤니티 빌더를 맡고 있으며, 매주 그래프 오마카세 라는 콘텐츠를 작성하고 있습니다. 매주 3편의 그래프 관련 논문을 읽으며 트렌드를 놓치지 않으려 애쓰고 있으며, 국내에서 그래프 인지도를 높이기 위해 동분서주 노력하고 있습니다.
지식그래프 , GNN 오픈채팅방 방장을 맡으며 다양한 분들께서 하고계실 그래프에 대한 고민을 해소해드리기 위해 노력을 하고 있습니다.
# 그래프 입문
석사과정시절 그래프에 대해 입문하게 되어 그래프 데이터베이스 회사부터 현재 그래프 솔루션 회사까지 그래프에 관련한 일을 하고 있습니다.
# 제가 랩분들에게 도움드릴 수 있는것.
산업에서 어떻게 그래프를 활용할지에 대해 관심이 많으며 다양한 클라이언트를 만나면서 왜 그래프인지에 대해 설득을 하는 경험을 많이 가지고 있습니다. 비즈니스와 그래프가 어떻게 적절히 융합이 되면 사람들에게 설득이 될지에 대해 많은 고민과 좌절을 겪으며 얻은 경험치가 있기에 이를 LAB에서 잘 활용하여 그래프 실무형 인재로 거듭나실 수 있게, 그래프 잘 하는 사람으로 성장할 수 있게 도움드리겠습니다.