풀잎스쿨

연구를 위한 지식을 플립러닝 방식으로
2-3개월 간 학습하는 집중 스터디 과정입니다.

* 풀잎스쿨은 3개월마다 진행됩니다.

분산 처리로 그 누구보다 빠르게 난 남들과는 다르게 색다르게 분석해봅시다
이런 분들과 함께 공부하고 싶습니다.
이번 풀잎에서 다음을 얻어가고 싶으신 분들은 당장 신청해주세요! :)
- 내가 사용하고 있는 기능 외에 스파크의 다른 기능들을 알고 싶다. (ex. spark mllib, lightgbm-on-spark ...)
- 스파크를 통해 자원을 효율적으로 사용해보고 싶다.
- 다른 언어나 시스템에서 이미 데이터 분석을 해봤으나 스파크를 사용해보고 싶다.
[운영방식]
- 교재에서 9가지의 데이터 셋을 소개하는데 매주 다운 받아서 교재의 방식대로 분석해본 후,
- 창의적인 방식으로 각자 개선 후 아이디어를 나누어 봅니다.
- 온라인 모임은 ZOOM으로 진행됩니다.
- 활발한 커뮤니케이션을 위하여 화상으로 카메라와 마이크를 켜고 진행됩니다.
- 캠(혹은 캠이 내장된 노트북), 마이크 기능이 있는 이어폰을 준비해주세요.
- 마지막 주차는 모두의연구소 강남캠퍼스에서 오프라인으로 진행됩니다.
- 풀잎스쿨 14기에 한하여 온라인 과정이 165,000원으로 할인됩니다. 결제 페이지에서 온라인 전용 할인 쿠폰을 드립니다.
이런 분들께 추천합니다
- 파이썬, 스칼라 등을 데이터 분석에 자주 활용하시는 분
- 스파크를 공부했거나, 활용 중이나 분석 기능을 더 폭넓게 사용해보고 싶으신 분
- 다수 컴퓨터를 활용한 데이터 분석 방법에 관심이 있으신 분
- 다양한 배경의 맴버들과 적극 의견을 나누면서 데이터 분석을 더 잘 하고 싶으신 분
- 삽질에 자신있는 분 (어쩌면 포맷해야할 각오도 ㅎㅎㅎ;;;)
[필요한 지식]
- 스파크 Dataframe API
- 혹은 파이썬 데이터 분석 패키지 (Pandas, Scikit-learn 등)
난이도
학습유형
사전학습 (주차별 학습내용을 각자 학습한 후 모여서 토론합니다)
커리큘럼
Chapter1. 첫 만남과 스파크의 소개
1주차: 빅데이터 분석하기
2주차: 스칼라와 Pyspark를 활용한 데이터 분석

Chapter2. 9가지 사례를 통한 고급 분석
3주차: 음악 추천과 Audioscrobbler 데이터셋
4주차: 의사결정 나무로 산림 식생분포 예측하기
5주차: k-평균 군집화로 네트워크 이상 탐지하기
6주차: 숨은 의미 분석으로 위키백과 이해하기
7주차: 그래프엑스로 동시발생 네트워크 분석하기
8주차: 뉴욕 택시 운행 데이터로 위치 및 시간 데이터 분석하기
9주차: 몬테카를로 시물레이션으로 금융 리스크 추정하기
10주차: BDG 프로젝트와 유전체학 데이터 분석하기
11주차: 파이스파크와 썬더로 신경 영상 데이터 분석하기

* 우리가 더 알아야 할 것들
- DASK
- Ray on Spark

* 실습으로 진행되는 과정입니다. 참고해주세요.
교재 및 학습자료 / 준비물
- 교재 : 9가지 사례로 익히는 고급 스파크 분석
- 개인 PC(사양 무관)
풀잎스쿨이란
풀잎스쿨이란
풀잎스쿨 신청자분들께는 과정 시작 일주일 전에 참여 관련 안내 메일을 드릴 예정입니다.
퍼실이 소개
강성현

강성현

#분산처리_스파크 #PC 한대로 괜찮겠어? #먼저_간다~

스마트팩토리라는 막연한 단어가 유행할 때쯤 데이터 분석업무를 시작했고, 지금은 나름의 확신으로 데이터로 공장이 더 똑똑해 질 수 있다고 믿는 공장지기입니다.
데이터를 분석할 때 주로 Spark, Hadoop을 사용하는데 데이터의 추출, 전처리 과정에서만 사용하고 있었으나, 최근 Spark 3.0이 릴리즈 되면서 새로운 기능들도 궁금했고, 마이크로소프크, UC Berkeley 등이 개발한 Spark의 Eco도 늘어나면서 조금 더 스파크의 활용 폭을 넓히고 싶어서 스터디를 개설하게 되었습니다.
Dask, Ray on Spark 와 같이 새로운 분산처리 분석 툴에 대한 공부도 해볼 생각이니 탐구정신이 투철하진 분들은 꼭 함께해주세요~!
 

풀잎스쿨 / LAB 참여 이력

퍼실활동
파이썬 전문가 과정(시즌 1, 2)
파이썬 클린코드
넌 혼자가 아니야 분산처리 스파크 시즌(1, 2) 등

참여활동
베이지안 통계
Transformer is All you need
딥러닝 이미지 처리
VQA 등

환불정책
첫 모임 시작 전날까지 취소 및 전액 환불이 가능합니다.
환불 신청은 홈페이지 상단의 “문의글 작성” 에서 가능합니다.
Advanced Analytics with Spark

시작일

2021년 1월 11일

진행일시

월 / 19:30

수강기간

11주 (2시간/주)

진행장소

온라인캠퍼스

231,000원 165,000원(쿠폰제공)

선결제자가 가상 계좌 입금 대기 상태인 경우, 실질적으로 마감되었음에도 마감 임박으로 표시됩니다.
대기자 신청을 해주시면 추후 공석이 생길 경우 메일로 알람이 발송됩니다.
Advanced Analytics with Spark

시작일

2021년 1월 11일

진행일시

월 / 19:30

수강기간

11주 (2시간/주)

진행장소

온라인캠퍼스

231,000원 165,000원(쿠폰제공)

선결제자가 가상 계좌 입금 대기 상태인 경우, 실질적으로 마감되었음에도 마감 임박으로 표시됩니다.
대기자 신청을 해주시면 추후 공석이 생길 경우 메일로 알람이 발송됩니다.
분산 처리로 그 누구보다 빠르게 난 남들과는 다르게 색다르게 분석해봅시다
이런 분들과 함께 공부하고 싶습니다.
이번 풀잎에서 다음을 얻어가고 싶으신 분들은 당장 신청해주세요! :)
- 내가 사용하고 있는 기능 외에 스파크의 다른 기능들을 알고 싶다. (ex. spark mllib, lightgbm-on-spark ...)
- 스파크를 통해 자원을 효율적으로 사용해보고 싶다.
- 다른 언어나 시스템에서 이미 데이터 분석을 해봤으나 스파크를 사용해보고 싶다.
[운영방식]
- 교재에서 9가지의 데이터 셋을 소개하는데 매주 다운 받아서 교재의 방식대로 분석해본 후,
- 창의적인 방식으로 각자 개선 후 아이디어를 나누어 봅니다.
- 온라인 모임은 ZOOM으로 진행됩니다.
- 활발한 커뮤니케이션을 위하여 화상으로 카메라와 마이크를 켜고 진행됩니다.
- 캠(혹은 캠이 내장된 노트북), 마이크 기능이 있는 이어폰을 준비해주세요.
- 마지막 주차는 모두의연구소 강남캠퍼스에서 오프라인으로 진행됩니다.
- 풀잎스쿨 14기에 한하여 온라인 과정이 165,000원으로 할인됩니다. 결제 페이지에서 온라인 전용 할인 쿠폰을 드립니다.
이런 분들께 추천합니다
- 파이썬, 스칼라 등을 데이터 분석에 자주 활용하시는 분
- 스파크를 공부했거나, 활용 중이나 분석 기능을 더 폭넓게 사용해보고 싶으신 분
- 다수 컴퓨터를 활용한 데이터 분석 방법에 관심이 있으신 분
- 다양한 배경의 맴버들과 적극 의견을 나누면서 데이터 분석을 더 잘 하고 싶으신 분
- 삽질에 자신있는 분 (어쩌면 포맷해야할 각오도 ㅎㅎㅎ;;;)
[필요한 지식]
- 스파크 Dataframe API
- 혹은 파이썬 데이터 분석 패키지 (Pandas, Scikit-learn 등)
난이도
학습유형
사전학습 (주차별 학습내용을 각자 학습한 후 모여서 토론합니다)
커리큘럼
Chapter1. 첫 만남과 스파크의 소개
1주차: 빅데이터 분석하기
2주차: 스칼라와 Pyspark를 활용한 데이터 분석

Chapter2. 9가지 사례를 통한 고급 분석
3주차: 음악 추천과 Audioscrobbler 데이터셋
4주차: 의사결정 나무로 산림 식생분포 예측하기
5주차: k-평균 군집화로 네트워크 이상 탐지하기
6주차: 숨은 의미 분석으로 위키백과 이해하기
7주차: 그래프엑스로 동시발생 네트워크 분석하기
8주차: 뉴욕 택시 운행 데이터로 위치 및 시간 데이터 분석하기
9주차: 몬테카를로 시물레이션으로 금융 리스크 추정하기
10주차: BDG 프로젝트와 유전체학 데이터 분석하기
11주차: 파이스파크와 썬더로 신경 영상 데이터 분석하기

* 우리가 더 알아야 할 것들
- DASK
- Ray on Spark

* 실습으로 진행되는 과정입니다. 참고해주세요.
교재 및 학습자료 / 준비물
- 교재 : 9가지 사례로 익히는 고급 스파크 분석
- 개인 PC(사양 무관)
풀잎스쿨이란
풀잎스쿨이란
풀잎스쿨이 무엇인가요?
연구에 필요한 기초 지식&기술을 플립러닝 방식으로 2~3개월 간 함께 집중적으로 학습하는 과정입니다.
퍼실이는 누구인가요?
‘facilitator’에서 나온 명칭으로, 풀잎스쿨 각 과정의 조력자입니다.
함께 공부하고 싶은 과정을 기획하고 풀잎 모임을 리딩 및 진행합니다.
다른 곳들과 어떤 차이점이 있나요?
수동적으로 배우게 되는 기존의 학원과 다르게 플립러닝(flipped learning, 거꾸로 학습)으로 진행됩니다.
따라서 질문과 토론을 통해 지식을 인터랙티브하게 공유하고 성장할 수 있습니다.
* 플립러닝(flipped Learning) : 거꾸로 학습. 각자 학습을 해온 후 모여서 질문, 토론 등으로 공부하는 방식
풀잎스쿨이란
풀잎스쿨 신청자분들께는 과정 시작 일주일 전에 참여 관련 안내 메일을 드릴 예정입니다.
퍼실이 소개

강성현

강성현

#분산처리_스파크 #PC 한대로 괜찮겠어? #먼저_간다~
스마트팩토리라는 막연한 단어가 유행할 때쯤 데이터 분석업무를 시작했고, 지금은 나름의 확신으로 데이터로 공장이 더 똑똑해 질 수 있다고 믿는 공장지기입니다.
데이터를 분석할 때 주로 Spark, Hadoop을 사용하는데 데이터의 추출, 전처리 과정에서만 사용하고 있었으나, 최근 Spark 3.0이 릴리즈 되면서 새로운 기능들도 궁금했고, 마이크로소프크, UC Berkeley 등이 개발한 Spark의 Eco도 늘어나면서 조금 더 스파크의 활용 폭을 넓히고 싶어서 스터디를 개설하게 되었습니다.
Dask, Ray on Spark 와 같이 새로운 분산처리 분석 툴에 대한 공부도 해볼 생각이니 탐구정신이 투철하진 분들은 꼭 함께해주세요~!
 
풀잎스쿨 / LAB 참여 이력
퍼실활동
파이썬 전문가 과정(시즌 1, 2)
파이썬 클린코드
넌 혼자가 아니야 분산처리 스파크 시즌(1, 2) 등

참여활동
베이지안 통계
Transformer is All you need
딥러닝 이미지 처리
VQA 등
환불정책
첫 모임 시작 전날까지 취소 및 전액 환불이 가능합니다.
환불 신청은 홈페이지 상단의 “문의글 작성” 에서 가능합니다.