안녕하세요~~~~~!
Brightics 서포터즈 2기 정해웅입니다 💙
오랜만에 뵙는 것 같아요!
다들 더위 안먹고 잘지내셨나요 ㅎㅎㅎ
(저는 더위먹었답니다..)
지난 주에는 저희 [슬기로운 분석생활] 팀 내부에서 미션 기획 회의를 하느라
포스팅이 안나갔었는데요.
포스팅이 없어서 심심하셨죠..? 다 알아요..≡(▔﹏▔)≡
저희 팀이 고심 끝에 정한 <팀 분석 미션> 주제는 바로바로...
두구두구
두구
[Brightics로 데이콘 출전하기!!!] 입니다.
데이콘이란
데이터 분석이라는 분야를 접하신 분들에게는 익숙할 법도 한
데이터 분석 Competition 성격의 플랫폼입니다.
저희는 데이콘의 수많은 주제 중
[신용카드 사용자 연체 예측 AI 경진대회]
에 참여하기로 했습니다.
저희가 어떻게 이 주제를 골랐는지 살펴볼까요~~?
궁금하면 따라와~
1. 대회 선정
저희는 ZOOM으로 회의를 진행하며 분석 주제를 파악했습니다.
캐클부터 시작해서 데이콘까지 정말 다양한 제들이 후보군이였습니다.
먼저 캐글과 데이콘 중 무엇을 선택하는 것이 좋을지에 대해 의견이 분분했습니다.
캐글: 아무래도 인지도가 더 높고, 전 세계를 대상으로 하는 대회이기에 더욱 객관적인 평가를 할 수 있다는 장점
데이콘: 한국을 대상으로 열리는 대회이기에 주제가 친숙하고, 사용자에게 흥미로울 것 같음
Brightics Studio로 아주 엄청난 성능을 내기 보다는
이 플랫폼으로 분석대회에 나갈만큼 충분한 환경을 보유하고 있다.
를 보여주는 것이 목적이였기에
데이콘을 선택하게 되었습니다.
2. 주제 선정 [신용카드 사용자 연체 예측 AI 경진대회]
데이콘의 많은 주제 중 우리 팀이 가장 흥미를 느끼는 분야가 무엇일까에 대해 고민하던 중
https://dacon.io/competitions/official/235713/overview/description
[신용카드 사용자 연체 예측 AI경진대회]라는 주제를 보고
이거다!! 싶었습니다.
마이데이터 시대에서 데이터 분석가를 더더욱 필요로 하는 금융권의
문제를 다뤄보고 싶다는 생각이 들었습니다.
위에서 보시다시피
간단하게 이 분석 대회에 대해 설명하자면
사용자들의 데이터를 분석하여 신용카드 대금 연체 가능성에 대해 예측하자!
입니다.
데이터에 대해서는 상세하게 설명하겠지만,
성별, 차소유, 자식 수, 총 수입 등등 총 19개의 column을 바탕으로
credit, 즉 사용자의 신용 여부를 판단하는 것입니다.
3. 프로젝트 기획
기획서를 작성하기 위해 팀원들과 역할 분담을 했습니다.
(위 사진이랑 똑같은데,, 정지화면 아닙니다,, ㅎㅎㅎ)
- 프로젝트 주제와 배경, 변수 설명 + 데이터 설명 (하린)
- 프로젝트 목적 (예지)
- 기대 성과 (해웅)
- 일정 (승찬)
- 영상 (혜현)
이렇게 배분하고 각자 조사해오기로 했습니다.
프로젝트 주제와 배경은 위 데이콘 설명에 자세하게 나와 있으므로 생략하고
저희가 생각하는 분석 미션의 목적에 대해 작성했습니다.
가장 중요하게 생각한 포인트는
파이썬이나 R과 같은 프로그래밍 언어가 아닌 데이터분석플랫폼인 Brightics로
활용도 높은 결과물을 만들어낼 수 있을까를 염두하면 진행했습니다.
전처리에 들어가기 앞서 데이터에 대한 파악도 중요하므로 자세하게 진행했습니다.
이렇게 저희 팀미션2의 전체적인 일정도 파악했습니다.
아무래도 데이터의 이해와 EDA/전처리가 많은 부분을 차지하는게 보이시죠?
영상 기획에 대해서는
우리 막내 PD님의 좋은 아이디어 중 하나인
[구해줘 홈즈!]를 패러디하는 방향으로 진행됩니다.
Brightics의 전체적인 과정을
집 내부의 방 형태로 구상하여 영상으로 기획할 예정입니다.
PD님의 창의적인 아이디어,,, 역시,, 대단하십니다..
벌써 저희의 영상이 머릿 속에 그려지지 않으시나요??
최대한 Brightics Studio의 분석 과정을 자세하고 천천히 표현해보겠습니다 😀
이렇게 저희의 팀미션2 기획을 마치고,
현재는 데이터 전처리부터 시작하여 모델링까지
Brightics Studio의 성능은 과연.. 어디까진가.. 파악하기 위해 고군분투하고 있습니다.
다음 포스팅은 저희의 분석 과정에 대해 자세하게 말씀드리겠습니다 💙
* Brightics 서포터즈 활동의 일환으로 작성된 포스팅입니다.
#삼성SDS #브라이틱스 #브라이틱스서포터즈 #AI #분석플랫폼 #분석프로그램 #데이터분석 #빅데이터 #인공지능 #SamsungSDS #초보자분석 #분석초보 #코딩 #코딩초보 #통계 #데이터사이언스 #Python #R #SQL #Scala #분석툴 #BrighticsAI #BrighticsStudio #브라이틱스스튜디오 #Brightics #대외활동 #대학생 #대학생대외활동 #삼성SDSBrightics #모델링
'삼성SDS Brightics' 카테고리의 다른 글
[삼성SDS Brightics] 팀미션 2-3. 청하가 부릅니다. 스태킹 Stacking~🎧 (0) | 2021.08.17 |
---|---|
[삼성SDS Brightics] 팀미션 2-2. 과연 Brightics의 성능은 어느 정도일까? (0) | 2021.08.08 |
[삼성SDS Brightics] 팀미션 1-3. <속보> [분석맨] 유튜브 올라오다.. (0) | 2021.08.03 |
[삼성 SDS] ProDS, 필수역량이 된 데이터 분석 그리고 이를 위한 자격증 (0) | 2021.07.21 |
[삼성SDS Brightics] 팀미션 1-2. [분석맨] 데이터 분석 회사에서 살아남기 (feat. 장성규 말고 장틱스) (0) | 2021.07.20 |