삼성SDS Brightics

[삼성SDS Brightics] 개인분석미션 3-4. EDA (명절 지나가는 속도가 6G,,)

해붕 2021. 9. 23. 23:23
반응형

안녕하세요~~

Brightics 서포터즈 2기 정해웅입니다💙

Brightics 사무국의 배려로 추석동안 푹~~ 쉬고

다시 돌아왔습니다,,

현생이 적응이 안되네요 😅

마치,,

출처:https://blog.daum.net/dkgus0660/17

 

워얼화아수우모옥금퇼..

토요일이네용..!!! 퇼 같은 토욜일이 되지않길 ^.^ㅋㅋㅋㅋㅋㅋ

blog.daum.net

이 짤이 생각나는 작고 소중한 명절이였습니다,, 잘가라,, 보내줄게


지난 포스팅에서 load한 데이터를 기반으로 EDA를 진행했었는데요.

사실 이번 개인 분석 프로젝트에서 저는 모델링이나 모델 평가보다는

데이터 자체에 대한 분석에 더 무게를 두었기에

원본 데이터를 가지고 인사이트를 한 번 더 찾아보려고 합니다.. ㅎㅎㅎ

벌써 막 아이디어들이 떠올라서 재밌을 것 같습니다.

오랜만에 돌아온만큼 활기차게 시작해보겠습니다 ( •̀ ω •́ )✧


1. EDA

제가 주제로 잡은 것이

디지털 전환과 중소기업 채용 사이의 관계이기 때문에

IT/인터넷 계열에서의 채용 공고 증감 추이를 먼저 살펴보려고 합니다.

물론 디지털 전환이라는 것이 IT/인터넷 계열사 만이 해당되는 것이 아니고

금융권을 포함해서 직종 불문 전체적으로 일어나는 현상이라

IT/인터넷 계열의 중소기업만 살펴보는 것은 맞지 않으나

다른 계열의 IT관련 직무는 데이터에 포함되어 있지 않기에 생략하려고 합니다.

전체 데이터에서 IT/인터넷 계열만 뽑아내는 작업을 수행해보려고 합니다.

Brightics 내 "Filter"라는 함수를 사용하면 원하는 Column 중 원하는 Row를 선택할 수 있는

아주 유용한 기능입니다.

저도 이러한 함수가 있는 줄 모르고 script를 사용해서 빼내려고 했는데,

팀원 중 승찬이형이 알려주셔서 Brightics 함수를 이용해서 작업을 할 수 있게 되었습니다 😀

먼저 "Data load" 함수와 "Filter" 함수를 이어줍니다.

이후 IT/인터넷 계열이 궁금하기에, J4로 code화 되어있는 row를 선택합니다.

"Filter" 함수 내에서 그 column인 code를 고르고 == 'J4' 를 선택합니다.

이 때 'J4'아닌 "J4"라던가 J4를 입력하면 오류가 발생하게 됩니다.

 

 

문자열을 필터링할 때는 작!!은!!따!!옴!!표!! 잊지마세요 ㅎㅎ


이렇게 J4만 깔끔하게 뽑아낸 것을 보실 수 있죠!!

너무 편하지 않나요?! 역시 Brightics,, 엄청나,,

다음은 월 별 추이를 살펴보겠습니다.

앞서 올린 포스팅에서도 강조한 Brightics만의 시각화 기능을 다시 한 번 말씀드리자면

Table를 포함한 32개의 다양한 시각화 기능을 자유자재로 활용할 수 있습니다.

위처럼 Table로는 한 눈에 파악하기 힘든 데이터를 다른 시각화로 바꿔보겠습니다.

<Area> 기능을 활용한 모습입니다.

앞선 Table과 비교하면 확연히 달라지지 않았나요?

2018년부터 2020년 초반까지는 들쑥날쑥하던 IT/인터넷 관련 채용 공고가

2020년 6월을 기점으로 상승하는 모습을 보여줍니다.

2021년 9월에는 전과는 비교가 안될만큼 많은 공고 수가 늘어난 것을 볼 수 있습니다.

2020년 06월 IT/인터넷 계열 채용 공고: 22개

2021년 09월 IT/인터넷 계열 채용 공고: 314개

무려 1320% 증가한 것을 볼 수 있습니다,,!

(오잉 ㅋㅋ 이게 맞나?ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ)

앞선 포스팅에서 언급한 것처럼

2021년 9월 제가 추가한 데이터가 급증한 이유는 여러 가지가 있겠으니

한 번 읽어보시면 도움이 될 것 같습니다.

https://blog.naver.com/mbmb7777/222505787415

 

[삼성SDS Brightics] 개인분석미션 3-3. 데이터 Load : 부제 수작업 (과연 21년에 중소기업이 가장 많이

안녕하세요~! Brightics 서포터즈 2기 정해웅입니다 😀 지난 주까지 데이터 수집하는 과정을 거쳤습니다...

blog.naver.com


위 분석에서도 볼 수 있듯이

IT/인터넷 계열에 대한 채용 수요가 2021년에 들어 급격하게 증가한 것을 볼 수 있는데요.

그 중 세부적으로는 어떤 직무가 가장 인기가 높았는지 볼까요?

 

이번엔 <Pie> 시각화 기능을 통해 IT/인터넷 계열의 상세 직무의 공고수를 살펴보았습니다.

이렇게 상황에 맞는 시각화 기능을 잘 고르는 것도 중요한 것 같습니다.

이 때 Chart Setting 시 주의사항이 있는데요.

Color By에서는 보고 싶은 계열/상세 직무 등을 선택하고

Size By에서는 얼마나 많이 카운팅 되었나 또는 얼마나 많은 공고 수가 올라왔나를 고르는 것입니다.

이 때 채용 공고 수의 num 를 count로 설정하면

말 그대로 공고의 '갯수'가 아닌 해당 계열이 이 시간 동안 얼마나 많이 나왔나를 세는 것입니다.

이 표로 예를 들자면 Chart Setting에서 Count를 고른다면

웹디자인이 count로는 1번 카운트된 것이고

Chart Setting에서 Sum을 고른다면

웹디자인이 5번 채용공고가 올라왔다.

라고 생각하시면 됩니다!!

저도 처음에 Count로 해놓고 봤다가 뭔가 숫자가 이상해서 수정했으니

다들 조심하세요 ( ̄︶ ̄)↗ 


다시 위 <Pie> 그래프의 결과를 살펴보자면

1등은 과연...!!!

1. 웹개발: 157회

2. 응용프로그램 개발: 139회

3. 웹디자인: 116회

4. 하드웨어/소프트웨어: 113회

.

.

.

8. 인공지능(AI)/빅데이터: 42회

(인공지능/빅데이터 8위인데 왜 넣었냐구요? 그냥 제가 궁금해서 ㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎ)

보시다시피 웹 개발/디자인에서 굉장히 많은 인력을 필요로 하는 것을 볼 수 있고

개발/보안/인공지능/빅데이터와 같은 직무는 비교적 공고 수가 적은 것을 볼 수 있습니다.

사실 상식선에서 생각해봐도

'중소기업'이라는 특성 상 기본적인 프레임/플랫폼이 가장 먼저 필요로 하는 것이 사실이기 때문입니다.

중소기업 입장에서 기본적인 웹 개발자 또는 디자이너

그리고 서버 관리자

그리고!! 컨텐츠/사이트 운영자 등

기업이 운용되는 데 있어서 가장 필수적인 IT 직무 종사자들이 먼저 필요한 것이 현 상황입니다.

자연스럽게 AI/빅데이터 등 상대적으로 최신 기술 그리고 개발 또는 연구의 형태 종사자들은

중소기업 보다는 연구소나 대기업에서 더 많은 투자를 하기 마련입니다.

그러나 중소기업에서 AI/빅데이터와 같은 기술의 필요성을 못 느끼는 것은 아닙니다.

연구단에서의 자료 중 ICT 디바이스 관련 스타트업, 벤처기업 그리고 중소기업 등을 대상으로 수요조사를 한 자료를 가져와봤습니다.

Data-Network-AI 관련 기술 활용 시 애로사항에 대해서는

1. 기술 적용 초기비용

2. 직원들의 기술 숙련도 문제

3. 비즈니스 사례 부족

등의 문제를 삼았고

Brightics 같은 데이터 기술 지원 플랫폼에 대한 필요성에 대해 묻자

응답자의 93.6%가 필요하다고 응답하였습니다.

또, 중소기업중앙회에서의 조사자료를 살펴보자면

출처 : https://www.kbiz.or.kr/ko/contents/contents/contents.do?mnSeq=319

 

KBIZ 중소기업중앙회

KBIZ 중소기업중앙회 홈페이지 방문을 환영합니다.

www.kbiz.or.kr

직종별 <부족인력 확보 애로요인>을 조사한 것입니다.

그 중 IT 관련 직종만 추려봤더니

정보통신업과 컴퓨터 프로그래밍 산업에서는 가장 큰 비율로

(1) 직무능력 갖춘 지원자 없음

(2) 취업 지원자 없음

(3) 근무 여건 열악

을 뽑았고

소프트웨어 개발 중소기업 979개의 회사에서는

(1) 취업 지원자 없음

(2) 직무능력 갖춘 지원자 없음

(3) 근무 여건 열악

을 뽑았습니다.

위 결과에서 볼 수 있다시피

어쩌면 중소기업에서도 해당 직무 인원들의 수요는 분명히 있으나

그에 맞는 '직무능력을 갖춘 지원자가 없다'거나 '취업 지원자가 없다'는 것이 가장 큰 이유일 수 있겠다는 생각이 들었습니다.

https://zdnet.co.kr/view/?no=20210514142224

 

20년간 양성된 백만 IT인재는 어디로 갔나

모든 산업의 기반은 SW다. SW가 모든 산업의 성공과 실패를 좌우한다. 4차산업혁명의 시대, 디지털로 산업의 중심을 재편하는 디지털 트랜스포메이션 시대에 SW를 바로 세우...

zdnet.co.kr

위의 기사에서도 해당 SW 인력 부족에 대한 이야기를 써놨으니

참고하면 좋을 것 같습니다 :)


이렇게 해서 Brightics에서 간단한 함수를 이용하여

<중소기업의 채용 트렌드> 그 중에서도 IT/인터넷 계열의 직무 현황을 자세하게 분석해보았습니다.

제가 예측한 것과 비슷한 부분도 있고 생각 외인 부분들도 있어서 신기했습니다.

다음 포스팅에서는 "데이터 결측치 처리"에 관한 내용을 한 번 정리하고 가면 좋을 것 같아서

이 부분을 자세하게 다루는 것으로 진행해보겠습니다.

긴 글 읽어주셔서 감사합니다 💙


* Brightics 서포터즈 활동의 일환으로 작성된 포스팅입니다.

#삼성SDS #브라이틱스 #브라이틱스서포터즈 #AI #분석플랫폼 #분석프로그램 #데이터분석 #빅데이터 #인공지능 #SamsungSDS #초보자분석 #분석초보 #코딩 #코딩초보 #통계 #데이터사이언스 #Python #R #SQL #Scala #분석툴 #BrighticsAI #BrighticsStudio #브라이틱스스튜디오 #Brightics #대외활동 #대학생 #대학생대외활동 #삼성SDSBrightics #모델링