분석 6

[삼성 SDS Brightics] #6_개인프젝 :: 인천인 소비금액 예측_part2.오잉? 데이터를 추가한다고?

하염! Brighics 서포터즈 3기 수망입니다! 저.. 오랜만에 개인 프로젝트 했더니 정말 탈탈 털리고 있어요 ㅎㅎ... 공부는 해도해도 끝이 없다는 말을 실감하는 요즘이에요 핳 ​ 그치만!!! 새로운걸 배우는건 언제나 조금은(ㅎ) 재밌지 않..나요?! ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 오늘 내용 아주 ... 알차요......ㅋㅋㅋㅋㅋ (그만큼 힘들었다는 뜻ㅎ) 그럼 오늘 포스팅도 바로 시작해볼게용 먼저, 스피어만 방식으로 상관관계가 구해진 그래프를 이용해 해석한 이유는 각 변수들이 정규성을 만족하지 않기 때문이에요! (Profile Table 결과창을 보면 skewed로 출력된 변수가 있을텐데요, 이건 해당 변수가 비대칭이라는 것을 의미합니다! 즉 비정규성을 띈다는 의미죠) 평균 신용+체크카드의 이용금액 합..

Brightics 2022.10.10

[삼성 SDS Brightics] #6_개인프젝 :: 인천인 소비금액 예측_part1.소개&전처리

하염! Brighics 서포터즈 3기 수망입니다! 다들 즐거운 10월을 맞이하셨나용?! 이제 2022년이 100일도 안남았어요 ㅎㅎ 2022년에 세웠던 계획들도 남은 기간 동안 잘 마무리하시길 바랄게용 자자! 오늘부터는 새로운 주제의 프로젝트를 시작할건데요. ​ 썸네일에서도 보셔서 아시겠지만~ 이번에는 "인천인" 소비금액 예측 프로젝트를 진행해보려고 합니다! ​(이번 프로젝트는 6주 진행입니다 ㅎㅎㅎ) ​ 저는 "예측" 알고리즘을 사용하는 프로젝트를 좋아하기도 하고, '소비 금액을 예측한다?!' 이건 저의 텅장을 지켜줄 수도 있으면서도, 한번은 근무해보고 싶은 카드사에게도 유용한 정보가 될 것 같더라구요! 그래서 공공데이터포털에서 발견한 '인천광역시 소비데이터'를 활용해보기로 했습니다. 인천광역시_소비 ..

Brightics 2022.10.04

[삼성 SDS Brightics] #5_팀 영상 제작 일지🎥 _③ 여러분의 컨펌은 유튜브로 모시겠습니다?!

하염~! Brighics 서포터즈 3기 수망입니다! 오늘은 팀 영상 제작 일지 #마지막편 을 들고 왔습니다!! ㅎㅎㅎㅎ [삼성 SDS Brightics] #5_팀 영상 제작 일지🎥 _②. 연기와 현타, 그 사이 어딘가.... (tistory.com) [삼성 SDS Brightics] #5_팀 영상 제작 일지🎥 _②. 연기와 현타, 그 사이 어딘가.... 하염~! Brighics 서포터즈 3기 수망입니다! 오늘은 저번 촬영일지 1편에 이어 [삼성 SDS Brightics] #5_팀 영상 제작 일지🎥 _1.유한상사+유부장=나? (tistory.com) [삼성 SDS Brightics] #5_팀 영상 제작 일지🎥.. soomang.tistory.com [삼성 SDS Brightics] #5_팀 영상 제작 일지..

Brightics 2022.09.27

[삼성 SDS Brightics] #5_팀 영상 제작 일지🎥 _②. 연기와 현타, 그 사이 어딘가....

하염~! Brighics 서포터즈 3기 수망입니다! 오늘은 저번 촬영일지 1편에 이어 [삼성 SDS Brightics] #5_팀 영상 제작 일지🎥 _1.유한상사+유부장=나? (tistory.com) [삼성 SDS Brightics] #5_팀 영상 제작 일지🎥 _1.유한상사+유부장=나? 하염! Brighics 서포터즈 3기 수망입니다! 여러분~~~! 드디어 저희 팀이 영상 제작이 시작되었어요!!! ​ 이 활동이 브라이틱스 서포터즈 활동의 꽃이자 메인이라고 할 수 있죠 ㅎㅎㅎ!!!! (이거 때문 soomang.tistory.com 촬영일지 2편을 가져왔습니다 (짝짝) (사실 일지라 쓰고 일기라고 읽어요 ㅎㅎ) ​ 저번 한 주 동안에는 무슨 일이 있었는지 지금 살펴보러 가볼까요?? https://naver.m..

Brightics 2022.09.19

[삼성 SDS Brightics] #4_개인 의료비 예측 프로젝트💊_(프로젝트 마무으리~)

하염! Brighics 서포터즈 3기 수망입니다! 오늘은 저번달 내내 포스팅했던 개인 의료비 예측 프로젝트을 요약하고 마무리하는 날이에요!!!! 바로 시작해볼게요?! ​ 1. EDA ​ 먼저 첫번째로 데이터의 분포를 확인하는 EDA를 진행했습니다. 의료비와 각 변수별 분포를 확인해보았구요! 자료화면으로는 막대그래프만 올려두었지만, 상자그림(boxplot)으로 이상치 존재유무의 추측도 함께 진행했답니당? 그리고선 전처리를 위해 변수간 상관관계를 조회해보았는데요, 확인 전, 조회 방식 채택을 위해 '정규성 검정'을 먼저 진행해보았습니당ㅎㅎ 'Normality Test' 블럭으로 실시한 정규성 검정의 결과가 전부 귀무가설을 기각하기 때문에, 스피어만 방식을 채택하게 되었습니다! ​ 상관관계 조회 'Correl..

Brightics 2022.09.05

[삼성 SDS Brightics] #4_개인 의료비 예측 프로젝트💊_(의사결정은 나무로 해야 제맛이죠~)

하염! Brighics 서포터즈 3기 수망입니다! ​ 오늘은 저저번주 포스팅부터 시작했던 개인 의료비 예측 프로젝트에서 모델링을 해보는 날이에요!!!! 지금 이 포스팅을 읽고 계시는 분덜, 혹시 제 팀원들 블로그는 다 읽고 오셨나요?!🤔 ​ 읽고 오셨다면은 ​제왚피의 하트를 받아죠..? ㅋㅋㅋㅋㅋㅋ ​​ 저는 앞서 블로그 헤드와 같이, Decision Tree🌳와 🌲🌳XGBoost🌵🌴 모델을 다루고, 여러분들께 소개해드리기로 했어요. ​ 먼저 이 두 모델에 대해 간략히 설명부터 하고 시작해볼게요! https://scikit-learn.org/stable/index.html scikit-learn: machine learning in Python — scikit-learn 1.1.2 documentatio..

Brightics 2022.08.30