데이터분석 4

인생 대박을 위한 로또 번호 추천하기

한동안 데이터를 개인의 생활에 어떻게 활용할 것인가에 대한 고민과, 데이터 분석 결과 활용의 효과성에 의문을 갖으며 상당기간 데이터 분석과 거리를 두어 왔습니다. 한 6개월 지나니 배운 게 도둑질이라고 다시금 데이터 분석에 대한 흥미가 조금씩 살아나기 시작하네요. 이전까지는 데이터 활용을 기술적인 관점에서 바라봤었다면, 앞으로는 흥미를 잃지 않고 개인의 일상에서 어떻게 활용할 수 있는지를 바탕으로 직접 활용하는 데이터 분석들을 포스팅해보고자 합니다. 배경 최근 로또 당첨 예측 서비스를 제공하며 거짓 당첨 후기 등을 동원해 10년간 사기 행각을 벌인 일당이 적발된 사건이 있었습니다. 기사를 보면 데이터 분석을 통해 로또번호 예측 서비스를 제공하면서 자신들이 제공한 번호에서 다수의 1등이 나온 것처럼 속여 ..

Data-writing 2022.10.22

데이터분석 전문가(ADP) 실기 후기

지금까지 총 5회 ADP 실기를 보면서, 정리해야지 생각만 하고 미뤄두었던 ADP 실기 이야기를 써보고자 합니다. 5번의 실기 응시 데이터 분석 및 Kaggle을 접하기 시작한 2018년, 해당 분야에 대해 어떻게 공부 해야 할지 정보가 없던 시절이었기에 관련 분야를 전반적으로 아우르는 ADP 필기/실기 공부가 좋은 지침이 될 거라는 생각을 가지고 공부를 시작한 것이 벌써 3년이 되어가고 있네요. 전공자도 아니고, 관련된 커리어에 종사하고 있지 않기에 조금은 힘을 빼고 ADP 자격증을 응시하다보니, 실기만 벌써 5번을 보았습니다.(회당 7만원...ㅠㅠ) 데이터 관련 분야로 학업을 시작하고, 최근 시험을 응시 하면서 그간 미뤄왔던 ADP 이야기를 기록 하고자 합니다. 시험의 난이도 ADP의 실기는 오픈북인..

Data-writing 2021.03.28

대본으로 놀아보기 #3 대본 감성분석, 연관분석, 토픽추출

드라마 W 대본을 활용한 데이터 분석 및 활용 ※ 실제 구현 코드는 github상의 jupyter notebook을 참고하시기 바랍니다. 이전까지(포스팅#1, 포스팅#2) 대본 분석을 위한 대본 정제, 자연어 태깅 등을 수행 하였습니다. 이번 포스팅에서는 앞에서 해본 기법들 위에 감성분석, 연관분석, 토픽추출을 해보고자 합니다. 1. 감성분석 감성 분석을 위해선 어떤 문장이 어떤 감성을 가지고 있는지를 판단하기 위한 자료를 확보하고, 이를 모델에 학습해서 우리가 원하는 문장에 예측시켜야 합니다. 이를 위해 우리는 네이버 영화리뷰로 만든 감성분석 데이터셋을 활용 합니다.(링크) 20,000개의 영화 리뷰에 대하여 별점을 기준으로 긍정(1), 부정(0)으로 구분해 놓은 자료 입니다. 이 리뷰를 형태소 별로 ..

Data-writing 2020.01.11

시대별 음악의 흐름

네이버 뮤직 '시대별 음악' 차트로 보는 1980년대~2010년대 음악 그 시절, 그때 당신의 배경음악은 무엇이었나요? 고요함에 익숙지 않은 현대인에게 음악이란 삶에 자연스럽게 흐르고 있는 무엇이었는지도 모릅니다. 어릴 적 놀이공원으로 가던 차 안에서 흐르던 음악, 좋아하는 게임을 하며 매번 틀어두었던 음악, 친구들과 함께 길을 걷다가 흐르던 음악 등, 추억을 떠올리면 특정 음악들이 겹쳐져 연상됨을 알 수 있습니다. 이를 반대로 적용하면 특정 음악이 우리를 과거의 추억으로 데려가기도 하지요. 본 글에서는 1980년대 부터 2010년대 까지 10년 단위로 정리된 네이버 음악 - 시대별 음악 차트를 훑어보려고 합니다. 큰 흐름 속에서 몰랐던 사실을 수치적으로 파악해 보며, 과거의 추억도 함께 만나보실 수 있..

Data-writing 2019.05.25
반응형