전체 글 118

막연한 두려움의 원인에 대하여

나의 위치는 어디? 전체를 배우며 알게된 직장에서 '나'의 위치. 회사에 다니는 사람들은 자신이 전체 중 하나의 톱니바퀴라는건 이미 잘 알고 있는 사실 입니다. 톱니바퀴라는 표현이 하찬은 느낌이긴 하지만, 잘못되면 전체가 멈출 수 있는 중요한 요소 이지요. 우리는 전체 프로세스 중 일부의 역할을 하면서 직장생활을 하게 되는데요, 점점 일이 익숙해 지다보면 다음 단계를 고민하게 됩니다. 하지만, 톱니바퀴 입장에서 기계의 전체 형상이 잘 보이지 않아 어디로 가야할지 갈피를 잡지 못하는 경우가 많습니다. 저 또한 8년의 직장생활을 하면서 점점 모든 일이 똑같아 보이고, 다음 단계를 위해서는 어디로 가야 하는지 막막하던 차에 MBA를 진학하게 되었습니다. MBA 과정을 통해 프로세스적인 관점을 배우면서 직장에서..

MBA 2021.01.14

나는누구? 여긴어디?

나는 학생인가? 연말까지 회사 근무, 연초부터 학업 시작. 제가 진학한 MBA 과정은 1년 과정으로, 새해 첫날부터 강의가 시작되었습니다. 회사생활과 학업 사이에 잠시 휴식기를 두고 싶었으나 맡고있는 회사의 업무사정 반, 하루라도 벌어야 하는 경제사정 반으로 전년 말일까지 일하고 바로 수업을 시작 했네요. 수업을 시작했다곤 하지만 코로나로 인해 비대면 원격 수업으로 진행하다보니, 지금 학생이 되어 학교를 다니고 있는건지, 회사 재택근무를 하고있는건지 사실 잘 실감이 안납니다. 과연 MBA 는 학생인까요? 사회인 일까요? 대학교 신입생때 느꼈던 막연하지만 무한했던 가능성과는 다르게, 지나온 커리어와 현실적인 가능성을 계산하게 되는 MBA 신입생은 학생이고 싶은 사회인이지 않을까 생각합니다. 그럼에도 불구하..

MBA 2021.01.11

직장인의 휴직 그리고 MBA 진학

누구나 그렇듯 시작은 원대하다. 2013년 부터 시작된 회사생활, 2021년 시작과 함께 일시정지. 인생에서 가장 긴 기간동안 적을 둔 조직이었네요. 회사에서 많은 친구들을 사귀었고 다양한 사람, 다양한 부서를 경험 하면서 조직에서의 '나'의 존재는 공고해 졌지만, 업무에 있어서의 '나'는 점점 미약해짐이 느껴집니다. 시스템 속에서 잘 굴러가지만, 정작 내가 가진 고유함이 없다는 생각이 극에 달하며서 MBA에 진학을 결심하게 되었습니다. 세상의 속도가 빨라지는 만큼 MBA프로그램도 짧고 굵게 1년으로 개편되면서 수익의 공백기를 줄일 수 있어 진학을 실현할 수 있었네요. 그간 쌓이지 않고 분산되어 있는 커리어 및 경험들을 MBA로 통합하고, 이후 직장생활은 쌓아가는 경력이 될 수 있도록 30년 남은 '나'..

MBA 2021.01.02

대본으로 놀아보기 #4 대본 요약하기(실패기)

드라마 W 대본을 활용한 데이터 분석 및 활용 ※ 실제 구현 코드는 github상의 jupyter notebook을 참고하시기 바랍니다. 이전 포스팅에서는 gensim의 summerize 기능을 활용한 textrank 기반하여 문장을 만들어 보았습니다. 위 방식으로는 존재하는 문장들 중 관계있는 문장을 차례대로 나열하는데 그쳐 이번에는 다른 방식으로 대본을 요약해 보고자 합니다. 1. LSTM 모델 Keras 창시자에게 배우는 딥러닝 책에서는 LSTM을 활용하여 소설을 학습하여 새로운 문장을 구성하는 예시가 나옵니다. 이를 활용하여 대본을 학습하여 새로운 문장을 만드는 방법으로 대본 요약을 시행 해 보고자 합니다. 본 모델은 음절(문자)를 기반으로 분석하여 다음 문자가 무엇이 올지 예측하는 방법으로 문장..

Data-writing 2020.01.17

대본으로 놀아보기 #3 대본 감성분석, 연관분석, 토픽추출

드라마 W 대본을 활용한 데이터 분석 및 활용 ※ 실제 구현 코드는 github상의 jupyter notebook을 참고하시기 바랍니다. 이전까지(포스팅#1, 포스팅#2) 대본 분석을 위한 대본 정제, 자연어 태깅 등을 수행 하였습니다. 이번 포스팅에서는 앞에서 해본 기법들 위에 감성분석, 연관분석, 토픽추출을 해보고자 합니다. 1. 감성분석 감성 분석을 위해선 어떤 문장이 어떤 감성을 가지고 있는지를 판단하기 위한 자료를 확보하고, 이를 모델에 학습해서 우리가 원하는 문장에 예측시켜야 합니다. 이를 위해 우리는 네이버 영화리뷰로 만든 감성분석 데이터셋을 활용 합니다.(링크) 20,000개의 영화 리뷰에 대하여 별점을 기준으로 긍정(1), 부정(0)으로 구분해 놓은 자료 입니다. 이 리뷰를 형태소 별로 ..

Data-writing 2020.01.11

대본으로 놀아보기 #2 대본 태깅 및 탐색적 자료분석

드라마 W 대본을 활용한 데이터 분석 및 활용 ※ 실제 구현 코드는 github상의 jupyter notebook을 참고하시기 바랍니다. 이전 포스팅에서 한글파일로 되어있는 대본을 사용 가능한 테이블 형식으로 변환 하였습니다. 이번에는 대본의 문장을 태깅하여 이중 명사를 활용하여 자료분석을 수행 해보고자 합니다. 1. 데이터 불러오기 이전 포스팅에서 저장했던 대본을 불러와서 사용 합니다. 테이블 형식으로 저장되어 있기 때문에 내용과 인물등이 구분되어 활용하기 편한 상태입니다. 2. 문자 태깅 및 명사 추출 문장을 활용하기 위해서는 문장의 형태소 분석을 통해 각 형태소에 맞는 정보를 입히는 태깅 작업이 필요 합니다. 한글문장의 경우 파이썬에서는 일반적으로 공개된 것중에는 KoNLPy를 많이 사용 합니다. ..

Data-writing 2020.01.04

대본으로 놀아보기 #1 대본 정제 및 저장

드라마 W 대본을 활용한 데이터 분석 및 활용 ※ 실제 구현 코드는 github상의 jupyter notebook을 참고하시기 바랍니다. 최근 데이터 분석 및 활용 기술의 발달로 데이터만 확보하면 다양한 것들을 해볼 수 있습니다. 기본적인 데이터분석 기법들로 웹상에 공개된 데이터를 가지고 놀아볼 방법을 찾던 중, 감사하게도 송재정 작가님께서 드라마 W의 대본을 공개 해 놓은것을 발견 하였습니다.(링크) 공개해 주신 대본은 실제 촬영에 활용된 대본으로 일정한 양식을 갖춰 작성되있어 활용 가능할 것으로 판단하여 이를 활용하기로 하였습니다. 이번 포스팅에서는 공개된 대본 한글파일을 데이터 분석에 활용 가능하도록 추출하는 내용을 담아보고자 합니다. 1. 처리방법 구상 공개된 데이터는 한글파일로 되어 있는데, 데..

Data-writing 2019.12.30

시대별 음악의 흐름

네이버 뮤직 '시대별 음악' 차트로 보는 1980년대~2010년대 음악 그 시절, 그때 당신의 배경음악은 무엇이었나요? 고요함에 익숙지 않은 현대인에게 음악이란 삶에 자연스럽게 흐르고 있는 무엇이었는지도 모릅니다. 어릴 적 놀이공원으로 가던 차 안에서 흐르던 음악, 좋아하는 게임을 하며 매번 틀어두었던 음악, 친구들과 함께 길을 걷다가 흐르던 음악 등, 추억을 떠올리면 특정 음악들이 겹쳐져 연상됨을 알 수 있습니다. 이를 반대로 적용하면 특정 음악이 우리를 과거의 추억으로 데려가기도 하지요. 본 글에서는 1980년대 부터 2010년대 까지 10년 단위로 정리된 네이버 음악 - 시대별 음악 차트를 훑어보려고 합니다. 큰 흐름 속에서 몰랐던 사실을 수치적으로 파악해 보며, 과거의 추억도 함께 만나보실 수 있..

Data-writing 2019.05.25
반응형