신입 데이터 사이언티스트의 2023년 업무 회고록
0. 구구절절 서론
일주일 중 5일, 하루에 7시간을 일하는 직장인으로 업무 회고록이 필수적이라 느껴진다.
최소 6개월에 한번은 정기적으로 써서 업무의 방향성과 직무 적합성에 대해 돌아보기 위해 회고록을 쓴다.
데이터 분석가 겸 사이언티스트로 어쩌다 짧은 취준 기간 끝에 취업을 하게 되었고, 4월부터 3개월 인턴십을 거쳐, 5개월째 정규직으로 일하고 있다.
인턴 시절 작성한 글을 요약하면 아래와 같다.
종합
- 분석 기획, 문서 작업, sql 및 python 사용이 공통적으로 도움이 될 것 같다.
- Power bi는 자격이나 우대에 있으면 좋아서 이것 또한 괜찮고, 노코딩 툴은 음.. 잘 모르겠다. 오히려 분석 인력양성 교육으로 어필할 수 있지 않을까 싶다.
이랬다고 한다.
꽤나 솔직하고 은근 정확하다.
원래 모든 일은 그 시작에서 답이 보인다고 하고, 초심이 중요하다.
1. 진행한 업무
[분석 과제]
● DX 과제
- 최적 공정 조건 도출 2건
- 가상 계측 AI 모델링 1건
- 불량 이미지 분류 AI 모델링 1건 (진행중)
▶ 제조 계열사 중 2개 회사를 맡았다. 아마 지속적으로 하던 본부 과제를 맡을 것 같다.
▶ 사용 언어는 거의 python이다. sql은 분석용 데이터를 DB에서 추출할 때 빼고는 거의 사용하지 않았다.
▶ keras 기반의 모델링 능력은 확실히 늘었다. 예측 모델링 파트에서 웬만한 전처리나 튜닝 기법은 다 사용해봤다. 이미지 역시 keras 기반으로 모델링을 진행했다.
▶ AI 프로젝트의 전반적인 흐름은 대부분 파악했다. 모델링 프로세스는 실무도 동일하다. 다만 다른 점은 현장 적용을 위해 현업이나 플랫폼 부서와 소통을 하는 부분이다. 아직 조직의 이해관계가 명확히 정리되지도 않고, 기술적으로도 모르는 부분이 많아 따로 정리해서 명확히 파악해야할 것 같다.
▶ 분석 프로젝트의 경우, 내가 창의성을 발휘해서 한 부분이 적었던 것 같다. 올해는 제조 분석의 흐름을 파악하고, 내부적으로 진행해온 프로세스를 대부분 따랐다. 내년엔 어느정도 익숙해지면 새로운 아이디어를 많이 도출해야 한다. 이 부분은 외부 세미나를 통해서 많이 얻고, 활용하고 싶다.
● 멘토링 과제
- 주요 영향 인자 도출 1건
▶노코딩 툴을 사용한 분석은 나에게 많이 배정되지 않았다. 그래서 그런지 익숙하지 않고, 내가 사용하는 데에 있어서는 효용성도 잘 모르겠다. (아직 코딩이 편하기에..) 그러나 내년에는 현업 교육이 많아지고, 지원해야하는 과제의 양이 많아지기에 나도 내년에 같이 공부해야하지 싶다.
[인력양성 교육]
- 데이터분석 Semi-Expert 교육 보조강사 2회
- 데이터분석 Semi-Expert 교육 강사 1회
- BI 시각화 교육 보조강사 3회
▶ 보조강사는 수월하게 질의응답에 대응했는데, 실제 강사를 경험해보니 진행이 쉽지만은 않았다. 그럼에도 팀원들이 많이 지원해주셔서 첫 강사 데뷔(?)를 잘 진행한 것 같다.
▶ 아무래도 아직 강사보다는 개발자로서 더 발전하고 싶은 마음이 크다. 그렇지만 조직에서는 내가 하고 싶은 일만은 할 수 없다는 점은 아쉽지만, 주어진 일에는 최선을 다해야 한다.
[외부 교육]
- Power BI 심화 교육
- LLM 관련 교육
▶ 어떤 툴이든 심화 과정으로 들어가면 할 수 있는 것이 많다는 것을 느꼈다. 그리고 관심 분야가 아닌 llm에는 크게 관심이 생기지 않았다. 그러나 이 분야를 하려면 어느 정도의 트렌드는 필수이기에 회사에서 지원해주는 모든 교육은 다 흡수하려고 노력하자.
[기타]
- 이미지 AI 관련 발표
▶ 내가 수행한 과제가 아니라 자료를 만드는 데 어려움이 있었다. 스토리텔링이 있는 발표 자료를 만들며 많이 배웠다. 그리고 많은 사람들 앞에서 발표할 수 있는 좋은 기회였다. 어떤 발표가 있더라도 준비를 더 완벽하게, 자료를 보지 않아도 할 수 있을 정도로 해야겠다.
2. 느낀 점
실제 업무를 해본 결과, 얼마나 차이가 있을까?
인턴십 후, 기대했던 업무와 실업무의 차이를 정리해보자.
또한, 직무적합성도 돌아보자.
● 생각보다 별 거 없다. 학부 시절 수행한 프로젝트의 플로우와 유사하다. 다만, 좀 더 체계적이고 중간 과정에서의 보고가 포함되어 있다. 그 보고 과정을 다 기록하는 것이 결국 나중에 유의미하다는 것을 느꼈다.
● 모델링도 꽤나 재밌고, 창의성이 필요하다. 단순한 모델링이 아니라 결국 데이터의 대한 이해를 바탕으로 전처리가 필요하다. 남들이 쓰는 방법은 당연히 다 써보고, 내가 여러 방법론을 조합해 나만의 모델을 만드는 것이 재밌다. (그러나 3개월 이상 질질 끌면 여전히 질린다.)
● 난 멀티태스킹을 여전히 좋아한다. 다행히 우리 팀은 다양한 과제를 동시에 수행하면서, 교육도 진행해야하고, 출장도 다녀야하는 직무이다. 일이 지루할 틈이 없어서 좋다. 그런데 한번 일이 엄청 몰렸을 때는 마감기한에 스트레스를 받긴 했다.
● 중압감을 받는 task가 주어지면 스트레스를 꽤나 받는다. 많이 해볼수록 마음이 편해지고 있긴 하지만, 책임감은 느끼되 너무 부담을 가지지는 말자.
● 제조 도메인에서의 데이터 및 스마트 팩토리는 여전히 블루오션이다. 사람이 해야할 일이 많다. 자동화가 되려면 현업의 협조도 필요하기에 시간이 꽤 걸릴 것으로 예상된다.
● 모든 것이 생성형 AI가 대체할 수 있을 것 같다. 내가 필요하려면 도메인 지식에 대한 이해도와 소통 능력이 필수적이다.
● 사내의 데이터 파트의 중앙관리자로서 많은 분야의 일을 수행하고 있다. 이게 처음에는 좋았는데 자칫하다간 모든 능력치가 애매해질 수도 있다는 생각이 든다. 내가 잘하는 부분은 마스터해서 자리를 잡자.
3. 구구절절 결론 및 다짐
● 예전에는 input 대비 output이 좋은 내 모습이 좋았는데, 요즘은 아니다. 내 능력치를 알기에 input을 더 늘리면 좋지 않을까 하는 생각이 든다. (그치만 몸이 맘처럼 따라주진 않는다) 뭔들 노력한 것만큼 결과가 나온다는 생각이 든다. 그것이 꾸준히 쌓이면 정말이지 남들과 큰 차이를 낼 수 있다.
뭐든지 꾸준히 기록하고 정리하자.
● 가능하다면 내년에는 논문도 쓰고 싶다.
● 출장을 다닐 때, ktx 안에서 시간 낭비를 줄여보자. 그리고 아무리 작은 미팅의 발표라도 자료를 꼼꼼하게 만들고, 발표 연습도 하고 가자.
● 기본적이지만 메일 실수를 그만 하고, 항상 말조심 하자.
● 내년 계획을 보니 매우 바쁠 예정이다. 일에 너무 몰두하진 말자. 내가 가려는 커리어의 방향성을 항상 점검하고, 회사 밖에서는 일 생각을 하지 말자.
● 내년 안에는 부디 내가 이 분야에서 몰두하고 싶은 세부 파트를 찾길 바란다. 아마 이미지 AI가 될 확률이 높아 보이지만 트렌드를 보며 잘 고민해보자 !