본 글은 Pabii 이경환 대표님의 블로그 글이 너무나도 유익해 공유한 내용입니다.
저번글(Part.1)과 이어지는 글입니다.
3. 수학 수식에 집착하지마라
앞서 1번에서 했던 “하지 마라”와 일맥 상통한다. 일단 쫄지말고 써 봐라. 어차피 일반 대중에게 공개된 알고리즘들 중에 대단하고 복잡한 알고리즘 없다. 이걸 다 이해하고 쓸꺼야라고 스스로를 옥죄일 필요없이, 한 두번 써보고, 데이터 넣고 돌려보면서 Trial-and-error 해보면 어떤 알고리즘인지 감 잡을 수 있다.
그리고 그런 경험이 쌓여야지 알고리즘을 어떻게 수정해야하는지 알게 되는 것 같다. (물론 당신이 한번보면 모든 걸 다 아는 천재라면 예외겠지만…)
4. Scratch부터 다 만들려고 하지 마라 (In other words, 베껴라)
나중에 모든 프로세스가 손에, 눈에, 그리고 입에까지 익을 때쯤되면 Scratch부터 만들 수 있을지도 모른다. 그 전에는 그냥 베껴라. 그게 속 편해서가 아니라, 잘 만들어 놓은거 보고 베껴야지 빨리 는다. 교수님이 주신 R 코드들, 필자의 하드, 외장하드, 클라우드 서비스에 겹겹이 잘 보관되어 있다.
코딩하는 사람들에게 가장 지옥같은 경험은 “디.버.깅.”이다. 아마 디버깅을 해주는 머신러닝 엔진이 알파고 급으로 성장하면 아예 개발자들이 필요없어질지도 모른다. 당신이 처음 만드는 그 코드는 보나마나 수십 (아니 수백, 수천)번의 디버깅을 필요로하는 코드일 것이다. 그 시간을 아껴서, 머신러닝을 더 배우는 편을 추천한다.
개발자의 코딩이건, 수학자의 코딩이건, 통계학자의 코딩이건, 어느 누구의 코딩이건 상관없이 코딩을 처음 배울 때는 Copy & Paste부터 시작한다. 수업 때 코드를 100% 제공해주는 것도 같은 이유다.
나중에 실력이 쌓이고 난 다음에는 당연히 자기 코드가 있어야겠지만…
5. 코딩 언어를 바꾸지 마라
Matlab에서 R로 전환하던 때가 떠오른다. 정말 교수님이 엄청나게 중요한 프로젝트를 던지시면서 같이 하자고 기회를 주셨으니 망정이지, 그게 아니면 R 다시 배우기 정말 싫었을 것이다. 그리고 보스턴에 가서 다른 교수님 TA를 해주는데 Matlab으로 솔루션 만들어서 학생들한테 줘라고 하시는데, R이랑 Matlab이랑 헷갈려서 또 한참 힘들었다. 두 언어가 닮은 점이 참 많은데도 그런데, 괜히 여러개 플랫폼 쓰면서 고생하지 말았으면해서 짚고 넘어간다.
요즘 제일 유명한 플랫폼이 R과 Python인데, 아직 시작 안 했다면 아래 링크에서 시작하자.
R: http://machinelearningmastery.com/r-machine-learning-mini-course/
Python: http://machinelearningmastery.com/python-machine-learning-mini-course/
물론 데이터 사이언티스트로 살아남을려면 둘 다 공부해야한다. 배울 때 둘을 같이 배우면 헷갈려서 문제인거지, 무조건 하나만 해야된다는 뜻은 아니다.
짱짱맨 호출에 출동했습니다!!
고팍스에서 MOC상장 에어드롭 이벤트를 진행합니다.
혜자스러운 고팍스!
https://steemit.com/kr/@gopaxkr/moc
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit