MLops

패스트캠퍼스 챌린지 49일차

Laftel 2022. 3. 13. 20:54
반응형

정상적인 실행 후. 콘솔창이 뜬다.콘솔 창에 나와있으면 다시 레포트 형태로 제공한다거나 MLops에서 수치를 다시 활용하려고  그러면은 이 콘솔창으로 들어와서 이 수치를 가져와가지고 또 다른 어떤 공간에다가 복사 붙여넣기 한 다음에 활용해야된다. 그러면은  MLops의 완전 자동화는 아니더라도 어느 정도 자동화를 할려면 이 콘솔창에 들어오는 step 없어야 한다. 적어도 밖에서 확인할 수 있거나 자동화된 파이프라인 상에 있으면 베스트다. 그래서 이 콘솔창에 나오지 않고 이제 시각화를 어떤 레포트형태로 해줄 수 있는 오픈소스가 있다. 그 오픈소는 CML이다. 레포트형태로 시각화를 해준다.
워크플로우 자동화를 어떻게 해주냐면 모델의 훈련과 평가를 해주는 것을 도와줄 수 있는 데 결과와 매트릭에 대한 시각적인 레포트를 생성해준다.PI가 일어날때마다 자동적으로 해준다.

CML 을 사용하여 성능 지표를 레포트 형태로 출력하기

  • CML : 데이터 사이언스 프로젝트를 지속적으로 통합시키기 위한 오픈소스
  • GitHub - iterative/cml: ♾️ CML - Continuous Machine Learning | CI/CD for ML
  • Markdown 형식으로 내보내기
  • echo "## MODEL METRICS" > report.md cat metrics.txt >> report.md
  • CML Command 를 사용하여 분석 결과 이미지를 Markdown 형식으로 내보내기
    echo "## Data viz" >> report.md
    cml-publish feature_importance.png --md >> report.md
    cml-publish residuals.png --md >> report.md
    cml-send-comment report.md
    
  • Build

분석 코드 변경 후 재배포 시 레포트 재생성 하기

  • 분석 코드 변경
    • max_depth 를 2 → 5 변경
    • commit 변경
    • Build
  • 결과 변화 확인
  • Commit 기록으로 해당 변화 시의 데이터,코드,환경 확인 가능

DVC 를 활용하여 Metric 의 변화 추적하기

  • Github Repo Fork
    • 데이터 확인 및 다운로드
    • process_data.py 실행
    • train.py 실행
    • ## AttributeError: 'Series' object has no attribute 'to_numpy' 에러 시 참고
    • pip install --upgrade pandas
  • Metric 의 변화는 어떻게 알 수 있을까?
    • Git diff
      • 수치 비교보다는 코드의 변화를 알기 위해 보통 사용하므로 활용이 어렵다.
      • 파일 변경 이력을 알기 어렵다 → 모델링 전략 변경을 알기 어렵다.
    • DVC 사용!
      • install dvc

             pip install dvc


#직장인인강 #직장인자기계발 #패스트캠퍼스후기#온라인패키지:머신러닝서비스구축을위한실전MLOps#머신러닝서비스구축을위한실전MLOps온라인패키지Online.
https://bit.ly/37BpXiC

 

패스트캠퍼스 [직장인 실무교육]

프로그래밍, 영상편집, UX/UI, 마케팅, 데이터 분석, 엑셀강의, The RED, 국비지원, 기업교육, 서비스 제공.

fastcampus.co.kr

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.

반응형