머신 러닝 소프트웨어

이제 대부분의 필요한 지식을 습득했으니 실제로 머신 러닝을 수행해보자. 그러기 위해서는 다시 한번 넘어야 할 산이 있다. 바로 머신러닝 프로그래밍에서 자주 사용되는 소프트웨어의 설치이다.

머신러닝에서 자주 사용되는 소프트웨어들에는 다음과 같은 것들이 있다.

  • 데이터

    • numpy: 행렬 및 벡터 연산의 고속 처리
    • pandas: 시리즈 (Series), 데이터 프레임 (Data Frame)을 사용한 편리한 데이터 처리
  • 머신러닝, 인공지능 라이브러리

    • scipy: 최적화, 적분, 통계 계산등의 과학 계산
    • scikit-learn: 단순하고 효율적인 머신 러닝 알고리즘의 집합. 인터페이스가 단순하고 깨끗해 많은 소프트웨어들이 scikit-learn 의 API 형태를 많이 따르고 있다.
    • Tensorflow: 구글이 개발한 오픈 소스 딥 러닝 라이브러리. 종종 Keras와 많이 사용되며 인터스트리에서 많이 활용된다.
    • PyTorch: 메타가 개발한 오픈 소스 딥 러닝 라이브러리. 연구자들에게 인기가 많아 최신 연구 결과가 PyTorch로 제공되는 일이 많다.
    • Keras: Jax, Tensorflow, PyTorch 등 다양한 딥 러닝 라이브러리를 백엔드로 사용할 수 있는 통합 딥 러닝 라이브러리.
  • 개발 환경

    • jupyter notebook: 코드 및 데이터를 상호 작용하며 개발하는 편리한 프로그래밍 환경
    • vscode: 마이크로스프트가 개발한 소스코드 편집기
  • 데이터 시각화

    • matplotlib: 정적, 동적인 시각화 라이브러리
    • seaborn: matplotlib 상에서 개발된 시각적으로 더 아름답고 정보량이 많은 시각화 라이브러리

이 외에도 다양한 오픈 소스 도구들이 있어 그 숫자만으로도 왠지 압도되는 느낌이 든다. 그러나 너무 겁먹을 필요는 없다. 하나하나 필요한만큼 그 사용법을 설명하도록 하겠다.

Last change: 2024-01-12