머신 러닝 소프트웨어
이제 대부분의 필요한 지식을 습득했으니 실제로 머신 러닝을 수행해보자. 그러기 위해서는 다시 한번 넘어야 할 산이 있다. 바로 머신러닝 프로그래밍에서 자주 사용되는 소프트웨어의 설치이다.
머신러닝에서 자주 사용되는 소프트웨어들에는 다음과 같은 것들이 있다.
-
데이터
-
머신러닝, 인공지능 라이브러리
- scipy: 최적화, 적분, 통계 계산등의 과학 계산
- scikit-learn: 단순하고 효율적인 머신 러닝 알고리즘의 집합. 인터페이스가 단순하고 깨끗해 많은 소프트웨어들이 scikit-learn 의 API 형태를 많이 따르고 있다.
- Tensorflow: 구글이 개발한 오픈 소스 딥 러닝 라이브러리. 종종 Keras와 많이 사용되며 인터스트리에서 많이 활용된다.
- PyTorch: 메타가 개발한 오픈 소스 딥 러닝 라이브러리. 연구자들에게 인기가 많아 최신 연구 결과가 PyTorch로 제공되는 일이 많다.
- Keras: Jax, Tensorflow, PyTorch 등 다양한 딥 러닝 라이브러리를 백엔드로 사용할 수 있는 통합 딥 러닝 라이브러리.
-
개발 환경
- jupyter notebook: 코드 및 데이터를 상호 작용하며 개발하는 편리한 프로그래밍 환경
- vscode: 마이크로스프트가 개발한 소스코드 편집기
-
데이터 시각화
- matplotlib: 정적, 동적인 시각화 라이브러리
- seaborn: matplotlib 상에서 개발된 시각적으로 더 아름답고 정보량이 많은 시각화 라이브러리
이 외에도 다양한 오픈 소스 도구들이 있어 그 숫자만으로도 왠지 압도되는 느낌이 든다. 그러나 너무 겁먹을 필요는 없다. 하나하나 필요한만큼 그 사용법을 설명하도록 하겠다.