numpynp로 줄여쓰는 것처럼, 다양한 기계 학습 라이브러리의 약칭을 정리했습니다.


수학이나 통계, 기계 학습과 관련된 파이썬 환경에서는, 라이브러리의 모듈 전체를 한꺼번에 import하는 것을 선호합니다. 가져올 함수는 많은데 이것들을 하나 하나 import하는 건 여간 귀찮은 일이 아닙니다.

아예 넘파이(NumPy)는 공식 문서에서 import as를 어떻게 할 것인지 대해 명시적으로 언급합니다1. 이와 관련된 논의 또한 오래 전부터 존재해왔습니다2.

import as를 어떻게 할 것인지는 전적으로 코드 작성자의 선택입니다. 하지만 관습적으로 쓰이는 약칭을 사용한다면, 다른 사람이 나의 코드를 볼 때 내 코드의 import가 어떻게 되어있는지 굳이 확인해보지 않아도 된다는 장점이 있습니다. 기계 학습 관련 라이브러리 중 하나인 판다스(pandas)는 문서의 모든 예시 코드에서 import pandas as pd 코드가 삽입되어 있다고 가정합니다3. 때문에 pd가 무엇의 약칭인지 일일이 확인할 필요가 없습니다.

넘파이 link

넘파이의 경우, 공식 문서와 소스 코드에서 numpy 모듈을 np로 줄여쓸 것이라 명시적으로 언급합니다:

A Guide to NumPy/SciPy Documentation - NumPy:

The following import conventions are used throughout the NumPy source and documentation:

import numpy as np

맷플롯립 link

넘파이 공식 문서와 소스 코드에서는 맷플롯립(Matplotlib)의 matplotlib 모듈을 mpl, matplotlib.pyplot 모듈을 plt으로 줄여쓸 것이라 명시적으로 언급합니다:

A Guide to NumPy/SciPy Documentation - NumPy:

The following import conventions are used throughout the NumPy source and documentation:

import matplotlib as mpl
import matplotlib.pyplot as plt

맷플롯립의 다른 하위 모듈에 대한 약칭에 대해서는 명시적으로 언급하고 있지 않습니다. 공식 문서를 살펴보면 모듈 자체의 이름을 사용하거나, 아니면 모듈에서 사용할 함수나 클래스를 하나씩 from import로 가져옵니다:

How-to - Matplotlib:

import matplotlib.mlab as mlab
import matplotlib.ticker as ticker

from matplotlib.backends.backend_pdf import PdfPages

from matplotlib.figure import Figure

사이파이 link

사이파이(SciPy)의 경우 scipy 모듈에 대해 약칭을 사용하지 않을 것을 명시적으로 권고합니다4. 하위 모듈에 대해 각각 from import를 사용합니다:

Introduction - SciPy:

SciPy sub-packages need to be imported separately, for example:

>>> from scipy import linalg, optimize

다만 scipy.io 모듈은 파이썬 내장 패키지인 io와 충돌하기에, import scipy.io as spio처럼 약칭을 사용하는 것으로 보입니다:

SciPy API - SciPy:

This form of importing submodules is preferred for all submodules except scipy.io (because io is also the name of a module in the Python stdlib):

from scipy import interpolate
from scipy import integrate
import scipy.io as spio

scipy.sparse.linalg 모듈같이 한 층 더 깊이 존재하는 모듈이라면 from scipy.sparse import linalg처럼 합니다:

SciPy API - SciPy:

# second form
from scipy.stats import distributions
distributions.lomax(...)

참고:

지금은 더 이상 scipy 모듈 자체를 import하는 것을 권장하지 않지만5, 예전에는 scipy를 직접 import하고 했습니다. 당시에는 scipy 모듈 자체에 대해 sp라는 약칭을 사용하기도 했던 것으로 보입니다6.

판다스 link

판다스(pandas)의 경우 명시적으로 언급하지는 않으나, 공식 문서에서는 pandas 모듈을 pd라고 줄여씁니다:

pandas docstring guide - pandas:

Code in examples is assumed to always start with these two lines which are not shown:

import numpy as np
import pandas as pd

사이킷런 link

사이킷런(scikit-learn)의 경우 명시적으로 언급하지는 않으나, 공식 문서에서는 import as 대신 from import로 모듈, 함수, 클래스를 적절하게 불러옵니다:

A demo of the Spectral Co-Clustering algorithm - scikit-learn:

from sklearn.datasets import make_biclusters
from sklearn.cluster import SpectralCoclustering
from sklearn.metrics import consensus_score

An introduction to machine learning with scikit-learn - scikit-learn:

>>> from sklearn import datasets
>>> from sklearn import svm

대스크 link

대스크(Dask)의 경우 명시적으로 언급하지는 않으나, 공식 문서에서는 dask.dataframe 모듈을 dd로, dask.array 모듈을 da로, dask.bag 모듈을 db로 줄여씁니다:

Dask - Dask:

import dask.dataframe as dd

import dask.array as da

import dask.bag as db

그 외 모듈의 경우 from import를 통해 함수나 클래스를 직접 가져오는 것으로 보입니다:

Futures - Dask:

from dask.distributed import Client

from dask.distributed import wait

텐서플로 link

탠서플로(TensorFlow)의 경우 명시적으로 언급하지는 않으나, 공식 문서에서는 tensorflow 모듈을 tf로 줄여씁니다:

TensorFlow 2 quickstart for beginners - TensorFlow:

import tensorflow as tf

tensorflow_datasets 모듈의 경우 tfds로 줄여씁니다:

TensorFlow Datasets - TensorFlow:

import tensorflow_datasets as tfds

파이토치 link

파이토치(PyTorch)의 경우 명시적으로 언급하지는 않으나, 공식 문서에서는 import torch를 주로 사용합니다. 하위 모듈이나 함수, 클래스의 경우 이름이 짧으면 그대로 쓰고 이름이 길면 줄여 쓰는 경향이 있습니다:

Start Locally - PyTorch:

import torch

Distributed Data Parallel - PyTorch:

import torch.distributed as dist
import torch.multiprocessing as mp
import torch.nn as nn
import torch.optim as optim
from torch.nn.parallel import DistributedDataParallel as DDP

케라스 link

[케라스](Keras)의 경우 명시적으로 언급하지는 않으나, 공식 문서에서는 keraskeras 그대로 사용합니다. keras.layers의 경우 layers로 줄여쓰거나 keras.layers 그대로 사용합니다:

The Functional API - Keras:

from tensorflow import keras
from tensorflow.keras import layers

Serialization and saving - Keras:

outputs = keras.layers.Dense(1)(inputs)
  1. A Guide to NumPy/SciPy Documentation - NumPy:

    The following import conventions are used throughout the NumPy source and documentation:

    import numpy as np
    import matplotlib as mpl
    import matplotlib.pyplot as plt
    

  2. Re: Numpy-discussion Digest, Vol 19, Issue 44: 2008년 메일링 리스트에서 진행된 import as 표준화 논의 

  3. pandas docstring guide - pandas:

    Code in examples is assumed to always start with these two lines which are not shown:

    import numpy as np
    import pandas as pd
    

  4. A Guide to NumPy/SciPy Documentation - NumPy:

    Do not abbreviate scipy. There is no motivating use case to abbreviate it in the real world, so we avoid it in the documentation to avoid confusion.

  5. SciPy API - SciPy:

    These functions still exist for backwards compatibility, but should be imported from numpy directly.

  6. Basic functions in Numpy (and top-level scipy) - SciPy v0.9:

    To begin with, all of the Numpy functions have been subsumed into the scipy namespace so that all of those functions are available without additionally importing Numpy. In addition, the universal functions (addition, subtraction, division) have been altered to not raise exceptions if floating-point errors are encountered; instead, NaN’s and Inf’s are returned in the arrays. To assist in detection of these events, several functions (sp.isnan, sp.isfinite, sp.isinf) are available.