부스트캠프 AI Tech 4기

(Data Viz) Facet (+ 실습)

쉬엄쉬엄블로그 2023. 6. 15. 12:30
728x90

이 색깔은 주석이라 무시하셔도 됩니다.

Facet

Multiple View

  • Facet이란 분할을 의미
  • 화면상에 View를 분할 및 추가하여 다양한 관점을 전달
    • 같은 데이터셋에서 서로 다른 인코딩을 통해 다른 인사이트
    • 같은 방법으로 동시에 여러 feature를 보거나
    • 큰 틀에서 볼 수 없는 부분 집합을 세세하게 보여줄 수 있음

Matplotlib에서 구현

Figure와 Axes

  • Figure는 큰 틀, Ax는 각 플롯이 들어가는 공간
  • Figure는 언제나 1개, 플롯은 N개

NxM subplots

  • 가장 쉬운 방법은 3가지 방법
    • plt.subplot()
    • plt.figure() + fig.add_subplot()
    • plt.subplots()
  • 쉽게 조정할 수 있는 요소
    • figuresize
    • dpi
    • sharex, sharey
    • squeeze
    • aspect

Grid Spec의 활용

  • 그리드 형태의 subplots
  • 기존 Subplots로 4x4로 만들 수 있음
  • 여기서 다른 사이즈를 만들기 위해서는?

  • 이 서브플롯을 표현하기 위한 2가지 방법
    1. Slicing 사용
      • Numpy의 Slicing을 생각해 보면
        • axes[0, :3]
        • axes[1:, :3]
        • axes[3, :]
      • fig.add_grid_spec()
    2. x, y, dx, dy를 사용
      • 시작 위치, x, y와 차이 dx, dy로도 표현
      • (x, y), dx, dy 포맷으로 작성하면
        • (0, 0), 1, 3
        • (1, 0), 3, 3
        • (0, 3), 1, 4
      • fig.subplot2grid()

내부에 그리기

  • Ax 내부에 서브플롯을 추가하는 방법
    • 미니맵과 같은 형태로 추가하거나
    • 외부 정보를 적은 비중으로 추가
  • ax.inset_axes()
  • 그리드를 사용하지 않고 사이드에 추가
    • 단, 방향의 통계정보를 제공할 수도
    • 제목 등의 텍스트 추가도 가능
  • make_axes_locatable(ax)

 

실습

1. Figure & Subplots

import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

1-1. Figure & Axes

fig = plt.figure()
ax = fig.add_subplot(121)
ax = fig.add_subplot(122)
plt.show()

fig, (ax1, ax2) = plt.subplots(1, 2)

plt.show()

1-2. Figure Color

하얀 배경의 내용일 때 차트와 배경을 구분하기 위해 차트 배경 색을 조정할 수 있다.

fig, ax = plt.subplots()
fig.set_facecolor('lightgray')
plt.show()

2. Figure & Ax Properties

2-1. DPI

  • dpi : Dots per Inch

DPI는 인치에 해당하는 dot 수를 정하는 인자로 해상도를 의미한다. 기본값은 100

150, 200, 300 값 등을 조정하며 원하는 해상도로 출력할 수 있다.

fig = plt.figure()
ax1 = fig.add_subplot(121)
ax2 = fig.add_subplot(122)
ax1.plot([1, 2, 3], [1, 4, 9])
ax2.plot([1, 2, 3], [1, 2, 3])
plt.show()

fig = plt.figure(dpi=150)
ax1 = fig.add_subplot(121)
ax2 = fig.add_subplot(122)
ax1.plot([1, 2, 3], [1, 4, 9])
ax2.plot([1, 2, 3], [1, 2, 3])
plt.show()

fig.savefig('file_name', dpi=150) # png 파일로 저장, dpi를 설정하면 해상도를 설정하여 저장 가능

2-2. Sharex, Sharey

개별 ax에 대해서나 subplots 함수를 사용할 때는 sharex, sharey를 사용하여 축을 공유할 수 있다.

fig = plt.figure()
ax1 = fig.add_subplot(121)
ax1.plot([1, 2, 3], [1, 4, 9])
ax2 = fig.add_subplot(122, sharey=ax1)
ax2.plot([1, 2, 3], [1, 2, 3])
plt.show()

fig, axes = plt.subplots(1, 2, sharey=True)

axes[0].plot([1, 2, 3], [1, 4, 9])
axes[1].plot([1, 2, 3], [1, 2, 3])
plt.show()

2-3. squeeze아 flatten

subplots()로 생성하면 기본적으로 다음과 같이 서브플롯 ax 배열이 생성된다.

  • 1 x 1 : 객체 1개 (ax)
  • 1 x N 또는 N x 1 : 길이 N 배열 (axes[i])
  • N x M : N by M 배열 (axes[i][j])

numpy ndarray에서 각각 차원이 0, 1, 2로 나타난다.

이렇게 되면 경우에 따라 반복문을 사용할 수 있거나, 없거나로 구분된다.

squeeze를 사용하면 항상 2차원으로 배열을 받을 수 있고, 가변 크기에 대해 반복문을 사용하기에 유용하다.

n, m = 1, 3

fig, axes = plt.subplots(n, m, squeeze=False, figsize=(m*2, n*2))
idx = 0
for i in range(n):
    for j in range(m):
        axes[i][j].set_title(idx)
        axes[i][j].set_xticks([])
        axes[i][j].set_yticks([])
        idx+=1

plt.show()

plt.subplots()나 plt.gca()로 받는 ax 리스트는 numpy ndarray로 전달된다.

그렇기에 1중 반복문을 쓰고 싶다면 flatten() 메서드를 사용할 수 있다.

n, m = 2, 3

fig, axes = plt.subplots(n, m, figsize=(m*2, n*2))

for i, ax in enumerate(axes.flatten()):
    ax.set_title(i)
    ax.set_xticks([])
    ax.set_yticks([])


plt.show()

2-4. aspect

fig = plt.figure(figsize=(12, 5))
ax1 = fig.add_subplot(121, aspect=1)
ax2 = fig.add_subplot(122, aspect=0.5)
plt.show()

fig = plt.figure(figsize=(12, 5))
ax1 = fig.add_subplot(121, aspect=1)
ax2 = fig.add_subplot(122, aspect=0.5)

ax2.set_xlim(0, 1)
ax2.set_ylim(0, 2)
plt.show()

3. Gridspec

3-1. add_gridspec

N by M 그리드에서 슬라이싱으로 서브플롯을 배치할 수 있다.

fig = plt.figure(figsize=(8, 5))

gs = fig.add_gridspec(3, 3) # make 3 by 3 grid (row, col)

ax = [None for _ in range(5)]

ax[0] = fig.add_subplot(gs[0, :]) 
ax[0].set_title('gs[0, :]')

ax[1] = fig.add_subplot(gs[1, :-1])
ax[1].set_title('gs[1, :-1]')

ax[2] = fig.add_subplot(gs[1:, -1])
ax[2].set_title('gs[1:, -1]')

ax[3] = fig.add_subplot(gs[-1, 0])
ax[3].set_title('gs[-1, 0]')

ax[4] = fig.add_subplot(gs[-1, -2])
ax[4].set_title('gs[-1, -2]')

for ix in range(5):
    ax[ix].set_xticks([])
    ax[ix].set_yticks([])

plt.tight_layout()
plt.show()

3-2. subplot2grid

N x M 그리드의 시작점에서 delta x, delta y로 표현할 수 있다.

fig = plt.figure(figsize=(8, 5)) # initialize figure

ax = [None for _ in range(6)] # list to save many ax for setting parameter in each

ax[0] = plt.subplot2grid((3,4), (0,0), colspan=4)
ax[1] = plt.subplot2grid((3,4), (1,0), colspan=1)
ax[2] = plt.subplot2grid((3,4), (1,1), colspan=1)
ax[3] = plt.subplot2grid((3,4), (1,2), colspan=1)
ax[4] = plt.subplot2grid((3,4), (1,3), colspan=1,rowspan=2)
ax[5] = plt.subplot2grid((3,4), (2,0), colspan=3)


for ix in range(6): 
    ax[ix].set_title('ax[{}]'.format(ix)) # make ax title for distinguish:)
    ax[ix].set_xticks([]) # to remove x ticks
    ax[ix].set_yticks([]) # to remove y ticks
    
fig.tight_layout()
plt.show()

3-3. add_axes

특정 플롯을 임의의 위치에 만드는 메서드이다.

위치를 조정하여 그래프를 그리는 것이 쉽지는 않기 때문에 추천하지는 않음

fig = plt.figure(figsize=(8, 5))

ax = [None for _ in range(3)]


ax[0] = fig.add_axes([0.1,0.1,0.8,0.4]) # x, y, dx, dy
ax[1] = fig.add_axes([0.15,0.6,0.25,0.6])
ax[2] = fig.add_axes([0.5,0.6,0.4,0.3])

for ix in range(3):
    ax[ix].set_title('ax[{}]'.format(ix))
    ax[ix].set_xticks([])
    ax[ix].set_yticks([])

plt.show()

3-4. inset_axes

미니맵 등 원하는 서브플롯을 그릴 때 사용할 수 있다.

표현하고자 하는 메인시각화를 해치지 않는 선에서 사용하는 것을 추천

fig, ax = plt.subplots()
axin = ax.inset_axes([0.8, 0.8, 0.2, 0.2])
plt.show()

fig, ax = plt.subplots()

color=['royalblue', 'tomato']
ax.bar(['A', 'B'], [1, 2],
       color=color
      )

ax.margins(0.2)
axin = ax.inset_axes([0.8, 0.8, 0.2, 0.2])
axin.pie([1, 2], colors=color, 
         autopct='%1.0f%%')
plt.show()

3-5. make_axes_locatable

일반적으로 colorbar에 많이 사용한다.

from mpl_toolkits.axes_grid1.axes_divider import make_axes_locatable

fig, ax = plt.subplots(1, 1)
ax_divider = make_axes_locatable(ax)

ax = ax_divider.append_axes("right", size="7%", pad="2%")
plt.show()

fig, ax = plt.subplots(1, 1)

# 이미지를 보여주는 시각화
# 2D 배열을 색으로 보여줌
im = ax.imshow(np.arange(100).reshape((10, 10)))

divider = make_axes_locatable(ax)
cax = divider.append_axes("right", size="5%", pad=0.05)

fig.colorbar(im, cax=cax)
plt.show()

 

출처: 부스트캠프 AI Tech 4기(NAVER Connect Foundation)