부스트캠프 AI Tech 4기
(AI 서비스 개발) 내가 만든 AI 모델은 합법일까, 불법일까
쉬엄쉬엄블로그
2023. 9. 19. 11:09
728x90
이 색깔은 주석이라 무시하셔도 됩니다.
내가 만든 AI 모델은 합법일까, 불법일까
저작권법, 우리가 왜 알아야 할까?
좋은 AI 모델은 좋은 데이터로부터 나온다.
- 새롭게 데이터를 제작할 때, 저작권을 고려하지 않으면 합법적으로 사용할 수 없게 된다.
- 합법적이지 않은 데이터로 학습한 모델 또한 완전한 합법의 영역에 있다고 보기 어렵다.
학계에서도 점점 저작권과 라이센스에 대해 주목하고 있다.
아직 저작권법은 AI 모델 개발을 고려하지 않은 부분이 많다.
- 현재의 저작권법은 아직 “AI 산업”을 고려하지 않고 있다.
- AI 분야 저작권 면책조항이 신설된 저작권법 개정안이 추진되고 있는 상황
- AI와 창작자 모두를 고려한 좋은 방향의 법 개정을 위해 관심을 가질 필요가 있다
용어 정의
저작권
- 사람의 생각이나 감정을 표현한 결과물(저작물)에 대하여 창작자에게 주는 권리로 “창작성”이 있다면 별도의 등록절차없이 자연히 발생한다
저작물
- 사람의 생각이나 감정을 표현한 결과물
- 소설, 시, 논문, 강연, 연설, 각본 그 밖의 어문저작물
- 음악저작물
- 연극 및 무용, 무언극 그 밖의 연극저작물
- 회화, 서예, 조각, 판화, 공예, 응용미술저작물 그 밖의 미술저작물
- 건축물, 건축을 위한 모형 및 설계도서 그 밖의 건축저작물
- 사진저작물(이와 유사한 방법으로 제작된 것을 포함한다)
- 영상저작물
- 지도, 도표, 설계도, 약도, 모형 그 밖의 도형저작물
- 컴퓨터프로그램저작물
저작권법에 의해 보호받지 못하는 저작물
- 헌법, 법률, 조약, 명령, 조례 및 규칙
- 국가 또는 지방자치단체의 고시, 공고, 훈령 그 밖에 이와 유사한 것
- 법원의 판결, 결정, 명령 및 심판이나 행정심판절차 그 밖에 이와 유사한 절차에 의한 의결, 결정 등
- 국가 또는 지방자치단체가 작성한 것으로서 제1호 내지 제3호에 규정된 것의 편집물 또는 번역물
- 사실의 전달에 불과한 시사보도
Q. 판례 검색 서비스를 제공하는 모델을 만들어서 배포하려고 해요. 괜찮을까요?
- 가능
- 판례는 저작권법에 의해 보호받지 못하는 저작물이기 때문
Q. 특강을 보고 너무 인상깊어서 댓글을 남겼어요. 이 댓글의 저작권은 저에게 있나요?
- 댓글의 내용에 따라 다름
- “너무 좋았어요”와 같이 누구나 할 수 있는 문장이라면 보호받지 못함
- “창작성”이 인정되는 수준의 문장에는 저작권이 부여됨
합법적으로 데이터 사용하기
1. 저작자와 협의한다.
- 저작권을 아는 경우, 그 사람과 교섭해서 이용 방식에 대해 협의
- 크게 저작물 이용의 허락을 받는 것, 저작재산권을 양수받는 것 등의 방법이 있다.
저작재산권 독점적/비독점적 이용허락
- 독점적
- 독점적 이용허락의 경우, 저작자는 계약을 체결한 이용자에게 데이터 이용에 대한 “독점적”인 권리를 행사하는 것을 허락하는 것이다
- 비독점적
- 비독점적 이용허락의 경우, 저작자는 계약을 체결한 이용자 외에도 데이터 이용 계약을 맺을 수 있다
저작재산권 전부/일부에 대한 양도
- 저작재산권은 양도할 수 있는 권리
- 양수받을 경우에는 모든 저작재산권 혹은 일부의 저작재산권을 양수받을 수 있으며, 일정한 기간을 정하여 양수받을 수도 있다
Q. 일일이 계약을 맺고 사용하게 하는 방식은 저작자와 이용자 모두에게 비효율적인 것 같아요. 더 좋은 방법은 없나요?
- “라이센스”가 그 역할을 함
라이센스
- 저작자에게 이용 허가 요청을 하지 않아도 저작자가 제안한 특정 조건을 만족하면 이용이 가능하도록 만든 저작물에 대한 이용허락 규약
- 라이센스를 발행하는 단체는 다양할 수 있다.
- 가장 유명한 것은 Creative Commons라는 비영리 단체에서 제공하는 CCL이 있다
- 국내에는 문화체육관광부에서 제공하는 공공누리가 있다
Creative Commons Licnese(CCL)
종류
- CC-BY
- CC-BY-ND
- CC-BY-SA
- CC-BY-NC
- CC-BY-NC-ND
- CC-BY-NC-SA
BY : Attribution
- 저작자 표시
- 적절한 출처와, 해당 라이센스 링크를 표시하고, 변경이 있는 경우 공지
ND: NoDerivations
- 변경 금지
- 이 저작물을 리믹스, 변형하거나 2차적 저작물을 작성하였을 경우 그 결과물을 공유할 수 없음
NC : NonCommercial
- 비영리
- 이 저작물은 영리 목적으로 이용할 수 없음
- 교육과 연구 등이 비영리 목적 활용에 포함
SA : ShareAlike
- 동일조건 변경허락
- 이 저작물을 리믹스, 변형하거나 2차적 저작물을 작성하고 그 결과물을 공유할 경우에는 원 저작물과 동일한 조건의 CCL을 적용
CC-BY-NC-SA
- BY + NC + SA
- BY : 저작자 표시
- NC : 비영리
- SA : 동일조건 변경허락
- 예시
- 나무위키
Q. 나무위키 데이터를 크롤링해서 MRC 데이터셋 제작을 한 이후에 제 깃헙을 통해 배포하는 것이 가능한가요?
- 학교 소속이라면 비영리목적으로 간주되므로 가능하다.
- 하지만 배포하더라도 반드시 원 데이터의 라이센스인 CC-BY-NC-SA를 부착해야 하고, 원 데이터의 출처를 명시해야 한다.
CC-BY-ND
- BY + ND
- BY : 저작자 표시
- ND : 변경 금지
- 예시
- KorQuAD
Q. KorQuAD의 질문만 바꿔서 새롭게 MRC 데이터셋을 제작한 이후에 제 깃헙에 배포해도 될까요?
- 변경금지 조건이 걸려있기 때문에 KorQuAD의 지문, 질문, 정답쌍을 변경하여 공개하는 것은 불가능하다.
AI를 하다보면 자주 마주칠 수 있는 사례
뉴스 데이터의 이용
- 뉴스 기사의 저작권은 언론사에 있음
- 따라서 뉴스 기사를 합법적으로 사용하기 위해서는 한국언론진흥재단에 문의 또는 직접 언론사에 컨텐츠 사용 범위와 계약 조건에 대해 문의
- 혹은 아주 드물게 CCL이 적용된 언론사의 뉴스 기사를 사용
0원에 구매한 데이터는 내 마음대로 이용할 수 있을까?
- 데이터 판매회원이 정한 이용약관에 따라 다름
뉴스 기사의 제목
- 저작물로서의 가치를 인정받지 못해 저작권법의 보호를 받지 못함
공정 이용(Fair-use)
- 아래의 경우에 대해서는 저작권자의 허락을 받지 않고도 저작물을 이용할 수 있다.
- 교육, 등등
- 재판절차 등에서의 복제
- 정치적 연설 등의 이용
- 학교 교육 목적 등에의 이용
- 시사 보도를 위한 이용
- 공표된 저작물의 이용
- 영리를 목적으로 하지 않은 공연, 방송
- 사적 이용을 위한 복제
- 도서관 등에서의 복제
- 시험 문제로서의 복제
- 시각장애인 등을 위한 복제
- 방송사업가의 일시적 녹음, 녹화
- 미술, 사진, 건축저작물의 전시 또는 복제
- 번역 등에 의한 이용
- 시사적인 기사 및 논설의 복제
- 프로그램 코드 역분석
- 정당한 이용자에 의한 보존을 위한 프로그램 복제
저작권법의 회색지대
AI와 저작권법, 아직 갈 길이 멀다
- GPT-3가 생성한 데이터를 바탕으로 학습해도 될까?
- 요약 모델이 요약한 뉴스 기사의 저작권은 어떻게 될까?
- Extractive 요약의 경우는?
- Abstractive 요약의 경우는?
마무리
AI와 저작권법, Takeaways
- 저작권법의 취지는 저작권자의 권리와 이에 인정하는 권리를 보호하고 저작물의 공정한 이용을 도모함으로써 문화 및 관련 산업의 향상발전에 이바지함을 목적으로 한다
- 하지만 AI 산업에 대해서는 아직도 회색지대에 놓인 것들이 많다
- 저작물의 저작권이 있으면서 라이센스가 부착된 경우, 해당 라이센스의 이용 범위 내에서 이용 가능
- NOTE : CCL 라이센스가 아닌 다른 종류의 라이센스도 많다
- 저작물의 저작권이 있으면서 라이센스가 없는 경우, 직접 저작권자와 협의
출처: 부스트캠프 AI Tech 4기(NAVER Connect Foundation)