일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Attention
- pyTorch
- 기아
- ODQA
- 데이터 시각화
- Optimization
- AI 경진대회
- Ai
- mrc
- matplotlib
- N21
- Bert
- GPT
- Bart
- 현대자동차
- seaborn
- nlp
- 딥러닝
- 데이터 구축
- AI Math
- passage retrieval
- N2N
- 2023 현대차·기아 CTO AI 경진대회
- RNN
- Data Viz
- word2vec
- KLUE
- Self-attention
- Transformer
- dataset
- Today
- Total
목록분류 전체보기 (149)
쉬엄쉬엄블로그

이 색깔은 주석이라 무시하셔도 됩니다. Extraction-based MRC Extraction-based MRC 문제 정의 질문(question)의 답변(answer)이 항상 주어진 지문(context)내에 span으로 존재 e.g. SQuAD, KorQuAD, NewsQA, Natural Questions, etc. Extraction-based MRC datasets in Hugging Face datasets Extraction-based MRC 평가 방법 Exact Match (EM) Score 예측값과 정답이 캐릭터 단위로 완전히 똑같은 경우에만 1점 부여 하나라도 다른 경우 0점 F1 Score 예측값과 정답의 overlap을 비율로 계산 0점과 1점사이의 부분점수를 받을 수 있음 예제 Ex..

이 색깔은 주석이라 무시하셔도 됩니다. 출처: 부스트캠프 AI Tech 4기(NAVER Connect Foundation)

이 색깔은 주석이라 무시하셔도 됩니다. 관계 추출 데이터 구축 실습 과제 정의 과제 정의 시 고려할 요소 과제의 목적 관계 추출(Relation Extraction)이란 문장에 등장하는 두 개체 간의 관계를 주석하는 것이다. 관계 추출의 대상이 되는 개체명을 인식하고, 각 개체가 주체(subject)인지 대상(object)인지를 파악한 뒤 그 둘 간의 관계를 주석한다. 주체와 대상, 관계로 이루어진 트리플(triplet)을 완성한다. 특정한 도메인에 맞추어 관계 분류(Class) 목록을 확장하고, 확장된 관계로 주석한 데이터를 만든다. 데이터 구축 규모 기존 데이터의 구축 규모 기간을 정해놓고 프로젝트를 하는 경우에는 기간 내에 가능한 정도의 규모를 적당하게 잡는 것이 중요 원시 데이터 기존 데이터의 출..

이 색깔은 주석이라 무시하셔도 됩니다. 관계 추출 관련 논문 읽기 Position-aware Attention and Supervised Data Improve Slot Filling 목차 Introduction A Position-aware Neural Sequence Model Suitable for Relation Extraction The TAC Relation Extraction Dataset Data collection Dataset stratification Discussion Experiments Related Word Conclusion Appendix Overview The TAC Relation Extraction Dataset 문장이 길어졌다는 것은 문장이 그만큼 복잡해졌다는 의미이..

이 색깔은 주석이라 무시하셔도 됩니다. 관계 추출 과제의 이해 개체명 인식 & 관계 추출의 이해 관계 추출 관련 과제의 이해 개체명(Entity) 인식 NER, Named Entity Recognition 개체명이란 인명, 지명, 기관명 등과 같은 고유명사나 명사구를 의미 개체명 인식 태스크는 문장을 분석 대상으로 삼아서 문장에 출현한 개체명의 경계를 인식하고, 각 개체명에 해당하는 태그를 주석함 KLUE에서는 국제적인 기준에서 가장 널리 알려진 CoNLL 2003의 태그 체계 및 Stanford NER을 바탕으로 국내 TTA 표준 지침의 주석 가이드라인에 따라 데이터를 구축함 PS(사람), LC(지역), OG(기관), DT(날짜), TI(시간), QT(수량) 자연어처리를 한다는 것은 언어에 대한 이해가..

이 색깔은 주석이라 무시하셔도 됩니다. 데이터 구축 가이드라인 작성 기초 가이드라인의 유형 문서형 가이드라인 예시 한국어 학습자 말뭉치 구축 가이드라인 튜토리얼 가이드라인 예시 가이드라인의 구성 요소 데이터 구축 목적 정의 예시 작업자들의 작업에 대한 이해도를 높여 더 높은 품질의 데이터를 만들 수 있도록 돕는 역할 데이터 구축 가이드라인 용어 정의 예시 데이터 수집 가이드라인 예 데이터 체계 제시 예시 데이터 구축 도구 사용법 예시 가이드라인 버전 관리 가이드라인은 구축과 검수 과정을 통해 지속적으로 개정되어야 함 개정 전과 개정 후 어떤 것이 변화하였는지 비교하여 볼 수 있도록 버전 관리가 되는 것이 가장 좋음 버전별로 작성자와 개정일을 기입해두는 것이 관리에 도움이 됨 가이드라인 작성 도구 Goog..