일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 프메
- 으
- Enhanced Input System
- Express
- 알고풀자
- 언리얼뮤지컬
- node
- 게임개발
- VUE
- 디자드
- 스터디
- 미니프로젝트
- flask
- 데이터베이스
- 정글사관학교
- Unseen
- Ajax
- 언리얼
- 스마일게이트
- 파이썬서버
- R
- EnhancedInput
- Jinja2
- 언리얼프로그래머
- JWT
- 마인크래프트뮤지컬
- 레베카
- 카렌
- 프린세스메이커
- Bootstrap4
- Today
- Total
Showing
허깅페이스 한국어 데이터셋 본문
한국어 자연어 처리(NLP)와 관련된 다양한 작업을 수행하기 위해서는 적합한 모델을 선택하는 것이 중요하다. 한국어 감성 분석, 질문-답변, 텍스트 생성, 기계 번역 등의 NLP 태스크를 수행하기 위해서는 충분한 데이터셋이 필요하다. 아래에 소개된 모델들은 한국어 데이터셋으로 학습된 모델들이다.
이 모델들이 사용한 데이터셋의 상세한 정보는 각 모델의 공식 문서나 출처에서 확인할 수 있다.
1. sangrimlee/bert-base-multilingual-cased-nsmc
한국어 감성 분석을 위해 "sangrimlee/bert-base-multilingual-cased-nsmc" 모델을 사용할 수 있다.
https://huggingface.co/sangrimlee/bert-base-multilingual-cased-nsmc
nsmc는 네이버 영화 리뷰 데이터셋(네이버 감성 분석 코퍼스)이다.
이 데이터셋은 네이버 영화 리뷰의 감성 분석을 위해 만들어졌으며, 긍정과 부정 리뷰를 구분하는 데 사용된다.
모델은 네이버 영화 리뷰 데이터로 학습된 BERT 모델을 사용하여 텍스트의 감정을 분석하는 기능을 제공한다.
2. klue/bert-base-mrc
한국어 질문-답변(QA) 작업을 위해 "klue/bert-base-mrc" 모델을 사용할 수 있다.
https://huggingface.co/ainize/klue-bert-base-mrc
klue는 한국어 언어 이해 평가(KLUE) 프로젝트의 약자로, KLUE는 한국어 자연어 처리(NLP)를 위한 다양한 태스크와 데이터를 제공하는 프로젝트이다.
3. skt/kogpt2-base-v2
SKT에서 파인튜닝한 한국어 GPT-2 모델인 "skt/kogpt2-base-v2"도 있다.
이 모델은 SKT AI 연구팀이 한국어 데이터를 사용해 GPT-2를 학습시켜 생성된 모델이다.
https://huggingface.co/skt/kogpt2-base-v2
코드에서 text라는 입력 문장을 기반으로 새로운 문장을 생성하는 작업을 수행한다.. 이를 통해 텍스트 생성(Text Generation) 작업을 할 수 있다.
4. Helsinki-NLP/opus-mt-ko-en
Helsinki-NLP/opus-mt-ko-en" 모델을 불러와 한국어 텍스트를 영어로 번역할 수도 있다.
https://huggingface.co/Helsinki-NLP/opus-mt-ko-en
Seq2Seq(Sequence-to-Sequence) 번역 모델을 사용하는 AutoModelForSeq2SeqLM과 AutoTokenizer를 활용, 사용된 opus-mt-ko-en 모델은 Helsinki-NLP에서 제공하는 한국어-영어 번역을 위한 모델이다.
generate 메서드를 사용하여 입력된 문장을 번역하는 작업을 수행한다.
'컴퓨터 공학, 전산학 > 인공지능,딥러닝' 카테고리의 다른 글
[인공지능 셋업] M1 및 M2와 같은 Apple Silicon에서 PyTorch MPS 가속 (0) | 2024.10.31 |
---|---|
[인공지능] 텐서플로로 선형 회귀 모델 학습하기: 경사 하강법을 이용한 최적화 (0) | 2024.10.30 |
[인공지능] 경사하강법 (0) | 2024.10.30 |
AI가 자화상을 그린다면 (8) | 2024.10.27 |
[인공지능, 딥러닝] 데이터 클러스터링과 차원 축소 (1) | 2024.10.22 |