Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 프메
- streamlit
- VUE
- pandas
- 메모리인식불량
- nixos한글키보드
- inxos
- 언리얼뮤지컬
- EnhancedInput
- 미니프로젝트
- 알고풀자
- flask
- 블랙스크린복구
- 마인크래프트뮤지컬
- 스트림릿
- 오픈소스
- Jinja2
- Enhanced Input System
- nixos한글설정\
- R
- Express
- JWT
- 으
- 판다스
- 디자드
- Bootstrap4
- 파이썬서버
- 정글사관학교
- 지우개신공 #pc자기진단 #ram미인식 #컴퓨터고장해결 #램인식불량 #pc자가수리 #컴퓨터고장해결 #조립pc
- ossca
Archives
- Today
- Total
Today, I will
Naive RAG, 라마인덱스 간단 구성 본문
1. from llama_index.core.settings import Settings
Settings는 RAG 시스템을 돌리기 위한 기본 도구상자 세트
(글 쪼개기, AI모델 연결하기, 글자수 조절하기, 에러관리까지 다 설정할 수 있어!)
from llama_index.core.settings import Settings
아래와 같이 글로벌한 설정이 가능하다.
Settings.
# RAG 파이프라인 글로벌 설정
Settings.embed_model = OpenAIEmbedding(
model="text-embedding-3-small"
)
Settings.llm=OpenAI(model='gpt-3.5-turbo',temperature=0)
Settings 안에 있는 속성들의 역할 정리
항목 역할
chunk_size | 텍스트를 "몇 글자 단위"로 쪼갤지 정하는 설정 (예: 긴 글을 500자씩 잘라서 처리) |
context_window | 모델이 한 번에 읽고 이해할 수 있는 "최대 길이"(너무 길면 잘라야 한다) |
embed_model | 문장을 숫자 벡터로 바꿔주는 '임베딩 모델'을 지정 (검색이나 유사도 계산용) |
global_handler | 전체 프로그램에서 에러나 특별한 상황을 다루는 "관리자" 역할(거의 자동 설정) |
llm | 실제로 텍스트를 생성하거나 답변하는 "AI 모델" 자체를 뜻(ex. gpt-3.5-turbo) |
node_parser | 글을 쪼개서 "작은 조각"으로 만드는 방법(예: 문단별로 나누기) |
num_output | LLM이 한 번에 출력할 수 있는 "최대 글자 수" (짧게 vs 길게 답변 설정) |
prompt_helper | 프롬프트(명령어)를 쓸 때 도와주는 도구(ex. 문장 형식을 예쁘게 맞춰줌) |
pydantic_program_mode | 코드 검사나 데이터 검사를 편하게 해주는 모드 설정 (프로그램 안정성 강화) |
text_splitter | 긴 문장을 적당히 "끊어주는 도구"를 고름. (예: 문장 끝에서 자르기) |
tokenizer | 글자를 AI가 이해할 수 있는 "토큰" 단위로 바꿔주는 도구 (ex. 'hello' → [15496]) |
transformations | 텍스트를 변형하거나 전처리하는 방법들을 모아둠 (ex. 소문자 변환, 특수문자 삭제) |
굉장히 다양한 설정들을 전역적으로 할 수 있어 상당히 편리하다.
다음에 더 깊게 들어가보고 싶으면,
예를 들면 embed_model이나 tokenizer 안에서 또 어떤 세부 옵션들이 있는지도 들어갈 수 있다.
'Computer Science > 인공지능,딥러닝' 카테고리의 다른 글
[Rag, OpenAI] RAG 기반 피터래빗이야기 챗봇 구축하기 (LangChain + OpenAI + Streamlit) (0) | 2025.04.30 |
---|---|
[Rag, OpenAI] RAG 기반 오만과 편견 챗봇 구축하기 (LangChain + OpenAI + Streamlit) (0) | 2025.04.30 |
[streamlit] 스트림릿 기초 ui부터 텍스트 및 이미지 서버 저장, Pandas를 통한 디비 시각화까지 다양한 실습 예제 (0) | 2025.04.16 |
[OpenAI API] LLM 스트리밍 API (stream=True) (0) | 2025.03.17 |
[OpenAI API] Completion mode vs Chat mode 차이점과 Chat mode 키워드 정리 (0) | 2025.03.17 |