Question 1

Hugging Face Hub에서 게이트 모델에 액세스하기 위해 어떻게 인증하나요?

Accepted Answer

huggingface_hub.login() 함수를 사용하고 메시지가 표시되면 액세스 토큰을 입력하세요. 토큰은 https://huggingface.co/settings/tokens에서 얻을 수 있습니다. 또는 HUGGINGFACE_TOKEN 환경 변수를 설정할 수 있습니다.

Question 2

AutoModel과 AutoModelForCausalLM의 차이점은 무엇인가요?

Accepted Answer

AutoModel은 작업별 헤드 없이 기본 모델을 로드하고, AutoModelForCausalLM은 텍스트 생성을 위한 언어 모델링 헤드를 추가합니다. 특징 추출에는 AutoModel을, GPT 스타일 생성 작업에는 AutoModelForCausalLM을 사용하세요.

Question 3

대형 모델을 로드할 때 메모리 사용량을 어떻게 줄일 수 있나요?

Accepted Answer

디바이스 간 자동 레이어 분산을 위해 device_map auto를 사용하고, 정밀도 감소를 위해 torch_dtype을 torch.float16 또는 torch.bfloat16으로 설정하거나, load_in_8bit 및 load_in_4bit 양자화 옵션을 사용하세요.

Question 4

모델이 생성을 실행할 때마다 다른 출력을 제공하는 이유는 무엇인가요?

Accepted Answer

텍스트 생성은 기본적으로 무작위성을 도입하는 샘플링을 사용합니다. 탐욕적 디코딩을 위해 do_sample을 False로 설정하거나, 재현 가능한 샘플링 결과를 위해 torch.manual_seed로 고정된 랜덤 시드를 사용하세요.

Question 5

추론을 위해 텍스트 배치를 처리하는 가장 좋은 방법은 무엇인가요?

Accepted Answer

자동 배치 처리를 위해 batch_size 파라미터와 함께 pipeline API를 사용하세요. 수동 처리의 경우 패딩을 활성화하여 모든 입력을 함께 토큰화하고 한 번의 순방향 패스로 배치를 모델에 전달하세요.

Question 6

작업에 적합한 모델을 어떻게 선택하나요?

Accepted Answer

Hugging Face 모델 허브를 확인하고 작업 유형별로 필터링하세요. 속도를 위해서는 DistilBERT와 같은 증류 모델을 사용하세요. 정확도를 위해서는 BERT-large와 같은 더 큰 기본 모델을 사용하세요. 특정 도메인의 경우 도메인별 파인튜닝된 모델을 검색하세요.

transformers

Tester

Audit de sécurité

Score de qualité

Ce que vous pouvez construire

사전 학습된 모델을 사용한 텍스트 분류

도메인 작업을 위한 언어 모델 파인튜닝

텍스트 생성으로 대화형 AI 구축

Essayez ces prompts

Bonnes pratiques

Éviter

Foire aux questions

Détails du développeur