引言
HuggingFace LLM
HuggingFace LLM 呼叫的方式非常固定,可以用來比較各種 LLM Performance
API
Tokenizer
Model
- Model selection:文字接龍和 Chat
- Model input parameter: precision, new token …
- Direct text input and Chat template
- Output: model output and generate
评测代码
放在 ml_code/MMLU/…/.pyh
引入一般的庫。
1 |
|
這裏引入了 categories 和 subcategories 模塊中的類別和子類別信息。定義了多選題的選項,分別為 A, B, C, D。
1 |
|
將科目名稱中的下劃線替換為空格,使其更具可讀性。
1 |
|
產生 1-shot 的例子。將 pandas data frame (df) 中的單個問題格式化為文本提示。就是把 A, B, C, D 和可選擇的答案結合。如果 include_answer=True, 文本提示包括答案。
1 |
|
生成包含科目問題的訓練提示,並附上 k-shot 例子
1 |
|
評估模型
1 |
|
主程式: 利用 -m 執行 model.
1 |
|