diff --git a/gpt.py b/gpt.py index 7eb52e3..dfa57e9 100644 --- a/gpt.py +++ b/gpt.py @@ -90,17 +90,14 @@ def main(): # Konfiguracja treningu training_args = TrainingArguments( output_dir="./results", - num_train_epochs=30, + num_train_epochs=32, # Zwiększono liczbę epok per_device_train_batch_size=2, - learning_rate=1e-5, - weight_decay=0.01, + learning_rate=1e-5, #precyzja uczenia logging_steps=10, - save_steps=100, - eval_steps=100, - evaluation_strategy="steps", - load_best_model_at_end=True, + weight_decay=0.01, report_to="none", - save_total_limit=2, + save_strategy="no", + load_best_model_at_end=True, # Ładowanie najlepszego modelu na końcu )