2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

なんJNVA部★350

651 :今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった :2024/03/05(火) 02:07:25.74 ID:grPNMGVe0.net
LoRA学習始めてみたんやけど、
ステップ数が同じ条件で、バッチ1とバッチ24(gradient_checkpointingあり)で比較してみたら
バッチ1の方が圧倒的に反映出来てたんやけど、ここまで違いでるもんなんかな

バッチ24でステップ数増やしたら改善されたから、gradient_checkpointing入れたらステップ数上げなアカン感じ?
ちなAdamW8bitでdim8

総レス数 1001
269 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★