Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
19 me gusta
Recompensa
19
9
Republicar
Compartir
Comentar
0/400
LiquidationKing
· 08-10 20:16
¿Quién no ha entrenado algunos grandes modelos? ¿Qué se puede contar?
Ver originalesResponder0
TxFailed
· 08-10 04:02
la verdad es que salvé algunas gpu de derretirse esta vez, no voy a mentir
Ver originalesResponder0
Blockblind
· 08-10 01:45
trl esta trampa se está volviendo cada vez más grande
Ver originalesResponder0
OldLeekMaster
· 08-08 22:17
¡Ya está aquí! Esta actualización es un poco intensa.
Ver originalesResponder0
fren.eth
· 08-07 20:57
¡La nueva función es confiable y no tiene problemas!
Ver originalesResponder0
MondayYoloFridayCry
· 08-07 20:50
¿Esto también hay que pasarlo? No puedo soportarlo más.
Ver originalesResponder0
MeaninglessApe
· 08-07 20:48
¿No hay nada interesante en hacer esto todo el día?
Ver originalesResponder0
UncleWhale
· 08-07 20:41
Siento que el dinero está por llegar
Ver originalesResponder0
DaoDeveloper
· 08-07 20:33
es hora de profundizar en esa implementación de grpo/mpo, para ser honesto
nuevo TRL viene con soporte para GRPO y MPO para modelos de lenguaje de visión 💥
también lanzamos un explicador sobre ellos & cómo entrenar con ellos