Addestrare un GPT da 20M su ImageNet-1K (classificazione come generazione) Addestrare un mini VLM decoder-only da 20M su ImageNet-1k: classificazione come generazione! 17 dicembre 2025