GPT-5.4 é ruim no front-end? Testes reais, benchmarks e práticas