Ese suavizado/enventanando muestra un espectrograma más capado todavía que un 1/6 octava en estacionario (mostrando todo el espectrograma sin recortar/capar la "reverberación de la sala".
Me refiero a que cuanto más suavizado utilizas y más enventanas, "más bonitas quedan las gráficas mostradas" (porque restas detalle)
Un saludete