Creo que el ejemplo que mencionas no es aplicable.

Si dejo que hagan la encuesta a 10.000 personas, sin ni si quiera haber escuchado los temas, síempre habrá un grupo reducido que acierte las respuestas, simplemente por pura probabilidad.

Si dejo que 10.000 personas den vueltas en moto a un circuito, igual no termina ninguna, ya que es requisito saber montar en moto.

Tampoco sabemos si alguno, por el motivo que sea, utilizó alguna herramienta para verificar sus respuestas, por que esa parte no se supervisaba.

No quiero decir que sea el caso de los acertantes,
si quieres, piénsalo al revés:
si ha habido varios que las han fallado todas,¿también significaría que han detectado la diferencia y han elegido esos temas por preferencia personal? Por ejemplo, por que suenen más "delgados" y se diferencien mejor los instrumentos, etc.
¿la cuestión que se plantea es detectar la diferencia o identificar cuál son OGG?