Il nostro esercizio di completamento di un dipinto, considera le sfumature di colore e le microlinee di contorno come la vera definizione del quadro, oltre che la sua verosimiglianza e quindi l'immedesimazione. Questi microdettagli corrispondono ai minuscoli frastagliamenti di un onda sonora che sono le sue linee determinanti di questa impronta digitale che è il timbro. Tutto questo, ha una corrispondenza fisica nel numero delle armoniche che hanno una intensità sufficiente da partecipare alla somma costruttiva o distruttiva in base alla fase, e che determinano il frastagliamento che altro non è che il risultato. E' necessario sviluppare un punto tecnico. Una frequenza di campionamento, legge in una frazione di secondo molto piccola (44-48 millesimo) quel transiente di onda che sta fotografando. Ad una frequenza udibile di 18 Khz deve corrispondere una lettura di più del doppio per evitare che la somma del suo sviluppo in fase e controfase non si annulli (teorema di Nyquist). Sebbene a livello teorico le frequenze ultrasoniche non dovrebbero influenzare la nostra percezione in quanto inudibili, questo non è ancora del tutto dimostrato e anzi alcuni esperimenti sembrerebbero giustificare il sovracampionamento anche fino a 192 KHz. Nel nostro paragone col mondo visivo, potremmo fare un paragone con i pixel di una camera digitale, o con le misure dei pennelli usati per dettagliare. Un ascoltatore sa che le armoniche inudibili contribuiscono a disegnare la fondamentale nei suoi microfrastagliamenti, e che il risultato timbrico è assai lontano dall'analogico quanto più queste diruzioni non vengano ridisegnate. Difficile, invece, convincere un fisico ad identificare le caratteristiche del timbro continuando a considerare le armoniche ultrasoniche non udibili. L'attività sensoriale umana, si comporta ugualmente nel caso della visione, in cui piccole frammentazioni invisibili di colore, risultano omogenee e sfumate alla giusta distanza di visione globale. Lo studio del timbro è oggi un terreno non del tutto esplorato. I musicologi, gli psicologi e i tecnici si cimentano di tanto in tanto in teorie di percezione molto complesse. Ad oggi l'orientamento è rivolto alle tecniche di persuasione per la percezione sempre più verosimile di un suono o di un immagine. Un esempio per tutti: il sistema trinitron della Sony, è paradossalmente meno definito del sistema a punti o pixels, pur tuttavia risulta più inciso per via di una forma di mediazione che la nostra visione applica sulla partizione dei colori primari. Come per il mascheramento, piuttosto di cercare istericamente un'affrettata somiglianza alla realtà, si cerca di studiare la nostra percezione umana per poi poter “ingannare” la nostra elaborazione. Ma i problemi sono ormai noti: la soggettività dei referti e le scarse sinergie tra ingegneri e umanisti.
Il sistema digitale non è esente da problematiche legate all'ascolto, infatti può produrre dei rumori per via del complesso e miniaturizzato sistema di conversione. Il primo fra tutti è la distorsione di quantizzazione provocata da un errore del processo per questioni di approssimazione, che nella sua differenza tra il segnale originale e quello misurato produce un errore sul segnale convertito, ben udibile ai bassi livelli come mancanza di dettaglio e naturalezza. I filtri che rimuovono le frequenze alias durante la conversione sia in ingresso che in uscita sono critici in quanto possono introdurre distorsioni nelle frequenze vicine a quella limite; i nuovi filtri appositamente costruiti stanno eliminando questo problema. E' bene citare anche il dither ossia un rumore termico opportunamente lasciato sui convertitori per decorrelare gli artefatti spuri del segnale producendo un rumore di fondo più sopportabile all'orecchio di un ronzio nato dalla distorsione.