sábado, 27 de noviembre de 2010

DxOMark

La fotografía digital me resulta apasionante porque combina ámbitos tan dispares como el arte, ya que permite la creación intencional de manifestaciones estéticas; la suerte, porque también pueden crearse manifestaciones estéticas de puta coña; la fría e implacable física que explicaría —para quien quiera comprenderlo— de manera enciclopédica todo el proceso que culmina con la lectura digital de valores de exposición del sensor (desde la creación y naturaleza de la luz, pasando por su interacción con los objetos, la óptica de las lentes con todas sus irregularidades, la mecánica de las piezas móviles y el control de sus vibraciones, y terminando con la mecánica cuántica imprescindible para entender realmente el ruido que afecta a la calidad de la imagen por cómo el sensor detecta fotones); las matemáticas, necesarias para transformar los datos grises del sensor en imágenes en color; y la informática (más matemáticas) del proceso digital de las imágenes para retoques, efectos y compresión de datos. En la medida en que me ha sido posible, dedicando mucho tiempo y esfuerzo, he intentado comprender todo eso... —apasionante.

DxOMark.com se me antoja como el equivalente a Copérnico y Galileo en el campo de la fotografía digital. Si uno observa la reacción de las masas foreras ante eso de que el rendimiento de sus cámaras, en las que tanta ilusión han depositado, se vea reducido a un puñado de números... y aún peor, a un ranking que puede dar sorpresas y decepciones a más de uno (sobre todo si se ha gastado una fortuna en una Olympus E5, Canon EOS 7D, EOS 1D Mark IV o una Pentax K-7), pues qué les voy a contar... Berrinches ridículos en los foros de fans, echando pestes de aquellos que osan sacrílegamente a reducir algo tan intangible y elevado como "la calidad" (incluso "el arte") a insignificantes números... Fríos y robóticos ingenieros, físicos de pacotilla, corruptos por incomprensibles intereses comerciales; qué sabrán ellos de Fotografía... Finalmente: "Los números de DxOMark no significan nada para los auténticos fotógrafos". Ah, se me olvidaba: en el otro extremo tenemos a los de dpreview.com: "¡Esos sí que analizan las cámaras pensando en la utilidad para nosotros, los fotógrafos!" —triste.

Antes de seguir, he de decir que valoro mucho el exhaustivo estudio que hace dpreview.com de todo lo que no tiene que ver con el sensor: usabilidad, calidad mecánica, rapidez, enfoque, exposición, estabilización, pantallitas, menusetes... así como las noticias y los concursos.

Pero ahora voy a intentar explicar el origen y significado de los números de DxOMark.com y la correspondencia totalmente directa y evidentemente pragmática que existe entre estos y el artista fotógrafo, ágil e intuitivo, que vive el día a día con intensidad y sencilla claridad de consciencia. No voy a escatimar en detalles, así que...
«¡Detente, Máscara de la Muerte! Parece llegado el momento de ser maa razonable.» 
Mu de Aries, en las cascadas de Roshan.

A modo general, recordad que no hay que dejarse engañar por la reducción de ruído que realizan las cámaras o los programas de edición. Aunque haya unos algoritmos de reducción de ruido peores que otros, es matemáticamente imposible no joder el detalle real de la foto con esto. Conviene comparar con/sin reducción de ruido para ver realmente el detalle que se está perdiendo.

  • "Portraits (Color depth)": Indica el margen disponible para estirar el rango tonal de una imagen en color. Ejemplo: Una foto a las nubes, sin incluír el sol. Cuando el histograma de una imagen está muy concentrado, la imagen puede resultar decepcionantemente plana, y suele mejorar mucho al estirarlo. Una mayor profundidad de color indica más capacidad para hacer esta corrección sin sacar mucho ruído. Cuando la imagen tiene un rango dinámico muy grande este indicador es irrelevante.

    • La explicación de este indicador es la más dura de las tres, pero ahí va: Un fotón sólo puede ser detectado por un único pixel (manifestación de su naturaleza corpuscular). Así resulta que la imagen se forma de manera similar a cómo funciona la herramienta "aerógrafo" de un programa cutre de dibujo como puede ser el Paint: puntito a puntito. No es intuitivo, pero la Naturaleza es así. Esto significa que dos píxeles adyacentes no tienen por qué terminar contando la misma cantidad de fotones pese a que la imagen sea perfectamente homogénea entre ellos (como en el azul del cielo). Cuanto más tiempo estemos dándole al "aerógrafo" (shutter más lento), o más intensidad tenga (apertura mayor), menor será la diferencia entre píxeles. Esto nos lleva a la relación inescapable que hay entre ISO y ruído: Una mayor sensibilidad (velocidad ISO) construye la misma imagen con menos tiempo o menos apertura, luego con más ruido fotónico. Ya tenemos parte del indicador explicado: Depende del menor ISO posible para la cámara. La otra parte que necesitamos viene de que el sensor obtiene por cada pixel un único número que es la cuenta de fotones. Cada pixel lleva delante un filtro (rojo, verde o azul), por lo que, sabiendo que cada pixel cuenta los fotones que pasan por su filtro, podemos aproximar el color RGB (tres números) de cada pixel de la imagen final. Sin embargo, los fabricantes de sensores deben decidir si estos filtros son más o menos selectivos (ver explicación del low-light ISO). Un filtro menos selectivo deja pasar más fotones de más colores diferentes, y la cuenta del pixel queda inflada o contaminada (sensor "daltónico"). Sin embargo, los números RGB de la imagen final se refieren a colores exactos, por lo que es necesaria una transformación (una matriz 3x3). Si los filtros eran poco selectivos, esta transformación amplificará el ruído de la imagen (matriz con coeficientes mayores). La segunda parte necesaria para comprender este indicador es que depende del menor daltonismo del sensor. La unidad en la que se expresa el indicador (bits) representa el logaritmo del número de colores originales que pueden distinguirse correctamente en la imagen final, que estará limitado por el ruído, para la menor velocidad ISO disponible.

  • "Landscape (Dynamic range)": Indica el margen disponible para aumentar la luminosidad de las sombras de una imagen. Ejemplo: Una foto a una calle estrecha, sacando parte del cielo. Si la imagen está correctamente expuesta para no quemar el cielo o las fachadas con sol, la calle que está a la sombra aparecerá completamente negra. Es probable que la foto quede deforme, y haya que subir la luminosidad a las sombras para equilibrar. Este indicador nos dice cúanto podemos subir luz a las sombras sin que aparezca demasiado ruído. Cuando la imagen tiene un rango dinámico pequeño este indicador es irrelevante.

    • La velocidad ISO se refiere al tiempo que tarda un sensor en alcanzar su nivel tope de cuenta (saturación), dadas ciertas condiciones estándar. Si tomamos una imagen con la exposición justa para que toque el máximo, el sensor habrá capturado la mayor cantidad posible de información lumínica. Si hacemos exactamente la misma toma pero tapando toda la luz, obtendremos una imagen que debería ser "negra"; sin embargo, no lo es. Aunque no haya ni un solo fotón de luz, la lectura del sensor siempre arrastra ruído térmico. Este ruído depende de la temperatura y de la eficiencia y calidad eléctrica del sistema de lectura del sensor. La tecnología de semiconductores avanza que es una barbaridad, y cada vez se consigue añadir menos ruído al inevitable ruído térmico (Pentax K-5, Nikon D7000). El margen dinámico de DxOMark.com representa en pasos fotográficos (en octavas logarítmicas) la distancia entre nivel de ruído de una imagen "negra" y el tope de saturación, para la menor velocidad ISO disponible. No tiene nada que ver con la estupidez que muestran en dpreview.com cuando hablan de margen dinámico.

  • "Sports (Low-Light ISO)": Indica cúanto podemos subir la velocidad ISO manteniendo una calidad aceptable de imagen. En los dos indicadores anteriores, se asume que no hay problemas de luz disponible (bien por ser de día o bien por usar un trípode), pero ahora nos enfrentamos a la escasez de luz (o a tener que usar un teleobjetivo muy largo sin trípode). Este indicador parte de una definición concreta de calidad mínima (18bits de profundidad de color y 9EVs de margen dinámico) y nos dice el ISO máximo que mantiene una relación señal/ruído en el gris medio de 30dB. Estos números son razonables pero arbitrarios, y están fijados simplemente para poder comparar.

    • El "gris medio" es una media empírica de la reflectancia a la luz visible de las superficies de todos los objetos observables (~18%). Es como la media de todos los paisajes típicos del planeta Tierra. La relación señal/ruído para este nivel del sensor representa la calidad media de una imagen cualquiera. La causuística de este indicador es la más compleja. Los dos ruídos comentados anteriormente (el fotónico amplificado por el daltonismo del sensor y el térmico) influyen en este indicador, pero el factor determinante es la eficiencia lumínica. Ésta depende en parte de la menor selectividad de los filtros (es la razón para hacerlos poco selectivos), de la cobertura real de los píxeles (no todos los fotones son detectados por algún pixel), pero principalmente del tamaño del sensor: Contri más grande sea el sensor, más fotones podrá captar; esto implica que una mayor parte de la velocidad del sensor será debida a la captación de fotones, y no a la amplificación eléctrica. A diferencia de los otros indicadores, que son logarítmicos, éste es lineal.


Todos estos indicadores se normalizan al mismo tamaño de impresión de imagen. Esto es muy importante, ya que el tamaño del grano del ruido va con la resolución, y un sensor con más megapíxeles tendrá un ruido más fino, que se notará menos, que el de un sensor con menos megapíxeles y ruido más grueso, al igualar el tamaño de la imagen final.

Para finalizar, un par de cornadas al estudio que se hace en dpreview.com sobre la imagen, presuntamente muy orientado al fotógrafo, y que en realidad es totalmente engañoso:
  • El margen dinámico de dpreview.com no dice absolutamente nada acerca de la calidad de la imagen. Sólo indica el contraste resultante de la curva de tonos que aplica el motor JPEG de la cámara, que para colmo es ajustable. Contraste no es calidad, ni se le parece. Los gráficos de curvas y escaleritas de grises que acompañan el estudio son una abstracta estupidez, y precisamente no muestran nada de interés fotográfico.

  • El "highlight headroom" es otra estupidez, más torpe aún que la anterior. Lo que están realmente mostrando es el nivel de subexposición que realiza la cámara por su cuenta, debido a la diferencia entre el ISO real del sensor y el ISO declarado. Cuando una cámara dice estar en ISO-100 pero realmente su velocidad es de ISO-80, simplemente está subexponiendo (que es lo que en dpreview.com se interpreta como "highlight headroom"). Como es lógico, el coste de este "headroom" es un mayor ruído, por tener luego que amplificar la luminosidad para corregir la subexposición. Pero lo realmente importante de todo esto es que es simplemente un criterio de exposición del fabricante, que el usuario puede forzar cuando quiera, y nunca un indicador de la calidad de la cámara.