#133 #136 La diferencia entre un algoritmo decente y una función aleatoria, es que los outputs del primero se asemejarán más a los de una muestra de tamaño arbitrario de seres humanos, mientras que la función aleatoria no.
Por ejemplo, tenemos cuatro cuadros: un paisaje de un desierto (foto1), un paisaje de una selva desde el cielo (foto2), una foto de un mapache (foto3), y una foto de un cuerpo desmembrado cubierto de polvo y ceniza (foto4).
De entre 100 personas, podemos aseverar que lo más probable es que a la gente les guste más una de las tres primeras fotos, pese a que habrá alguno que le gustará la 4. Podrían hacerse estudios sobre esto y casi seguro que encontraríamos una diferencia sustancial entre qué fotos salen preferidas y cuales acaban más abajo, así como incluso establecer un orden de cuáles gustan más.
Lo más probable es que veamos uno de estos dos casos, como resultado final del estudio:
- foto2>foto3>foto1>foto4
- foto3>foto2>foto1>foto4
Puede que dependiendo de la procedencia de la persona, sus hábitos y demás, podamos observar diferencias. Una persona apartada de la sociedad, marginada y que ha recibido malos tratos, es ciertamente posible que prefiera la 4 o la 1. Alguien que se ha criado en desiertos toda su vida, quizá encuentre más acogedora la foto3 que la foto2. Alguien que odie los animales, probablemente ponga como última la foto3. Podemos encontrar muchas correlaciones, siempre dependientes del individuo.
Ahora bien, si cogemos la función aleatoria, ¿qué distribución es la más probable? ¡Ninguna! Todas ellas tienen las mismas probabilidades de ser la ganadora, o la última. No existe ninguna regla en la que basarse. Por supuesto que podemos afirmar que es tan válido su "criterio" (aunque sea inexistente) que el de las personas, por la naturaleza subjetiva de la belleza. Pero tampoco estamos imitando el "gusto" humano, pues para ello, la distribución de probabilidades para cada una de las fotos, debería ser, cuanto menos, similar.
Es decir, si tenemos 100 ordenadores cuyos gustos se asemejan a los de los seres humanos, pese a que no estaremos reproduciendo el sentido del gusto y belleza de los seres humanos como tal (pues los mecanismos son MUY distintos), sí estaremos imitándolo con cierta precisión. Podremos decir que el "criterio medio" del grupo de ordenadores, se asemeja al de los seres humanos, así como tendremos un número similar de ordenadores y humanos que se salen de la corriente.
No sé si se me entiende un poquito mejor ahora. En lugar de verificar nuestro algoritmo frente a un contexto objetivo, ¡lo hacemos frente a uno subjetivo! ¿Hemos hallado la fórmula de la belleza? No, ni de coña. Pero sí que será cierto que habremos profundizado bastante en la parte objetiva del problema, sin todavía conocer qué está por debajo de esas variables subjetivas (en el caso de los ordenadores, efectivamente, números aleatorios).
Lógicamente, Seuron, esto todo no son más que palabras. Pero me parece un tema trivial, y me sorprende que no lo veas así, porque realmente tenemos más que de sobra la capacidad de crear un sistema así. La parte más difícil, como dije bastantes posts más atrás, sería crear una IA que sacase la información necesaria de una imagen, para poder dar valor a cada parte de nuestro modelo.
Eso sí que no es trivial, eso sí que tendría bastante más tela, y dudo que una IA actual pueda analizar una imagen lo suficientemente bien como para dar valor a todas las variables que haría falta definir para establecer un modelo "de reconocimiento de la belleza" que se asemeje a los humanos con una precisión alta. Pero todo lo que hay después de obtener esos datos, me parece tan trivial como unos ifs, unos números aleatorios, y retornar un boolean xD.
edit y aclaración: Aclaro que he puesto en negrita lo de "lo más probable", porque por supuesto podemos tener una muestra de estudio poco habitual, y que salga justo lo contrario de lo que queremos. Así funciona la estadística xD. En ningún momento estoy hablando de un algoritmo infalible ni mucho menos; en este problema no veo aproximación alguna que no contenga cierta cantidad de estadística.