#88 el scraping hay que hacerlo en local, el bicho protesta mucho si son muchas páginas y hace el vago xD
Flipa, 200 post en ese hilo, buen analisis de estadistica
Y ahora mis posts tienden a casi 1 o 2 por año en ese hilo
¿Qué tipo de desviación has usado? Más que nada porque ahora estudio medicina y el año que viene tenemos bioestadistica (no es más que estadistica basada en medicina)
#91 Jajajajaj me lo temia... entonces, scrap local y lo lanzas a la API? O simplemente sacas todo el tocho y se lo metes por archivo directo? Word, TXT o XLS?
La estadística de cuantas veces dejan las mujeres vs hombres no la pones o es que no la encuentro?
O ya asumimos de serie que el 99% de las veces son las mujeres las que dejan y por eso no hacia falta recalcarlo?
#96 Se podría deducir el género a raíz de una serie de palabras comunes con términos masculinos o femeninos y ver cuales son más frecuentes en ese usuario.
Luego habría que preguntar manualmente a las usuarias (que no creo que sean muchas) para ver el grado de confianza
Ideas locas que se me ocurren, no se si será dificil pero el planteamiento parece "sencillo". Estoy metiéndome en el mundillo de Data Analyst y este tipo de proyectillos me parecen muy interesantes, tengo ganas de hacer cosas parecidas con hilos de mierda xD
#97 sí, además es relativamente sencillo recorrer los últimos 100-200 posts de un usuario (en general de todo el foro) y sacar palabras que acaben en o/a. Eso es fácil, pero no te garantiza nada, necesitas más, como un diccionario previo con palabras para matchear.