Proyecto de análisis de Wikipedia
- Esta página del proyecto se ocupa de las estadísticas de Wikipedia. Para el WikiProject sobre la ciencia matemática de la estadística , véase WikiProject Statistics
Este proyecto , el Departamento de Estadística , ofrece un espacio para que los colaboradores interesados en las estadísticas discutan qué medir, cuándo y cómo.
Si desea ayudar, agregue su nombre a continuación y preséntese en la página de discusión . La lista de tareas pendientes que aparece a continuación es solo un comienzo...
Alcance
Este WikiProject tiene como objetivo principal diseñar, implementar y discutir la recopilación de estadísticas sobre el contenido, metacontenido, colaboradores y visitantes de Wikipedia. Buscamos entender mejor cómo las personas usan Wikipedia y su comunidad, y qué es lo que les resulta más útil. También buscamos explorar nuevas formas de agilizar la generación de estadísticas oportunas.
Por favor, añade tu nombre aquí añadiendo ~~~
Opus meum 15:16, 23 de marzo de 2017 (UTC) [ respuesta ]
Páginas
Preguntas de investigación
Contribución
- ¿Quién contribuye a Wikipedia, cuándo durante el día/la semana y con qué frecuencia?
- ¿Qué provoca picos repentinos de lectores, colaboradores y vándalos?
- ¿Existen patrones en las contribuciones? Por ejemplo, ¿edad, género, raza y nacionalidad en comparación con categorías?
- ¿Qué motivó a los principales contribuyentes? Por ejemplo, reputación, reciprocidad , altruismo, relaciones, roles. ¿Contenido gratuito, neutralidad, diseño de software, democracia, comunidad, otros?
- ¿Cómo se mantiene la calidad, validez y fiabilidad del contenido? ¿Quién lo hace y en qué medida?
- ¿Cómo contribuye la carga del servidor a la actividad de los usuarios en las horas/días posteriores a una desaceleración?
- ¿Dónde (¡en la Tierra!) están los colaboradores? ¿Hay colaboradores de Wikipedia en los países de habla inglesa, colaboradores de lengua española o portuguesa en Iberia o Latinoamérica o en otros lugares, colaboradores de lengua alemana en Alemania, Austria, Suiza o en otros lugares, etc.?
Fomentar la lectura y el consumo
- ¿Quién lee los artículos de Wikipedia y cuándo?
- ¿Qué rutas de enlace siguen a través del sitio?
- ¿Cuáles son las primeras páginas más visitadas?
- ¿Cuáles son las páginas comunes visitadas desde la página principal ?
- ¿Cómo han afectado históricamente los cambios en las páginas Cambios recientes y Principal a los clics de los usuarios en esas páginas?
- ¿Con qué frecuencia los visitantes/lectores anónimos (o visitantes de Google/Yahoo) visitan páginas como RC, Random o el Portal de la comunidad?
- ¿Cuáles son las valoraciones de los lectores sobre la calidad o utilidad de cada página?
Poniendo coto a las travesuras
- ¿Cómo podemos cuantificar el vandalismo? ¿El troleo?
- ¿Cuántos administradores están en línea en un momento dado?
- ¿Cómo se relaciona el # en línea con la cantidad de vandalismo que ocurre?
- ¿Los tiempos de respuesta rápidos disuaden a los vándalos?
- ¿Qué tan efectivos son los bloqueos y las prohibiciones? ¿Con qué frecuencia los vándalos vuelven a aparecer de inmediato como anónimos o con otra dirección IP?
- ¿Cuál es la longitud media de un bloque? ¿Cómo varía la longitud de un bloque de editores a direcciones IP?
- ¿Cuál es el tiempo medio de corrección de los actos de vandalismo? (Estudio reciente: Vandalism Survival ).
Procesos
- ¿Cómo agregan contenido distintas personas? <-- ¿Qué significa esto (además de Editar esta página)? Se necesita más información.
- Colaboradores lentos y rápidos; personas que escriben fuera de línea y personas que escriben en línea
- ¿Cuántos utilizan editores sin conexión y cargan en bloques?
- ¿Cuántas personas migran contenido de otros repositorios gratuitos a sitios de WM?
- Fotos, texto (a commons, fuente)
Metodología
Esta sección debe cubrir cómo se recopilarán y analizarán los datos de la investigación, y no el contexto o los procesos de Wikipedia (trasladado a la sección anterior).
Recopilación de datos
- Estadísticas de Webalizer
- Agregue campos opcionales en el formulario de perfil de cada miembro para edad, género, raza y nacionalidad (quizás con una opción de privacidad, para que el sistema pueda recopilar datos, pero no sean visibles para el público en general)
- Encuestas para todos en el Portal Comunitario
- Encuestas/entrevistas a los principales colaboradores
- Constructos necesarios para diferentes factores motivacionales
- Servidor de herramientas
Análisis de datos
- Definir y seleccionar estructuras de datos uniformes y software (SPSS, SAS)
- Definir variables
- Diseños correlacionales
- ANOVA/MANOVA (para datos correlacionales)
- Estadísticas post-hoc (LSD, Fischer)
- Análisis factorial
- Medidas no paramétricas (Chi-Cuadrado)
¿Advertencias?
- Privacidad
- Posible solución: limitarse a los datos disponibles públicamente y, si alguna vez se deben utilizar datos privados, no utilizar absolutamente ninguna información de identificación personal.
- Consentimiento para participar en determinadas encuestas
- Posible solución: evitar los experimentos y las encuestas de autorrespuesta, ya que, a veces, también es difícil medir la autorrespuesta. Sin embargo, las encuestas anónimas y bien estructuradas que prácticamente no tienen posibilidades de provocar "trauma psicológico" o cosas por el estilo probablemente sean seguras :P
- Efectos de retroalimentación de ciertas métricas (número de edición) a través de bucles sociales (personas que editan para obtener un recuento de ediciones)
- Posible solución/compensación: interacciones de efectos entre el número de ediciones y otros factores; análisis de una muestra aleatoria de fallas y éxitos de RfA y método para analizar la justificación primaria de los votantes.
Referencias
Resultados
Véase también
Extensión del artículo, noviembre de 2006
Extensión del artículo, julio de 2009