Cómo será el archivo de Twitter en la Biblioteca del Congreso de EE.UU

En abril del 2010 Twitter aunció la entrega de su archivo completo de tweets a la Biblioteca de Congreso de EE. UU. Esto incluye todos los tweets públicos desde la creación de Twitter en 2006.

Martha Anderson, directora del Programa de Preservación de Información digital de la Biblioteca, señala que la creación y el mantenimiento del archivo será un gran reto, incluso con la larga experiencia de la Biblioteca archivando información «de origen digital». Sobre todo si se toma en cuenta que se producen 50 millones de tweets cada día.

Cada tweet será tomado como un archivo JSON. Este contiene información no sólo del tweet en sí mismo, sino también día y hora en que fue publicado, número de followers de la cuenta, cuando fue creada, localización, entre otros.

Anderson afirma que la idea no es hacer un archivo público de esta información, sino más bien catalogarla y ordenarla de manera que sea accesible sobre todo a investigadores.

Esto requiere un desarrollo tecnológico significativo de parte de la Biblioteca con el fin de construir la infraestructura necesaria para responder a preguntas, especialmente las preguntas de los investigadores.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *