Archivo de Internet web.archive.org


Archive.org es el sitio ideal para realizar investigaciones históricas sobre Internet, Desde 1996 cientos de ordenadores rastrean y guardan «copias» de todo el contenido posible de la Web, o al menos lo que se puede rastrear, se va almacenando para el futuro, como en una gran biblioteca. Esta organización sin ánimo de lucro con el tiempo ha ido creciendo en cuanto a medios y tecnología, y desarrollando servicios prácticos para los usuarios. Uno de ellos es la popular Wayback Machine, que permite ver una «fotografía» de cómo era una web concreta en distintas épocas, con sólo teclear su dirección. l Archivo de Internet ha estado archivando la web durante 20 años y ha conservado miles de millones de páginas web de millones de sitios web. Estas páginas web a menudo están compuestas de muchas imágenes, videos, hojas de estilo, guiones y otros objetos web, y enlazan con ellas. A lo largo de los años, el Archivo ha ahorrado más de 510 millones de objetos web con estampas de tiempo, que denominamos capturas web.

Definimos una página web como una captura web válida que es un documento HTML, un documento de texto sin formato o un PDF.

Un dominio en la web es una sección propiedad del espacio de nombres de Internet, como google.com o archive.org o bbc.co.uk. Un host en la web se identifica mediante un nombre de dominio completo o un FQDN que especifica su ubicación exacta en la jerarquía de árbol del Sistema de nombres de dominio. El FQDN consta de las siguientes partes: nombre de host y nombre de dominio. Por ejemplo, en el caso del host blog.archive.org, su nombre de host es blog y el host se encuentra dentro del dominio archive.org.

Definimos un sitio web como un host que ha servido páginas web y tiene al menos un enlace entrante de una página web perteneciente a un dominio diferente.

A partir de hoy, el Archivo de Internet tiene oficialmente 273 millones de páginas web de más de 361 millones de sitios web, ocupando 15 petabytes de almacenamiento.

https://archive.org/about/faqs.php#The_Wayback_Machine

aqui les dejo un screenshot de la pagina de 


28.348 captures
22 oct 96 - 28 mar 17



Comentarios

Entradas populares de este blog

Alter..Oracle

Robo de identidad

IPhone 3g chino (imitación perfecta)