Archivo de Internet web.archive.org
Archive.org es el sitio ideal para realizar investigaciones históricas
sobre Internet, Desde 1996 cientos de ordenadores rastrean y guardan «copias»
de todo el contenido posible de la Web, o al menos lo que se puede rastrear, se
va almacenando para el futuro, como en una gran biblioteca. Esta organización
sin ánimo de lucro con el tiempo ha ido creciendo en cuanto a medios y
tecnología, y desarrollando servicios prácticos para los usuarios. Uno de ellos
es la popular Wayback Machine, que permite ver una
«fotografía» de cómo era una web concreta en distintas épocas, con sólo teclear
su dirección. l Archivo de Internet ha estado archivando la
web durante 20 años y ha conservado miles de millones de páginas web de millones
de sitios web. Estas páginas web a menudo están compuestas de muchas imágenes,
videos, hojas de estilo, guiones y otros objetos web, y enlazan con ellas. A lo
largo de los años, el Archivo ha ahorrado más de 510 millones de objetos web
con estampas de tiempo, que denominamos capturas web.
Definimos
una página web como una captura web válida que es un documento HTML, un
documento de texto sin formato o un PDF.
Un
dominio en la web es una sección propiedad del espacio de nombres de Internet,
como google.com o archive.org o bbc.co.uk. Un host en la web se identifica
mediante un nombre de dominio completo o un FQDN que especifica su ubicación
exacta en la jerarquía de árbol del Sistema de nombres de dominio. El FQDN
consta de las siguientes partes: nombre de host y nombre de dominio. Por
ejemplo, en el caso del host blog.archive.org, su nombre de host es blog y el
host se encuentra dentro del dominio archive.org.
Definimos
un sitio web como un host que ha servido páginas web y tiene al menos un enlace
entrante de una página web perteneciente a un dominio diferente.
A
partir de hoy, el Archivo de Internet tiene oficialmente 273 millones de
páginas web de más de 361 millones de sitios web, ocupando 15 petabytes de
almacenamiento.
https://archive.org/about/faqs.php#The_Wayback_Machine
aqui les dejo un screenshot de la pagina de
aqui les dejo un screenshot de la pagina de
| ||||

Comentarios