
Michael Cain
0
4590
707
Dicen que en Internet, nada desaparece. Nada se borra de Internet, nunca. Así es cómo. Nada se elimina de Internet, nunca. Así es cómo. Estas personas están tratando de hacer una copia de seguridad de todo en la web. Es un gran trabajo, pero puedes ayudar. .
Esto es cierto para el contenido popular que se comparte y se mezcla de forma interminable. Pero este tipo de dulce viral es solo la punta de un iceberg realmente grande. Debajo de la superficie de memes y celebridades desnudas se esconde un sinfín de petabytes de datos demasiado aburridos para la inmortalidad. Fotos de bodas, ensayos universitarios, videos caseros 10 consejos simples para hacer que los videos caseros se vean profesionales 10 consejos simples para hacer que los videos caseros se vean profesionales A medida que las cámaras de los teléfonos móviles han mejorado progresivamente, se han convertido en herramientas confiables para grabar videos sobre la marcha. Aquí hay 10 consejos para que tus videos se vean profesionales. , correos electrónicos antiguos: la mayoría de nuestros datos pertenecen a esta categoría y pueden ser inquietantemente efímeros.
Una de las principales lecciones de la física es que la termodinámica odia tus entrañas. Los datos de la computadora no son una excepción. La memoria flash pierde su carga en menos de una década. Incluso en condiciones ideales, los discos duros magnéticos no durarán más de diez años. Los CD, en condiciones ideales, también duran unos diez. La cinta magnética, el estándar de oro para el almacenamiento de datos a largo plazo para la industria, deja de ser legible después de treinta a cincuenta años..
Cómo muere la información digital
Esto plantea un problema, porque hace que el almacenamiento de datos requiera esfuerzo. Cualquier cosa que no sea lo suficientemente interesante como para preservar activamente del disco duro al disco duro, del servicio en la nube al servicio en la nube, simplemente deja de existir. El 99% de nuestros datos simplemente se desechan en vertederos y compañías de Internet fallidas. Incluso para los datos que nos interesan, el pronóstico no es bueno.
Considere los problemas que plantea la compresión de datos. Para ahorrar espacio de almacenamiento y ancho de banda, a menudo utilizamos formatos de archivo (como .jpg y .mp4) que comprimen su contenido ¿Cómo funciona la compresión de archivos? ¿Cómo funciona la compresión de archivos? ¿Cómo funciona la compresión de archivos? Aprenda los conceptos básicos de la compresión de archivos y la diferencia entre compresión con pérdida y sin compresión. de alguna manera. Los algoritmos de compresión utilizados vienen en dos tipos generales: sin pérdida y con pérdida.
- Formatos sin pérdida elimine la redundancia, identificando fragmentos del archivo que se repiten y reemplazándolos con descripciones más cortas. Esto le permite reconstruir el archivo original perfectamente más tarde, pero solo puede comprimir tanto los datos (consulte el enlace anterior para obtener una metáfora visual de cómo funcionan estos algoritmos).
- Formatos con pérdida son mucho más poderosos, pero vienen con importantes compensaciones. Los formatos con pérdida funcionan descartando parte de la información sobre el archivo original, para poder codificar el archivo en menos espacio. Estos algoritmos no pueden reconstruir con precisión el archivo original, pero están ajustados de tal manera que la información que se cae tiende a ser información que la gente no nota. Estos algoritmos pueden obtener una reducción espectacular en el tamaño del archivo con solo una pequeña caída en la calidad visual, y se utilizan para casi todo el audio, video e imágenes.
En general, esto es algo bueno: nos permite descargar contenido de mayor calidad mucho más rápido de lo que sería posible si estuviéramos atascados usando formatos sin pérdidas. Sin embargo, hay un lado oscuro en los formatos con pérdida, y se ve así:
Cuando vuelve a codificar un archivo en un formato con pérdida, los datos se pierden. La conversión de un formato con pérdida a otro formato con pérdida duplica el daño. El video anterior se generó mediante la conversión repetida entre dos formatos con pérdida cientos de veces. Al final, el hombre que habla se ha degradado en una pesadilla de color y ruido. Este proceso se llama decadencia generacional.
A medida que los archivos viajan por Internet, se copian y se hacen copias de seguridad, se mezclan y se vuelven a codificar, esta pérdida de datos se suma y los archivos pueden degradarse mucho. A medida que mejoramos las codificaciones con pérdida y los formatos de archivo menos eficientes caen en desgracia, las versiones originales se pueden perder para siempre.
Con suerte, los estudios de cine se preocupan lo suficiente como para mantener una versión codificada sin pérdidas de Cool Hand Luke y Twelve Angry Men a salvo en algún lugar, para que siempre tengamos versiones de alta calidad de esos archivos. Sin embargo, esto ciertamente no es cierto para la mayoría de los medios. Sus fotos digitales de bebés y videos caseros se deteriorarán lentamente a medida que los transcodifique de formatos obsoletos a formatos nuevos..
Lo mismo vale para el contenido en línea. Es probable que los originales de la mayoría de los videos de YouTube ya no existan. Cuando YouTube deje de existir y esos videos se migren a una nueva plataforma, todos recibirán un éxito de calidad del proceso de nueva codificación. Algunas generaciones de plataformas para compartir videos en el futuro, e incluso aquellos videos que siguen siendo lo suficientemente populares como para ser copiados de plataforma en plataforma se degradarán de manera inaceptable.
Vint Cerf, el principal evangelista de Internet de Google, ha hablado extensamente sobre los peligros de desechar toda esta información con tanta arrogancia como nosotros. Durante una entrevista, Cerf describió cómo en 2005, la historiadora Doris Goodwin escribió un libro sobre Abraham Lincoln, y estudió sus hábitos visitando bibliotecas de todo el país, desenterrando sus viejas cartas y reconstruyendo las conversaciones que encarnan. Cerf señala que hoy, “esas cartas serían correos electrónicos y las posibilidades de encontrarlas serán muy pequeñas dentro de 100 años.”
Este tipo de descomposición de datos representará un gran problema para los futuros historiadores. El siglo XXI bien puede convertirse en un agujero enorme en el registro histórico: una era oscura digital.
Podemos hacerlo mejor?
Una solución a este problema es desarrollar un almacenamiento de archivo que pueda durar mucho más tiempo con menos mantenimiento, de modo que sea más fácil archivar información a muy largo plazo. Varias personas inteligentes están trabajando en este problema, y hemos reunido los mejores datos disponibles sobre sus tecnologías..
Digamos que desea hacer una copia de seguridad de un archivo para De Verdad largo tiempo. ¿Cómo deberías hacerlo??
~ 50 años
Solución: cinta magnética
Si solo necesita almacenar sus datos durante algunas décadas a la vez, su mejor opción es probablemente una buena cinta magnética anticuada (del tipo utilizado por los departamentos de TI de todo el mundo). Almacenada bajo tierra en un ambiente frío, seco y con protección magnética, con un grado saludable de redundancia, la cinta magnética es relativamente estable en comparación con los CD o discos duros convencionales, y solo tres veces más costosa que los discos duros de gama baja (aproximadamente $ 3.0 por gigabyte).
~ 100 años
Solución: discos ópticos con calidad de archivo
Los CD convencionales son una forma terrible de almacenar datos: el respaldo de aluminio o plata comienza a oxidarse tan pronto como abre el paquete, y la baja calidad de construcción puede causar otros problemas. No espere que duren más de unos pocos años, horas, si los deja accidentalmente al sol. Sin embargo, algunos CD y DVD están hechos con un respaldo dorado y una calidad de construcción mucho mayor. El oro no se oxida, lo que significa que estos discos pueden durar mucho, mucho tiempo. Es difícil saber exactamente cuánto tiempo, porque no los hemos tenido durante mucho tiempo, pero podemos obtener una buena estimación tomando los discos, siendo realmente malos con ellos, y luego tratando de recuperar los datos: esto se llama acelerado test de envejecimiento.
Sobre la base de estas pruebas, los fabricantes afirman que su vida útil oscila entre 1 y 3 siglos. Para obtener la máxima densidad de datos, puede elegir Blue Rays de archivo por alrededor de 2.5 gigabytes por dólar, con una vida útil proyectada de 200 años. Las pruebas de envejecimiento acelerado no son seguras, pero probablemente sea seguro contar con ellas durante un siglo más o menos. Como beneficio adicional, a diferencia de la cinta magnética, no requieren un equipo especial para leer y escribir, por lo que los costos iniciales son mínimos.
~ 1000 años
Solución: Discos M
Ok, olvida eso “siglo” tonterías, pongámonos serios. Para darle una idea de la escala de tiempo, hace mil años, Earl Eric Haakonsson prohibió por primera vez a los berserkers en Noruega. Estos son los tipos grabados en una placa de bronce descubierta en el siglo XX:
Hasta hace poco, no había muchas buenas opciones industriales para este tipo de escala de tiempo. Sin embargo, recientemente, ha surgido una opción emocionante llamada 'M-disc'. Estos son DVD de archivo hechos de una gruesa capa de “como piedra” compuesto mineral que está diseñado para ser grabado por quemadores especiales (aunque pueden leerse en unidades de DVD normales). Estos son absurdamente robustos y se espera que sobrevivan durante al menos mil años. Esa es una afirmación ambiciosa, pero la compañía tiene una investigación sólida (incluido un estudio del Departamento de Defensa de EE. UU.) Para respaldarla.
Estos discos son incluso razonablemente baratos, a 5,7 gigabytes por dólar, aunque también necesitará una grabadora especial. Si está seriamente interesado en almacenar un mucho de datos durante mucho tiempo, los discos M son el claro ganador.
~ 10,000 años
Solución: grabado de metales extremadamente estables
Aquí es donde comenzamos a alejarnos un poco del camino trillado. A partir de ahora, no hay formatos legibles digitalmente que puedan sobrevivir en cualquier lugar cerca de diez mil años. Eso significa que cualquier información archivada para esta duración será muy difícil de recuperar. ¿Qué es la recuperación de datos y cómo funciona? ¿Qué es la recuperación de datos y cómo funciona? Si alguna vez experimentó una pérdida importante de datos, probablemente se haya preguntado acerca de la recuperación de datos: ¿cómo funciona? . De alguna manera, está bien: de todos modos, no es como si los lectores de DVD existieran en diez mil años.
Entonces, ¿cómo se almacenan los datos durante tanto tiempo? La respuesta es que los únicos materiales que pueden sobrevivir ese tipo de escalas temporales son los metales y las piedras preciosas químicamente estables. Esta tecnología ya se ha utilizado en la práctica para los registros Voyager: discos dorados, grabados con información que representa audio e imágenes, que se lanzaron a bordo de la sonda Voyager. La sonda está saliendo del sistema solar para proporcionar un registro duradero de la humanidad para que los extraterrestres algún día encuentren.
Una versión moderna del tema es la nano-litografía. Una compañía llamada Norsam ha adaptado técnicas de litografía desarrolladas originalmente para grabar semiconductores, y puede usarlas para grabar patrones finos en superficies como el diamante o el níquel. La resolución es decente (aproximadamente 165 gigabytes por disco de 12 céntimos), y también es prácticamente indestructible. Almacenados de forma segura, estos discos deberían durar muchos miles de años y pueden sobrevivir a EMP, la mayoría de los incendios y el colapso de la civilización humana. La información de precios no está fácilmente disponible, pero “costoso” es una muy buena suposición.
Una de las primeras aplicaciones de esta tecnología ha sido la creación de “Rosetta Stone” Placas, hechas de titanio, para almacenar en lugares seguros de todo el mundo, que contienen alrededor de miles de páginas de texto, traducidas entre muchos idiomas, para proporcionar una referencia para futuros historiadores si se pierden algunos idiomas modernos. Como beneficio adicional, los discos también se ven increíblemente geniales:
Más de 100,000 años
Seamos claros aquí: si está comprando almacenamiento de computadora y el titanio nanograbado es demasiado corto para usted, entonces su horizonte de planificación me aterroriza. Hace cien mil años, el hombre primitivo comenzó a aventurarse fuera del continente africano hacia Europa. Si realmente te importa asegurarte de que tus datos digitales sobrevivan así de lejos hacia el futuro, entonces te has alejado del conocimiento de los simples mortales, y probablemente también de la cordura y el buen sentido.
Lo que no quiere decir que no tienes opciones.
Solución: ADN fosilizado
Una de las ventajas de la revolución biotecnológica es que hay muchas compañías que crearán ADN personalizado para usted a partir de una serie de pares de bases que usted proporciona, en línea, por una tarifa marginal. Cada par de bases tiene cuatro combinaciones posibles, que pueden almacenar dos bits. Los datos pueden leerse luego secuenciando esos genes en una fecha posterior, usando una variedad de técnicas. Esto permite que el ADN sirva como una especie de almacenamiento de datos exóticos. Ahora, por sí solo, sus cadenas de ADN personalizadas son bastante cortas y se descomponen químicamente a temperatura ambiente en unos pocos años. Hay algunas formas de extender su vida útil..
Podría unir sus datos en el ADN de un organismo de larga vida, como el pino Bristlecone de la Gran Cuenca (que se sabe que vive más de cinco mil años). Debido a que estos árboles pueden reproducirse, su principal preocupación es mantenerlos a salvo de los numerosos incendios a gran escala, impactos de meteoritos y erupciones volcánicas que sucederán en el futuro. Es posible que pueda obtener sus datos para sobrevivir durante unas pocas decenas de miles de años plantando varios bosques de árboles de archivo en lugares seguros y remotos; pero, por supuesto, no te interesan papas tan pequeñas.
Para obtener realmente el valor de su dinero del almacenamiento de ADN, necesita reparar químicamente el ADN para protegerlo contra el cambio químico y la descomposición radiactiva. Los investigadores han encontrado una manera de incrustar el ADN en el vidrio fundido para crear un “fósil sintético” eso protegerá el ADN por períodos de tiempo extremadamente largos. El proceso se basa en la fosilización natural y se desarrolló después de la revelación de que a menudo es posible extraer ADN intacto de fósiles de millones de años. Con el uso adecuado de los códigos de corrección de errores y la redundancia, no hay razón para que no pueda conservar muchos gigabytes de información durante millones de años..
En términos de rentabilidad: si le preocupa el precio, este método de almacenamiento no es para usted. Este no es un proceso comercial de ninguna manera. Vas a gastar al menos cientos de miles de dólares para fabricar y preservar el ADN. Esta no es una empresa para los débiles de corazón. Aún así, es una opción, y si realmente desea asegurarse de que los datos más importantes en Internet todavía estén disponibles mucho después de que la humanidad haya muerto y desaparecido, está dentro de su poder hacerlo..
¿Te preocupa la era oscura digital?? ¿Qué datos quieres conservar para las generaciones futuras? La discusión comienza en los comentarios.!
Créditos de imagen: unidad USB rota a través de Shutterstock, “Berzerkers,” por Wikimedia, “Corte,” por M-Disc, “Rosetta,” por la Fundación Long Now, “CD arcoiris,” por Wikimedia, “Cinta magnética,” por Wikimedia, “Cápsula del tiempo,” por Wikimedia, “Voyager Record,” por Wikimedia, “Fósil,” por Wikimedia