Wired: как правильно архивировать цифровые файлы

Сможете ли вы открыть сегодняшние документы Word через 20 лет? Скорее всего, нет, если вы не предпримете необходимых мер для продления срока хранения этих цифровых файлов.

Автор: Джастин Пот

Первоначальное предложение по созданию Всемирной паутины, написанное Тимом Бернерсом-Ли в 1989 году, является важной частью истории интернета. Его также нельзя открыть на современных компьютерах.

Джон Грэм-Камминг, британский инженер-программист и писатель, попытался открыть документ Word, содержащий это предложение. Современные версии Microsoft Word и Apple Pages не смогли открыть файл, о чем он написал в своем блоге. Открытый текстовый процессор LibreOffice справился, хотя и с неаккуратным форматированием. В конце концов Грэм-Камминг нашел PDF-файл, экспортированный ЦЕРН в 1998 году, и это был единственный способ увидеть документ в том виде, в котором он существовал в 1989 году.

Очень тревожно, что такой важный исторический документ в таком распространенном формате может быть почти полностью утрачен из-за течения времени и обновления программного обеспечения. Любой человек, у которого есть коллекция старых цифровых документов, фотографий и видео, может задаться вопросом, не произойдет ли то же самое с его файлами — как выяснилось, с такими вопросами постоянно сталкиваются цифровые архивисты. Поэтому я обратился к одному из них.

«Двадцать лет в цифровой сфере — это очень много» — говорит Лэнс Стачелл, директор службы цифровой сохранности Мичиганского университета. Его команде часто приходится восстанавливать цифровые файлы со старых компьютеров и носителей. «У нас есть лаборатория, которая может работать со старыми носителями — дискетами, компакт-дисками, старыми компьютерами. Мы можем снять их с этих типов носителей и перенести в нашу систему хранения, не испортив их при этом».

Но извлечь файлы с диска — это только первый шаг: Затем их нужно сохранить в таком состоянии, чтобы их можно было открыть в течение следующих десятилетий. Эта работа дала Стачеллу повод задуматься о стратегиях, позволяющих сохранить документы как можно дольше. Я спросил его, что нужно делать тем из нас, кто не является профессиональным архивистом, чтобы сохранить самое ценное.

Используйте открытые форматы

Документ Word, о котором я уже говорил, больше нельзя открыть в Microsoft Word, потому что программное обеспечение со временем изменилось. Это часть проблемы архивирования цифровых файлов.

«Чем реже вы смотрите на физические вещи, тем дольше они хранятся», — говорит Стачелл. «С цифровыми вещами мы постоянно боремся с устареванием. По мере того как файл движется во времени, он теряет информацию».

Обновления программного обеспечения, например Microsoft Word, приводят к тому, что файлы, которые прекрасно открывались в 80-х годах, не открываются в 2020-х. Часть проблемы заключается в том, что Microsoft, и только Microsoft, контролирует формат файлов или даже знает, как он работает. По этой причине Стачелл советует людям экспортировать файлы в открытый формат — особенно файлы, которые они хотят сохранить доступными в течение длительного времени.

Для документов он рекомендует использовать PDF/A — открытый стандарт, созданный на основе формата Adobe PDF, который включает в себя все необходимое для открытия файла, в том числе шрифты, используемые в документе. Microsoft Office, LibreOffice и Adobe Acrobat поддерживают экспорт в PDF/A, поэтому создать такой файл довольно просто. Стачелл рекомендует архивировать все документы, которые вы хотите сохранить, в этот формат.

«PDF/A — это открытый стандарт» — говорит Стачелл. Этот принцип может применяться ко всем вашим документам. Электронная таблица Excel, которая прекрасно открывается сейчас, может не открыться через 20 лет, но если вы экспортируете эту таблицу в файл CSV, который по сути является просто текстовым документом, понятным другим приложениям для работы с электронными таблицами, вы можете быть уверены, что этот файл можно будет открыть еще несколько десятилетий.

В общем, если файл на вашем компьютере может быть открыт только определенным программным обеспечением, и это программное обеспечение контролируется одной компанией, вам, вероятно, следует экспортировать его в открытый формат. Это единственный способ защитить его в будущем.

Сохраняйте актуальность версий фотографий и видео

По словам Стачелла, когда речь идет о фотографиях, беспокоиться нужно гораздо меньше, потому что мы уже давно используем одни и те же форматы файлов — JPEG, PNG и TIFF. Все эти типы файлов — открытые форматы, которые можно открывать с помощью самых разных программ.

Но это не значит, что все ваши фотографии защищены от будущего. Например, если вы часто редактируете фотографии, то со временем качество может снизиться.

«JPEG — это не плохо, просто каждый раз, когда вы редактируете и сохраняете снимок, он теряет немного информации» — говорит Стачелл. Этот эффект называется потерей поколения. «Одно или два редактирования не будут заметны, но имейте это в виду: если вы собираетесь часто редактировать фотографию, делайте каждый раз копию и редактируйте ее».

Не забывайте, что некоторые фотографии, особенно RAW-файлы с вашей камеры, могут быть записаны в собственном формате.

«Нужно быть осторожным, потому что многие камеры по умолчанию используют свою собственную версию RAW, которая является очень проприетарной», — говорит Стачелл. Он рекомендует экспортировать такие фотографии в открытый формат Digital Negative (DNG), который является более безопасным форматом для сохранения RAW-файлов.

Видео также не представляет особой проблемы — большинство видеофайлов сейчас кодируются с помощью открытых форматов. Но, как и в случае с фотографиями, Стачелл советует не пытаться редактировать видеофайл несколько раз. Вместо этого просто отредактируйте копию.

«В этом и заключается преимущество цифровых технологий: вы можете сделать миллион копий» — говорит Стачелл.

Делайте резервные копии абсолютно всего

Конвертируя все ценные файлы в открытые форматы, вы не получите абсолютно никаких преимуществ, если эти файлы будут утеряны. Именно поэтому Стачелл неоднократно подчеркивает важность резервного копирования файлов. В идеале у вас должно быть три копии каждого файла, и одна из этих копий должна храниться за пределами сайта. Он упомянул сервисы автоматического резервного копирования Backblaze и Crashplan как хорошие инструменты для этой работы; мы рекомендуем сочетать Backblaze с локальным резервным копированием.

Конкретная система резервного копирования не имеет такого большого значения, как наличие определенной стратегии резервного копирования.

Оригинал: Wired

Похожие Записи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Последние <span>истории</span>

Поиск описаний функциональности, введя ключевое слово и нажмите enter, чтобы начать поиск.