Я никак не возьму в толк, почему многие компании по-прежнему позволяют сотрудникам хранить ценную, иногда критически важную информацию в плохо защищенных, небезопасных файлах, к тому же невидимых для остальных. Уже всеми признано, что использование файлов PST приводит к большим проблемам в организациях, сотрудникам которых приходится соблюдать особые требования юридических норм и регламентирующих органов. И тем не менее руководители информационных подразделений и предприятий продолжают санкционировать их использование, в то время как формат PST давно устарел. Существуют более современные методы, обеспечивающие безопасное хранение и надежный доступ к информации. Почему же в таком большом числе организаций, работающих с данными Exchange, по-прежнему продолжается эта порочная практика?
Я подозреваю, что корень зла — в инерции. Формат PST существует уже около 20 лет, и он стал частью ИТ-пейзажа. Эти файлы воспринимаются как не несущие угрозы; ну как же, есть задачи с более высоким приоритетом. Нужно развертывать новые системы, устанавливать новые приложения, осваивать новые мобильные устройства. И вот при нашем попустительстве требования нормативных актов отходят на второй план, а ценные данные подвергаются неоправданным рискам.
Я призываю членов сообщества пользователей Exchange: давайте в сжатые сроки избавимся от файлов PST! Не прямо сейчас, это невозможно, а, скажем, в течение двух следующих лет. Давайте разделаемся с этим рудиментом технологий вчерашнего дня и перенесем данные, хранящиеся в файлах PST, в общедоступные репозитории. Тем самым мы перейдем к использованию новейших технологий в сфере «облачных» и локальных вычислений. И хватит уже ссылаться на то, что файлы PST выступают в качестве универсального средства хранения данных, это не так. Упомянутые файлы следует использовать для передачи информации только в тех случаях, когда нет возможности применять другие разумные методы, скажем, при предоставлении данных внешним экспертам, которые ведут расследование после электронного обнаружения документов, связанных с определенным судебным процессом.
История и дополнительные сведения
Технология PST использует фирменный файловый формат Microsoft, разработанный для обеспечения хранения объектов электронной почты (сообщений, задач, элементов календаря и т. д.), а также вложений в локальных репозиториях. Первоначально файлы PST называли персональными таблицами хранения (personal storage tables), чтобы отличать их от таблиц из серверных сетевых баз данных Exchange. Теперь же эта аббревиатура часто используется для обозначения персональных файлов хранения (personal storage files) или персональных папок (personal folders). Формат PST подобен формату OST (offline storage table или offline storage file), применяемому настольными клиентами Outlook для синхронизации подчиненных копий сетевых папок в целях использования в локальном контексте.
В последнее время файлы PST часто становились объектом всеобщего внимания, и тому есть множество причин. Начну с позитивного: с выходом в свет разработанной специалистами Microsoft службы импорта Office 365 Import Service пользователи платформы Office 365 получают возможность с легкостью перемещать данные в электронные или архивные почтовые ящики. С другой стороны, следует упомянуть о скандале, разыгравшемся в ноябре 2014 года в корпорации Sony, когда хакеры взломали ИТ-системы компании и получили доступ к данным, в том числе 179 файлам PST, после чего были обнародованы подробности ряда конфиденциальных дискуссий. Хакеры передали журналистам порядка 73 тыс. сообщений, поступивших на имя председателя совета директоров Sony Эми Паскаль. Убытки, причиненные компании в результате данного инцидента, оцениваются примерно в 15 млн долл.
Всякий, кому доведется заглянуть в электронный репозиторий информации, извлеченной из файлов PST корпорации Sony, может себе представить, что произойдет, если будут обнародованы аналогичные данные, касающиеся его компании.
Возникает вопрос: почему же все эти огромные объемы конфиденциальных данных хранятся в файлах, которые в самом деле плохо защищены и часто дают сбои? Файлы PST можно защищать с помощью паролей, но достаточно запустить поисковик, и вы найдете в Интернете множество утилит, обеспечивающих вскрытие этих файлов за несколько секунд. А когда с файла PST снята защита, его можно открыть с помощью любого клиента Outlook. Это важное обстоятельство, не известное многим сотрудникам, которые доверяют файлам PST конфиденциальные данные.
Необходимость во введении формата PST стала очевидной вскоре после выпуска корпорацией Microsoft первой версии сервера Exchange в 1996 году. До тех пор средний размер электронного послания был небольшим (порядка 2 Кбайт для одного текста формата ASCII). Но по мере роста популярности электронной почты, ставшей одним из каналов внутрикорпоративного общения, объемы электронных писем стали быстро расти, особенно когда появилась возможность дополнять их вложениями в различных форматах, и относительно скромные квоты на объемы электронной почты, выделяемые пользователям (часто в пределах от 20 до 50 Мбайт), быстро исчерпывались. В результате служащим приходилось удалять электронные письма, чтобы освобождать пространство для размещения новых.
Обработка первых файлов PST обеспечивалась исходной версией клиента Exchange (средством просмотра). Однако с появлением пакета Outlook 97, взаимодействовавшего с системами Exchange 5.0 и 5.5, эти файлы стали применяться все чаще и все большим количеством сотрудников — в значительной степени благодаря тому, что пользователь мог теперь сам управлять хранением электронных писем и в этом отношении не зависел от администратора сервера. В то время почтовые системы, такие как Lotus cc: Mail, Microsoft Mail и Lotus Notes, часто подключались к локальным хранилищам данных. Формат PST давал пользователям возможность перемещать почтовые отправления из своих электронных почтовых ящиков в «персональные хранилища» и таким образом высвобождать пространство в почтовых ящиках, не прибегая к такому средству, как необратимое удаление электронных посланий. Кроме того, реализованная в программе Outlook функция архивирования автоматически выявляла старые письма и перемещала их в файлы PST, с тем чтобы объем содержимого почтового ящика никогда не приближался к заданному квотой пороговому значению. Наряду с этим файлы PST использовались в программе Outlook для получения новых писем. Некоторые пользователи применяли эту функцию в случаях, когда администраторы выделяли им невообразимо малые квоты на объем электронной почты.
Проблемы с файлами PST
Первоначально в этих файлах использовался формат ANSI, а по объему они не могли превышать 2 Гбайт. Однако пользователи не проявляли осмотрительности и позволяли своим файлам PST достигать столь внушительных размеров, что те неизменно получали повреждения, приближаясь к порогу в 2 Гбайт.
Попытки решить проблемы с файловой структурой и надежностью были предприняты с введением PST-формата Unicode, то есть с выходом пакета Outlook 2003 и более поздних версий. Первоначально новый формат предусматривал ограничения объема почтовых поступлений в 20 Гбайт, но в клиенте Outlook 2010 и более новых версиях этот показатель был увеличен до 50 Гбайт. Ограничение можно смягчить, изменив настройки реестра, что может привести к появлению очень громоздких файлов PST. Объем самого крупного из известных мне файлов составляет порядка 62 Гбайт. Он состоит из более чем 123 тыс. элементов. Размеры этого монстра превышают объем обычного почтового ящика Office 365 (50 Гбайт), так что его просто невозможно втиснуть в такой почтовый ящик. Однако этот файл можно переместить в электронный архив, который, вероятно, представляет собой более подходящее вместилище для данных PST.
Хотя после перехода на PST в формате Unicode число повреждений файлов сократилось по сравнению с уровнем того периода, когда в ходу был формат ANSI, старое изречение о нецелесообразности хранения всех яиц в одной корзине по-прежнему актуально применительно к файлам PST. Если вы не можете обойтись без файлов PST, распределяйте свои данные по нескольким файлам, дабы ограничить ущерб от одного повреждения.
Структура файлов PST не засекречена. Она полностью документирована специалистами Microsoft, с тем чтобы разработчики независимых программных продуктов имели возможность создавать инструментальные средства, способные использовать формат PST. Во многих случаях назначение этих инструментов состоит в том, чтобы помочь организациям осуществлять управление файлами PST с помощью следующих мероприятий.
- Выявление существования файлов PST на жестких дисках пользовательских компьютеров (часто для осуществления этого процесса необходимо запускать на соответствующем компьютере тот или иной программный агент), а также на других носителях, таких как сетевые файловые ресурсы (где файлы PST не должны храниться ни в коем случае).
- Автоматическое разрешение проблем внутри файлов PST (к примеру, посредством запуска утилиты SCANPST в автоматическом, но более «интеллектуальном» режиме, поскольку данная утилита не пытается ни исправлять поврежденные элементы посредством модификации свойств MAPI поврежденных элементов, ни применять к ним другие методы коррекции, а просто удаляет поврежденные элементы). Просто удивительно, как много поврежденных элементов содержится в файлах PST; в первую очередь я имею в виду элементы, созданные старыми версиями клиентов Outlook или дополнительными компонентами для этих клиентов, которые не соответствуют требованиям, предъявляемым сегодня к программному обеспечению. Зачастую пользователи не отдают себе отчета в том, что повреждения существуют, поскольку они даже не пытаются обратиться к поврежденным элементам.
- Дешифровка содержимого файлов PST для облегчения помещения этих файлов в электронные репозитории.
- Исключение дублирующих компонентов внутри файлов PST. Без сомнения, в любом наборе таких файлов, извлеченных из корпоративных компьютеров, содержится множество дублирующих элементов. Можно, конечно, проигнорировать этот шаг и импортировать все данные в Exchange, но лучше начать с выявления дубликатов и их удаления, ибо таким образом мы ускоряем процесс заполнения хранилищ и сокращаем общие затраты на реализацию проекта. Кроме того, наличие дублирующих копий документов и других источников, разбросанных по различным подразделениям организации, значительно затрудняет поддержание окончательных версий, что может стать неразрешимой проблемой, когда дело касается проектов документов, официальных соглашений или других файлов, которые являются продуктом совместной работы.
- Экспорт данных из файлов PST в электронные хранилища.
Разумеется, для того чтобы крупные организации могли обрести контроль над хранящимися в них данными, требуется провести большую работу. Но, избавившись от формата PST, мы сможем добиться таких результатов, как повышение уровня соответствия установленным законом требованиям, рост эффективности (более производительные процессы поиска и доступа к информации), а также сокращение затрат (на хранение данных).
Настало время перемен
Когда-то потребность в использовании формата PST была продиктована важными обстоятельствами. Квоты на дисковое пространство для хранения почты были поистине удушающими, а средства сетевого доступа — примитивными по сравнению с нынешними, когда модель постоянного подключения получила широкое распространение. Иначе говоря, раньше стратегия локального хранения данных была вполне обоснованной. Но ситуация изменилась. Вместимость среднестатистического корпоративного почтового ящика резко возросла, и сейчас в таком ящике можно размещать от 5 до 10 Гбайт данных, а в «облачных» службах, таких как Office 365, планка поднята еще выше: по умолчанию квота на хранение почтовых отправлений составляет 50 Гбайт. Кроме того, в версии Exchange 2010 появились архивные почтовые ящики; с их помощью пользователи могут обеспечить хранение элементов, которые не следует удалять в течение длительного времени и в то же время можно не хранить в основном почтовом ящике. Я считаю архивные почтовые ящики более интеллектуальной и безопасной сетевой версией PST, причем версией, работы по обслуживанию которой не ложатся на плечи пользователей. Сегодня вместимость архивных почтовых ящиков возросла настолько, что они стали практически «безразмерными» после реализации цепочек из 50-гигабайтных звеньев, составляющих единый логический почтовый ящик. Эта структура, поддерживаемая как на платформе Office 365, так и в системе Exchange 2016 (продукт ближайшего будущего), позволит пользователям хранить в сетевых ресурсах все данные, ныне содержащиеся в файлах PST.
Справедливо и то, что доступность сетей по всему миру возросла настолько, что доступ к ресурсам Интернета стал сегодня нормой. И как бы то ни было, неофициальные данные, да и мой личный опыт свидетельствуют о том, что подавляющее большинство элементов, перенесенных в файлы PST, пребывают там в состоянии «блестящей изоляции» и в дальнейшем никак не используются, так что их вполне можно переносить в электронный архив.
Исследуя резонансные дела, такие как взлом архивов Sony, нетрудно ответить на вопрос, почему компании рассматривают проблему использования файлов PST. Адресованные организациям требования соблюдать положения самых разных законодательных норм и регламентов регулирующих органов за последнее десятилетие невероятно ужесточились. Файлы PST появились в то время, когда потребность компаний в отслеживании и сохранении электронных посланий была не столь острой, как сейчас. Так вот, если та или иная компания будет по-прежнему позволять своим пользователям работать с файлами PST и даже сохранять в них сообщения о «делах давно минувших дней», могут возникать ситуации, приводящие к невыполнению той или иной регламентирующей нормы (которая, к примеру, может определять срок хранения сообщений, касающихся определенной темы, равным шести годам). Другая потенциальная проблема — невозможность оспаривать иски от недовольных служащих или же сохранять контроль над интеллектуальной собственностью вследствие отсутствия доказательств того, что та или иная идея или концепция возникла в определенное время.
Коммерческие предприятия стараются обеспечить более четкое выполнение установленных законом требований. Но, кроме того, компании, вложившие немало средств в технологию виртуальных рабочих столов VDI, часто стремятся отказаться от использования файлов PST, потому что персональные файлы такого рода обычно несовместимы с совместно используемой инфраструктурой, применяемой в соответствии с VDI. В роли катализаторов процесса отказа от формата PST могут выступать и проекты по обновлению настольных систем. Логика здесь простая: новые аппаратные и программные версии Microsoft Office должны повлечь за собой укрепление новых рабочих привычек, так что долой файлы PST!
Выгоды от ликвидации формата PST
Реализация стратегии отказа от использования файлов PST в рамках организации часто бывает связана с большими затратами времени. В этом случае качественное управление проектами совершенно необходимо, как и руководство со стороны администраторов. Но организации, успешно решающие задачу отказа от использования формата PST, могут с большой выгодой для себя воспользоваться достижениями специалистов Microsoft, которые на протяжении последних пяти лет оснастили «облачные» и локальные продукты Exchange средствами обеспечения соответствия установленным законом требованиям и высокой доступности. В числе получаемых преимуществ можно назвать следующие.
- Повышается уровень защиты данных, поскольку эта задача решается с помощью средств высокой доступности Exchange, и целостность данных не зависит от сбоев, которые могут произойти на локальном жестком диске.
- Данные индексируются и могут быть обнаружены надежными средствами поиска на базе серверов.
- Данные доступны функциям, обеспечивающим соответствие установленным законом требованиям, таким как хранение на месте и хранение по судебному предписанию. В случае необходимости возможно даже удаление ненадлежащих или конфиденциальных сведений из почтовых ящиков пользователей с помощью таких команд, как Search-Mailbox. Пользователи Office 365 могут обнаруживать в почтовых ящиках и извлекать из них данные с помощью процедур поиска в соответствии с требованиями регламентирующих органов.
- Данные доступны не только с определенного компьютера, но и из настольных приложений, веб-клиентов и с мобильных устройств.
- В случае увольнения сотрудника его рабочие данные могут быть переданы кому-то из коллег. Платформа Office 365 позволяет переносить содержимое старого почтового ящика в целевой ящик, предварительно деактивировав старый почтовый ящик. В локальных версиях Exchange допускается совместное использование содержимого старого почтового ящика, предоставление прав собственности на него новому пользователю, а также предоставление последнему права переносить любые данные в свой почтовый ящик.
Руководителям информационных подразделений, а также руководителям предприятий следует позаботиться о восстановлении данных из файлов PST, которые подлежат надзору со стороны регулирующих инстанций, а также о предоставлении доступа к этим данным со стороны функций, обеспечивающих соответствие установленным законом требованиям. Как и в случае со скандалом вокруг взлома файлов в корпорации Sony, утечка данных по причине незащищенности файлов PST может иметь катастрофические последствия для репутации компании, а также для ее отношений с партнерами, и об этом должны постоянно помнить администраторы высшего звена.
Разумеется, с определенной точки зрения отказ от использования файлов PST дает преимущества не столько конечным пользователям, сколько организации в целом. Но справедливо и другое утверждение: поскольку пользователям не приходится больше заниматься управлением данными в формате PST, в выигрыше оказываются и они. Все данные размещаются в сети и все данные доступны пользователям, с каким бы устройством они ни работали. Разъяснение причин необходимости захвата и замены информации в формате PST — важная составляющая любого проекта, целью которого является импорт данных PST в сетевое хранилище.
Средства ликвидации
После того как в июне 2015 года я написал о средствах управления файлами PST, ко мне стали обращаться пользователи с просьбой порекомендовать инструменты, которые помогли бы им поставить данные PST под свой контроль. Ответы на подобные просьбы я неизменно начинал с упоминания разработанного Microsoft бесплатного средства PST Capture, а затем задавал своим корреспондентам вопросы о том, какое время они выделяют для реализации этого проекта, насколько эффективным он должен быть по их замыслу и какие средства выделяются на достижение поставленных целей. Собирать файлы PST и включать их в электронные почтовые ящики (или в архивы) можно с помощью утилиты PST Capture в сочетании со службой Office 365 Import service. Таким образом мы получаем некие базовые показатели для оценки эффективности других решений.
Не будем забывать, что служба Office 365 Import Service еще не везде стала общедоступной, и потому не может быть подходящим решением для ряда компаний, особенно за пределами США. Кроме того, хотя корпорация Microsoft при тестировании не взимала платы за пользование этой службой, плата будет взиматься после того, как Import Service станет общедоступным продуктом.
Пользователи, планирующие по-прежнему работать с локальными версиями программного обеспечения, смогут обрабатывать запросы почтовых ящиков на импорт, а также перемещать данные PST в сетевые почтовые ящики и в архивы с помощью службы репликации почтовых ящиков Mailbox Replication Service (MRS). Эта служба реализована в версиях Exchange 2010, Exchange 2013 и Exchange 2016. В фоновом режиме служба Office 365 Import Service использует MRS для обработки файлов PST, когда эти файлы указаны для обработки службой.
Для осуществления любого проекта по ликвидации файлов PST требуется некоторое время. Бесплатно распространяемые средства Microsoft заслуживают высокой оценки именно по причине бесплатности. Но если вам нужно получить хорошие результаты при их использовании, администраторам придется затратить больше времени, особенно в случаях, когда бывает необходимо увеличивать число почтовых ящиков или когда приходится иметь дело с файлами PST, сформированными еще в прошлом веке. Существует другой путь: приобрести специализированное программное обеспечение, которое обеспечивает автоматизацию и упрощение процедур выявления данных в формате PST, сбор файлов, исправление поврежденных данных, удаление дубликатов, а также перемещение данных в электронные почтовые ящики и в архивы. Это хорошая стратегия, если вы располагаете достаточными средствами. Попросите поставщиков предоставить вам копии своих продуктов и опробуйте эту программу на репрезентативном наборе данных из файлов PST. Так вы получите представление о том, какой продукт больше всего подходит для ваших целей.
Когда вы примете решение о том, чтобы избавиться от файлов PST и начнете работы по поиску и перемещению содержащихся в этих файлах данных в более подходящее хранилище, обеспечьте установку настроек объекта групповой политики Group Policy Object (GPO) с целью лишить пользователей возможности создавать новые файлы PST и работать с ними.
Я полагаю, что в процессе оценки качества программных продуктов многие упускают из виду такой ее аспект, как оценка качества технической поддержки. Задайте поставщикам сложную задачу (скажем, пусть покажут, как обработать некие сильно поврежденные данные PST) и посмотрите на их реакцию. Вы получите представление о том, как они могут реагировать на проблемы, с которыми вам, возможно, придется столкнуться в ходе реализации проекта. В дополнение к этому поставьте во главе проекта сильную команду менеджеров, и вы уже будете на пути к успеху.
Призыв к действию
Файлы PST небезопасны, подвержены повреждениям и несовременны. Нет никакого оправдания их применению в качестве универсального контейнера для пользовательских данных. Давайте развернем проект по ликвидации файлов PST и завершим его в сжатые сроки. На мой взгляд, чем раньше мы это сделаем, тем лучше!