Поскольку бизнес-пользователи все чаще обращают свои взоры на высокопроизводительные вычислительные системы, в IBM решили расширить спектр возможностей своей файловой системы для параллельных архитектур, чтобы сделать суперкомпьютеры доступнее для более широкого круга потребителей.
Корпорация планирует выпустить новую версию своего программного продукта General Parallel File System (GPFS), наделенного более совершенными функциями управления файлами. Как подчеркнул вице-президент по маркетингу и стратегии подразделения IBM Power Systems Скотт Хенди, GPFS позволяет вести поиск в различных файловых системах, анализируя параллельно до тысячи узлов.
В рамках масштабного тестирования, по словам Хенди, в IBM выполнили сканирование 1 млрд. файлов с помощью GPFS, чтобы продемонстрировать возможность применения этой файловой системы в таких областях, как финансы и розничная торговля, где приходится обрабатывать большое количество неструктурированных файлов. На выполнение сканирования потребовалось чуть более двух с половиной часов, и сейчас инженеры IBM работают над тем, чтобы сократить это время до одного часа.
Модернизация GPFS (сейчас это версия 3.2) включает в себя функции управления файлами на базе политик, что даст пользователю возможность сообщить системе, как хранить или искать файлы. Например, можно будет указать, что файлы, сохраненные в определенном формате, должны размещаться на диске конкретного типа. По словам Хенди, это означает, что GPGS автоматизирует иерархический подход к распределению данных. Пользователь может описать политику, согласно которой система должна сохранять данные определенного типа на самом быстром и дорогом диске, а другие — отправлять в более дешевые системы хранения, где производительность не играет особой роли. Такая возможность позволит сэкономить, поскольку в определенных ситуациях можно будет использовать более дешевые системы хранения.
Можно также установить такой режим хранения, когда файлы, к которым не обращались, скажем 30 дней, будут переноситься на менее дорогостоящую систему. Кроме того, IBM добавила в новую версию системы возможности управления, ориентированные на работу в кластерных конфигурациях.