Те, кто хотели бы протестировать Hadoop, но не имеют свободного кластера для этого, могут попробовать платформу обработки данных на офисном компьютере благодаря системе Sandbox, выпущенной компанией Hortonworks. Это одноузловая реализация Hadoop, основанная на дистрибутиве Hortonworks Data Platform. Упакованная в виртуальную машину, она включает в себя все стандартные компоненты среды Hadoop, в том числе подсистему управления хранением HCatalog, хранилище данных Hive и набор аналитических инструментов Pig. В состав Sandbox входит набор руководств, обучающих выполнению аналитических задач в Hadoop. Предоставляется доступ к пробным онлайн-наборам данных для тестирования функций платформы.
Среда Hadoop может оказаться сложной в освоении для новых пользователей. Платформа требует большого объема работы по установке и конфигурированию. Помимо инсталляции самой платформы и виртуальной машины Java нужно установить файловую систему и создать пользовательскую учетную запись. В виртуальной машине Sandbox, основанной на CentOS Linux, платформа уже установлена и настроена. Наряду с Sandbox инженеры Hortonworks поработали над новой версией дистрибутива Hadoop — Hortonworks Data Platform 1.2 содержит новые инструменты управления и безопасности.